论文部分内容阅读
染色质结构与功能的动态调控已成为后基因组时代生命科学研究的一个重要科学前沿。大量研究发现CTCF参与建立复杂而有序的染色质远距离相互作用,在染色质高级拓扑结构的动态可塑性中发挥重要功能。人类基因组包含约55000-65000个CTCF结合位点,虽然通过ChIP-seq的方法已找到了CTCF结合的保守motif,但是要理解数量众多的CTCF结合位点的差异性和动态性,更精确的CTCF-CBS(CTCF Binding Site)特异性相互作用的分子机制还有待阐明。我们以Pcdh基因为模型,解析了5个CTCF-CBS晶体结构,揭示了ZF3、ZFs4-7和ZFs9-11分别识别module4、modules2-3和module1的机理,阐述了CTCF的锌指结构域以协同的方式方向性识别Pcdh CBSs的机制。 其中,ZFs4-7缠绕于DNA大沟中通过氢键特异性识别modules2-3的碱基,而碱基A24与Gln418形成两个稳定的氢键,对于modules2-3方向性的识别具有重要意义。高度保守的位点也大多与残基形成两个氢键,这种较强的相互作用是高保守性的保证。同时发现CTCF缺少与21-13位和26-27位碱基的特异相互作用或作用较弱,且R448侧链存在双构象,部分解释了CTCF识别人类基因组中多样性序列的机理。ZF3的Arg339位与Module中431位和30位碱基相互作用,进一步增强CTCF的方向性识别。再者,ZFs9-11特异性的识别Module1,也与上述锌指结构域协同加强了CTCF结合的亲和力和方向性,其中ZF11对于Module1的结合具有决定性作用。而ZF8作为桥梁连接了module1和module2的识别,与DNA平行排列而没有碱基特异性相互作用,使module1和module2之间的连接序列长度可以发生变化,为CTCF位点的多样性做出重要贡献。最后我们拼接出了ZFs3-11识别含modules1-4的CBSs的总体模型。 总之我们揭示了CTCF序列选择性的分子基础,回答了这一染色质高级结构决定中的一个重要问题,为理解染色质高级结构的建立、维持及动态变化提供了重要的基础。也为其它多锌指结构域串联的蛋白识别DNA提供了重要的参考。