论文部分内容阅读
在细菌和古菌中,基因组中的CRISPR(规律成簇的间隔重复序列)位点和相关的Cas蛋白共同组成了CRISPR-Cas获得性免疫系统系统,利用该系统原核生物可以有效抵御来自噬菌体和质粒的外源核酸的入侵。CRISPR-Cas系统主要分为三个阶段来发挥功能,第一阶段为spacer序列的获取阶段即从外源核酸上获取片段并整合到CRISPR位点上;第二阶段为crRNA(CRISPR RNA)的表达阶段即CRISPR位点发生转录并被加工成为crRNA;第三阶段为干扰阶段,在此过程中crRNA会和多个Cas蛋白结合形成巨大的crRNP复合物,特异性地识别并且降解目标DNA序列,从而起到防御作用。 在I-E亚型CRISPR/Cas系统中,相关的Cas蛋白包括Cas1、Cas2、CasA、CasB、CasC、CasD、CasE和Cas3,其中由5种蛋白(11个亚基,CasA1B2C6D1E1)以及crRNA一起组装形成了Cascade复合物,一方面负责识别并结合入侵的核酸,另一方面负责招募Cas3降解目标序列,因此在CRISPR-Cas系统的免疫保护机制中发挥着核心作用。 在本课题中,利用X射线晶体学的研究方法,我们对大肠杆菌Cascade复合物Cascade开展结构生物学研究,首先利用共表达和共纯化的方法得到了纯度和均一性较好的Cascade复合物,然后经过反复筛选和优化,生长出了复合物晶体,收集到高质量的衍射数据,最后利用已知的冷冻电镜结构进行分子置换,解析了Cascade复合物分辨率约为3(A)的晶体结构。总体上看,Cascade复合物呈现“海马”形状的结构,11个亚基形成了有序的双层结构,6个CasC拷贝和CasE以及CasD一起形成了外层结构,而CasA和2个CasB则构成了内层结构。借助于高质量的电子密度,我们能够清晰地识别crRNA的每一个核苷酸并在此基础上分析了crRNA和Cas蛋白的相互作用机制。首先,crRNA的3端repeat序列形成stem-loop结构并紧密结合在CasE上的正电荷区域,而在另一侧,crRNA的3端repeat区域呈现出“弯钩”的形状并结合在由CasA、CasC6和CasD形成的“口袋”中。在两端repeat序列的中间是crRNA的spacer序列,共有32个核苷酸构成。有趣的是,spacer序列的碱基互相之间并非连续堆积,其中第6、12、18、24、30位核苷酸碱基向内翻转,并且和来自CasC2-CasC6上的五段β-hairpin loop结构发生相互作用从而稳定在此构象,因此这几位核苷酸将不再参与和目标DNA的识别和配对。随后的生化实验中发现突变这几位核苷酸对于Cascade和目标DNA的亲和力没有明显的影响从而证实了结构中的发现。 总结起来,上述研究揭示了Cascade复合物自身组装以及结合目标DNA的分子机制。从这些结果中可以看到,crRNA的作用不仅是识别和结合目标DNA,它在Cascade复合物的组装和构成中也发挥着重要的作用。另外来自不同Cas蛋白的β-hairpin loop结构作为一种独特的功能元件在crRNA spacer结构的稳定、CasC螺旋的形成以及CasA-CasD、CasA-CasC和CasB-CasC之间的相互作用中均起到了关键的作用。