论文部分内容阅读
基因调控对细胞的正常生理过程和基因组复杂度有非常重要的作用。在这些调控机制中,可变剪切(altemative splicing)可以在不同的生理条件下从同一个基因编码出不同的蛋白,而无义介导的mRNA降解(nonsense-mediated mRNAdecay,NMD)可以监控细胞中的mRNA,并且清除细胞中带有提前终止密码子(premature termination codon,PTC)的转录本。这两个机制在前人的实验中已被深入研究,但在基因组水平和物种进化过程中的作用还未有系统的研究。随着基因组技术的不断进步和高通量数据的涌现,系统地研究这些通路成为可能。本工作在基因组尺度对可变剪切和无义介导的mRNA降解通路做了研究。
新基因的产生对物种新功能和基因组复杂度有重要贡献,因而新基因的起源问题一直备受关注。以前的研究已经提出了几种新基因结构产生的机制。本文研究了另一种新基因结构产生的方式:基因复制后剪切结构的改变。我们从影响剪切的两类序列元件入手,外显子增强子(exonic splicing enhancer,ESE)和减弱子(exonic splicing silencer,ESS)。结果显示随时间增加这些序列元件在同源外显子之间的差异越来越大,而且在基因复制后ESE总体上是逐渐丢失的,而ESS在复制产生的两个同源外显子中分别丢失和获得。进一步的研究显示ESE和ESS的改变主要是同义突变引起的,这说明主要是剪切而不是蛋白序列引起了这些改变。最重要的是这些差异导致了外显子剪切状态也发生了改变(由可变剪切转变为组成性剪切(constitutive splicing)外显子,或者相反),并且发生改变的外显子比例随着进化时间也不断增加。结合前人的研究,我们的结果揭示基因复制后剪切序列元件的改变可以导致剪切结构改变,而剪切结构的改变也会引起基因表达和功能的改变,这种方式也可以作为一种新基因结构产生的途径。
在第二部分,我们研究了细胞中监控带有提前终止密码子(PTC)转录本的重要通路,无义介导的mRNA降解(NMD)。这是一个真核生物中非常保守的通路。最近的研究发现这个通路不仅可以降解细胞中由于基因突变而导致的带有PTC的转录本,而且可以影响细胞中大约1%到10%的正常产生的转录本。为了回答这些转录本是基因表达调控的需要还是剪切本身产生的噪声,我们对人和小鼠中的NMD的候选基因(底物)做了系统地研究。在哺乳动物中,NMD靶基因的识别依赖于最下游的外显子交界处复合体(exon junction complex,EJC)。当一个终止密码子在EJC上游且到EJC的距离大于50~55bp时,这个终止密码子会被识别为PTC,进而激活NMD通路。利用这个特征,我们在人和小鼠的基因组中分别找到了701个和498个NMD候选基因。通过研究这些基因的性质,我们发现NMD候选基因特有的外显子倾向于,1)在进化过程中是新产生的,2)长度不是3的整倍数,3)表达丰度很低,4)属于有可变剪切的基因,5)这些基因在功能分类上没有偏好,6)在物种间不保守。这些现象都说明这些自然产生的NMD底物可能是剪切噪声产生的,然而,我们同时发现比较古老的NMD候选基因则处于负选择压力之下,可能具有调控作用。这些结果说明了NMD通路对真核生物mRNA的监控具有重要作用。
综合以上结果,我们认为基因调控在生理条件和进化过程中都有重要作用。随着测序等各种技术不断的发展,将来我们肯定可以对基因调控的规律有更多的认识,使我们对基因组及其进化有一个更加全新的认识。