论文部分内容阅读
大部分真核生物的基因含有内含子。基因表达过程中,前体mRNA的内含子需要通过RNA剪接去除才能形成有功能的RNA。RNA的剪接通过剪接复合体催化完成。剪接复合体是一个巨大而又动态变化的RNA-蛋白复合体。剪接复合体包括5种小的核内RNAs(U1、U2、U4、U5、U6 snRNAs)和150多种蛋白。发生在一条前体mRNA之内的剪接,称为顺式剪接(cis-splicing);发生在不同前体mRNA之间的剪接,称为反式剪接(trans-splicing)。 反式剪接在低等真核生物锥虫和线虫中广泛存在。锥虫几乎所有的转录产物进行反式剪接,线虫大约70%的转录产物进行反式剪接。锥虫和线虫反式剪接都是在SLRNA(spliced leader RNA)的介导下进行。SL RNA通过剪接将其中的一段连接到转录产物的5末端。反式剪接后的内含子形成Y型结构而顺式剪接后的内含子形成套索状结构。SL RNA的反式剪接需要U2,U4,U5和U6 snRNAs,但是不需要U1 snRNA参与。SL RNA组装成U1 snRNP类似的复合体,参与到反式剪接中。 在高等生物中也有基因发生反式剪接,例如植物叶绿体和线粒体的某些基因,果蝇中mod(mdg4)和lola,以及哺乳动物中的一些基因。最近,随着深度测序技术的发展,越来越多的反式剪接基因被发现。在果蝇中发现并确认了大约80例反式剪接基因,其中包括两个经典的反式剪接基因mod(mdg4)和lola。mod(mdg4)蛋白作用于染色体结构的建立和维持。通过反式剪接mod(mdg4)的可变外显子连接4个共同的外显子,产生至少31种不同的剪接形式。在昆虫如家蚕,蚊子,棉铃虫中,mod(mdg4)的反式剪接非常保守。lola基因产生的转录因子参与到神经和干细胞的分化过程中。lola基因的5末端含有4个可变外显子和4个共同外显子,通过反式剪接连接不同的3端外显子,形成80种mRNA和20种蛋白质。 在非SL RNA介导的反式剪接中,通常认为前体mRNA之间存在互补配对序列,将前体mRNA拉到一起促进反式剪接的进行。一方面这一假说未得到充分的实验证实,另一方面许多反式剪接的前体mRNA内含子间并没有明显互补配对序列,如mod(mdg4)。为了回答这些问题,对果蝇中反式剪接基因mod(mdg4)进行研究。研究发现在mod(mdg4)共同内含子4有两个关键的RNA序列(TSA和TSB)。TSA足以使反式剪接发生,TSB提高反式剪接效率。利用CRISPR/Cas9体系将果蝇中的TSA和TSB敲除,果蝇出现胚胎发育和孵化率的缺陷。将不同种果蝇共同内含子4进行序列比对,发现在TSA和TSB中有两个高度保守的序列,TSA core和TSB core。TSA core含有5剪接位点,通过与U1 snRNA互补配对结合U1 snRNP,并促进反式剪接。在反式剪接基因lola中也发现了TSA类似序列。mod(mdg4)和lola互相之间可以发生反式剪接。本论文研究揭示了新的反式剪接机制,内含子RNA结合剪接因子,将反式剪接的前体mRNA拉近并发生反式剪接。