论文部分内容阅读
核仁小分子RNA(smallnucleolarRNA,snoRNA)是目前已知细胞核内最大的非编码RNA(non-codingRNA,ncRNA)家族,在ncRNA领域中占有重要的研究地位。根据结构和功能特征,snoRNA主要可以分为boxC/D和boxH/ACA两大类,它们分别指导rRNA上特定位点的甲基化和假脲嘧啶化修饰。作为ncRNA,snoRNA的基因组织具有高度多样性:酵母中大多数snoRNA是独立转录的单基因,也有几例独立转录的基因簇;而哺乳动物的snoRNA基因则大多位于内含子中,且“一个内含子只含一个snoRNA”。植物snoRNA的研究开展较晚,早期的生物化学数据指出其rRNA是高度修饰的,相应的其中必然存在大量起指导作用的snoRNA分子。水稻作为单子叶植物的代表,是第二种进行全基因组测序的植物,初步研究已发现一例独特的多个snoRNA位于同一内含子中的现象,因而具有较高的研究价值。
本研究以水稻为对象,考察其中的snoRNA基因及基因组织形式。第一阶段,在水稻基因组数据不全,大规模鉴定平台尚未建立的情况下,利用snoRNA的保守性开展同源搜索,找到了27个新的水稻snoRNA基因,进一步发现它们组成6个snoRNA基因簇,其中就有4个位于内含子区。这为内含子snoRNA基因簇在水稻中存在提供更多例证,从而确立了这种新的snoRNA基因组织形式。同时通过cDNA数据库检索及RT-PCR实验,证明这些簇都是以多顺反子前体转录的;通过引物延伸反应,证明簇内的snoRNA分子能正常成熟;根据snoRNA结构与功能的关系分析,这些snoRNA绝大部分都有确定的功能,对其中三个植物特有snoRNA指导的甲基化修饰位点还通过不同dNTP浓度下的逆转录反应进行了验证。
接着,我们以新建立的计算机RNA组学和实验RNA组学方法为基础,在基因组水平上对水稻snoRNA及其基因组织进行全面深入的研究。分析获得的大量数据发现,水稻snoRNA大部分(83%)以基因簇的形式存在,其中近一半位于内含子中,说明内含子snoRNA基因簇在水稻基因组中大量存在。宿主基因大多与核糖体或核仁相关,且通常是其最大的一个内含子中含有snoRNA基因簇,同一宿主基因一般还存在不含snoRNA基因簇的拷贝。
通过分析比较内含子snoRNA基因簇和非内含子snoRNA基因簇,发现snoRNA基因的局部重复,是snoRNA基因簇尤其是内含子snoRNA基因簇形成的重要机制之一;可能由于基因间隔区比内含子区有更大的弹性和空间来容纳更多的snoRNA基因,非内含子簇可以包含8、9个甚至更多的snoRNA,而内含子snoRNA基因簇一般限于由2-6个基因组成。不少水稻snoRNA基因簇(内含子的和/或非内含子的),在组成上相似。将这些相关的snoRNA基因簇在染色体上定位,发现相当一部份(约50%)落在了对应的染色体重复区域内,说明水稻历史上的染色体重复事件是形成相关snoRNA基因簇的重要原因之一。
除了snoRNA基因簇之外,水稻还存在其它的snoRNA基因组织类型,如单独转录的snoRNA,单个位于内含子中的snoRNA,以及tRNA-snoRNA双顺反子等。水稻snoRNA形成以簇为主,多种基因组织类型并存,内含子snoRNA基因簇大量存在的总体格局。
比较水稻和拟南芥两种植物的snoRNA基因组织显示,snoRNA基因簇是植物snoRNA基因组织的特点;但拟南芥一般是位于基因间隔区的小簇,而在水稻中大簇较常见,且近一半的簇位于内含子区。另外,虽然两种植物分歧比较久远,但其中不少snoRNA簇的基因组成及排列顺序仍有一定的关联性。而在拟南芥仅有的5例位于内含子的情况中就有三例的宿主基因及其内含子中的snoRNA与水稻中的情况完全对应,说明植物snoRNA基因簇产生于早期,且在拟南芥和水稻的祖先就已存在内含子snoRNA(簇),现在所见水稻和拟南芥snoRNA基因组织的区别与它们基因组各自的进化历程与方向有关。
综合分析研究过程中鉴定的大量水稻snoRNA基因,发现它们显示出高度多样性,一是其种类繁多,就boxC/DsnoRNA而言共发现116种,包括各生物间保守的,植物特有的和水稻特有的,是迄今为止在一种生物中发现种类最多的例子,二是大多数snoRNA具有两个或更多拷贝,拷贝间的序列变化有可能导致功能的产生,丢失或改变。对水稻而言,丰富的snoRNA可能是一个基因资源库,为其应付复杂环境,提供一定的遗传物质基础。
snoRNA是细胞内起引导识别作用RNA分子的代表,这类分子一般通过互补配对来进行位点识别,通常数量较多形成家族,且很可能具有多拷贝的特点,以维持一定复杂度,保有指导新位点的可能。同时snoRNA的研究也使人们认识到其多样的基因组织及表达方式,除了独立基因外,还有寄生在内含子中的或成簇表达的等。这些基因组织在表达上有“协同”和/或“经济”的优势,其它ncRNA也很有可能采用。