论文部分内容阅读
生命是复杂和多样的,了解控制个体发育基因的进化历史是我们认识生命演化的重要前提。MADS-box基因编码一类转录因子,不仅参与了植物、动物和真菌中的各种生长发育过程,并且与生物演化过程中一些创新性状的出现有重要关系。为了对该基因家族有更全面和深入的认识,本研究依据现有的多个物种的基因组数据,利用系统发育分析和各种生物信息学手段,分别从整个真核生物、被子植物以及近缘种三个不同的尺度对MADS-box基因的进化历史、式样及其进化机制进行了阐释,并对分析过程中发现的直系同源基因间结构分化的现象进行了全基因组范围的研究。主要结果如下:
1、真核生物中MADS-box基因进化的基本概况。我们在72个真核生物中共鉴定了1989个MADS-box基因,系统发育分析表明:该类基因在真核生物起源早期就已经存在,在现存真核生物的最近共同祖先中至少有两个拷贝;在真核生物分化早期,MADS-box基因的获得和丢失频繁发生;动物和真菌中的MADS-box基因较为保守,保持相对稳定的拷贝数;植物中的MADS-box基因经历了多次扩张,从链形植物(streptophyta)最近共同祖先中的2个拷贝演化为被子植物最近共同祖先中的19个拷贝,而且不同被子植物类群间MADS-box基因的数目也存在明显差异,说明这些基因在植物进化过程中经历了快速的“生与死”的进化模式。
2、被子植物祖先中花发育相关MADS-box基因的进化。通过对被子植物最近共同祖先中ABCDEG类MADS-box基因序列的重建和比较,我们发现各类型祖先序列与现存被子植物最基部类群无油樟(Amborellatrichopoda)中的序列最相似,而AP1(A类)、PI(B类)和AP3(B类)类基因的差异比其他类型基因更为显著,说明这些基因可能经历了较快的进化过程;从三维结构来看,祖先蛋白和现存蛋白间也没有明显差异,说明ABCDEG类MADS-box蛋白间的互作模式可能在被子植物最近共同祖先中就已经建立。
3、近缘种中MADS-box基因的进化。我们以拟南芥(Arabidopsisthaliana)和琴叶拟南芥(A.lyrata)这一对近缘种为代表,分别从两个物种中得到了106个和115个MADS-box基因;系统发育和拷贝数目分析证明有超过三分之一的基因对在二者分化之后发生了拷贝数目的变化,新基因产生的主要方式为串联重复和散在重复;在另外61.7%的保持一对一关系的基因对中,直系同源基因也不是严格保守的,除了碱基替换之外,还会发生基因结构的分化;Ⅰ型基因和Ⅱ型基因在进化式样上存在显著差异,Ⅱ型基因拷贝数目变化不大,受到了较强的负选择(negativeselection)作用,Ⅰ型基因经历了多次独立的基因获得和丢失事件,受到的选择压力较弱。
4、植物中直系同源基因结构分化的式样。通过对拟南芥-琴叶拟南芥、拟南芥-杨树(Populustrichocarpa)和拟南芥-水稻(Oryzasativa)中的300对直系同源基因的研究,我们证明直系同源基因结构分化的现象不是MADS-box基因所特有的,而是在基因组范围内都普遍存在;300对基因中发生结构分化的比例为73%,其中有超过五分之一的基因编码的蛋白质也存在显著差异;从机制来看,至少存在外显子/内含子获得/丢失、外显子化/假外显子化和外显子内部的插入/缺失等三种方式导致基因结构的分化;直系同源基因结构分化的比例与分化时间呈现一定程度的正相关。
上述结果表明,MADS-box基因在真核生物中具有复杂的进化历史,不同类型的基因有其各自独特的进化方式,同一类型的基因在不同生物类群中的进化式样也不尽相同。直系同源基因间还可以通过基因结构变化的方式快速地分化,并且这种分化方式要比人们之前所预想的更为普遍,很可能是直系同源基因功能分化的主要途径。