论文部分内容阅读
自达尔文时代以来,进化生物学家关注的一个重要问题就是生物如何从共同祖先进化成丰富多样的物种。基因组中新基因和新染色体等新遗传元件的产生与进化是生物进化的重要驱动力。随着分子生物学和基因组学的发展,基因的起源和染色体的演化己成为进化生物学家关注并着力解决的重要问题。
果蝇是研究新遗传元件进化的良好模型。近年来通过对果蝇年轻基因的案例研究和对黑腹果蝇(Drosophia melagoaster)种复合体(species complex)的全基因组研究,我们初步了解到有多种机制在新基因产生过程中起作用。但是,新基因产生后,何种机制所产生的基因或者何种功能的基因在长期的进化过程中得以保留和固定以及这些基因的功能如何变化却一直没有定论。黑腹果蝇种组(species group)祖先枝的分歧大概发生在55百万年前(mya),黑腹果蝇亚组(species subgroup)祖先枝的分歧发生在44百万年前(mya),在此进化尺度的果蝇中既能分辨出新基因产生的足迹,又能看到基因在相对较长的进化时间中固定、产生功能的过程。为了更深入地了解新基因的起源和进化机制,本论文通过对12种果蝇的全基因组进行了扫描和比对,在黑腹果蝇种组中鉴定了新基因并初步分析了它们的功能。我们共在黑腹果蝇种组中鉴定了159个新基因,其中,在黑腹果蝇种组共同祖先向组内分歧的进化枝上鉴定了68个新基因,在黑腹果蝇亚组的共同祖先向亚组内分化的进化枝上鉴定了91个新基因。这些新基因中,有72个是通过散在重复机制产生并固定的,占45.28%;40个通过串联重复产生,占25.16%;3个逆转座新基因,占1.89%;44个从头起源新基因,占27.67%。计算重复基因中新基因拷贝与亲本基因的Ka/Ks比率发现几乎所有重复产生的新基因都在进化过程中受到了强烈的功能限制。对这些新基因的GO分析发现,重复产生的新基因往往是一些编码有结合活性和催化活性产物的基因以及一些酶调控因子和分子信号传导因子的基因。其生物学功能倾向于参与色素沉着、发育、细胞定位、生殖、细胞对刺激的应答和调控等生物学过程。与亲本基因相比,32.56%的新基因至少在一个发育时期表达有差异,28.68%的新基因至少在一个组织中表达有显著差异。
本实验首次发现高达27.67%的新基因是从头起源的基因,其中在黑腹果蝇种组祖先枝和亚组祖先枝中分别鉴定了高达16.18%和36.26%的从头起源新基因。通过Ka/Ks分析我们发现约1/3的从头起源新基因受到强烈负选择,这些基因产生后可能很快就获得了功能并在功能上趋于保守。多数从头起源的新基因都在精巢中高表达,但是也有约1/3的新基因在脂肪体(fat body)中表达。GO分析显示这些基因可能与免疫应答过程有关,提示它们可能与物种对外界刺激的适应性有关。本工作的发现说明从头起源是果蝇产生新基因的一种非常重要的机制。
B染色体是在正常染色体之外多余的染色体,其有无、数目和结构在细胞核中均不稳定,是研究染色体形成和进化的好材料,该染色体遗传不遵循孟德尔遗传定律,因此研究B染色体的起源和进化具有重要的遗传学意义,但目前对B染色体携带有何种遗传信息及B染色体如何起源与传代仍然所知甚少。比较近缘物种染色体的数目和结构是研究新染色体起源与进化的常用方法。银额果蝇(Drosophila albomicans)与黑腹果蝇同属果蝇属,但归类于伊米果蝇(Drosophila immigrans)种组、D.nasuta亚组,是伊米果蝇种组中唯一含有B染色体的物种。银额果蝇的3号染色体和性染色体在0.12百万年间经历了一次染色体融合,其基因组中只剩下3对染色体,成为研究B染色体序列和新染色体形成的良好模型。本研究分离培养了银额果蝇单雌系,分别对同一个银额果蝇单雌系中含有B染色体雄性果蝇和不含B染色体的雌性果蝇全基因组进行了Illumina测序和拼装,比较了含有B染色体和不含B染色体的拼装基因组序列,对可能是B染色体的序列进行了验证,得到了一条B染色体特异的scaffold及一个B染色体连锁的SNP位点。分析B染色体特异的scaffold后发现B染色体上重复序列达到20%左右。更为重要的是,本研究还进一步用染色体显微切割技术收集了约1500条银额果蝇B染色体,对其线性扩增后进行了Illumina测序和拼装,得到总长为5,161,496 bp的scaffold。将B染色体拼装序列和基因组测序拼装序列比对,0.55M的拼装序列可以和1.6M测序基因组有较好比对结果,比对较好的序列大部分是核糖体DNA(rDNA)序列。将银额果蝇全基因组测序的reads与显微切割收集的B染色体测序reads进行了比对,将能互相比对上的read进行二次拼装,得到总长为19,427bp的B染色体序列,这些序列几乎全部是重复序列或者rDNA序列。进一步将拼装的银额果蝇B染色体序列与12个物种果蝇基因组的基因序列比对,发现能比对上的均为rRNA基因,这些基因处在X染色体的异染质区域和未确定位置的异染色质区。上述结果提示B染色体与A染色体的异染色质同源,尤其是与X染色体的序列最为相近,且其上含有大量rDNA序列。我们推测银额果蝇B染色体可能部分或者全部起源于祖先X染色体序列。