论文部分内容阅读
稻属(Oryza L.)AA-基因组是稻属中包含二倍体物种数目最多、分布最广、起源最晚的基因组类型,由2个栽培种和6个野生种组成。由于栽培稻在全球粮食生产中的重要地位,AA-基因组一直倍受全世界众多学者的极大关注。与栽培稻相比,野生稻具有更丰富的遗传变异,是水稻育种的天然基因库。随着越来越多野生稻基因组图谱的完成,稻属日益成为禾本科植物中进行进化与功能基因组学研究的理想体系。开展野生稻基因组的进化基因组学比较研究,将会极大地促进重要功能基因、代谢途径与分子模块的大规模解析和鉴定,深刻地阐明植物基因组结构和进化的规律和机制。 追溯重建物种间可靠的系统发育关系,乃分析所有进化问题之必需。但由于AA-基因组是一个快速辐射进化的类群,在其系统发育和起源分化上仍存在诸多未解之谜。我们选取代表全基因组范围的53个单拷贝核基因和16个基因间区片段组成的~60 kb的序列,对AA-基因组所有8个二倍体物种以及代表BB-、CC-、EE-和GG-基因组的4个二倍体物种开展了系统发育基因组学研究,全面解决了AA-基因组各物种间的系统发育关系。澳大利亚特有分布的O.meridionalis是AA-基因组的基部类群,大约在2.93 mya最先分化出来。与其最近缘的BB-基因组物种O.punctata可以作为解决AA-基因组系统发育关系的最合适的外类群。在9.11 mya的中新世,AA-基因组类群与O.punctata完成分化,并快速地辐射进化,形成了今天泛热带分布的多样性格局。本研究对AA-基因组类群进化关系的成功解决,无疑突显了系统发育基因组学研究对阐明近缘物种之间的进化差异和重建物种的进化历史的重要性。 达尔文正选择是基因组进化以及物种分化的重要驱动力。利用比较系统发育学的方法在全基因组尺度寻找受正选择作用的基因(PSG),为深入洞察基因组的动态进化与基因功能的分化提供了重要信息。然而,以前的研究受限于少数可用的全基因数据,检测能力和精确性远远不够。我们利用自主测序拼接的5个高质量的野生稻基因组,首次利用比较基因组学的方法开展了对水稻及其近缘物种PSG的全基因组搜索。我们发现,随着AA-基因组类群的快速辐射进化,很多物种表现出选择约束力的放松,并存在较高比例的PSG。在2272个高可信度直系同源基因家族中,有537个基因表现出显著的正选择信号,其中有20~280个基因不等,在特异枝系上受到正选择作用。与以前的结果相似,PSG比non-PSG表现出更低的表达水平和更明显的组织表达偏好性,并且在与抗性和生殖相关的功能中显著富集。虽然本研究只初步认识了正选择对功能的影响,但是寻找到的候选PSG和受选择位点为进一步的功能和进化研究提供了良好的开端。 基因重复被认为是基因组进化的首要驱动力之一,为突变、遗传漂变和自然选择提供了大量新的遗传物质基础,是新基因产生及其新功能形成的主要源泉。但是,由于大范围高度相似的重复序列常常很难或被错误的组装,因此基因组拼接的质量对其鉴定过程产生了很大影响。利用稻属AA-基因组物种全基因组测序的契机,我们首次使用全基因组鸟枪序列鉴定法(WSSD),不依赖于全基因组的拼接获得了8个物种内节段式重复的全景概况。利用每个基因组不低于10×覆盖度的短reads,我们在AA--基因组8个物种中共发现2489个节段式重复,覆盖了77 Mb的基因组区域。其包含的基因很多是具有功能的,多在与信号转导、细胞调控、生殖发育、核酸结合等功能类型中显著富集,尤其是对植物抗性具有重要影响。利用诸物种内检测到的种系特异重复序列,初步评估了大片段重复形成的速率。推测在亚洲栽培稻及其祖先分支上极有可能发生了节段式重复的爆发,但是它们是否暗示了基因组进化的特殊样式还是代表了植物基因组的普遍特征,还需要作进一步的研究。 小范围的散在重复基因可能与全基因组重复和节段式重复具有不同的进化命运和机制。为了深入认识近期新形成的散在重复基因是否以及如何发生功能分化并进一步影响植物的适应性进化,我们分析了24对稻属AA-基因组物种特异的年轻重复基因的分子进化和表达分化样式。发现只有很少比例的重复基因由于冗余变为假基因,大部分表现出不对称的表达分化和进化速率差异。表明至少对于散在的小范围重复基因,可能会导致功能分化的序列水平和/或表达水平的不对称性差异,在基因重复发生之后迅速出现。对两对年轻重复基因RD1和RD2的进一步实验分析发现,重复基因在新形成之时已经存在不同的调控序列,极有可能是引起功能分化的重要因素。基因重复后两个拷贝间均存在不同程度的不对称序列分化和表达差异,并显著受到正选择作用的驱动,暗示了它们可能获得了增强生物体适合度的新功能。RD1和RD2的进化过程可能代表了一类年轻重复基因的分化机制,即在不同的启动子区的调控下,表现出亚功能化或新功能化,从而影响水稻的适应性进化过程。