论文部分内容阅读
人工选择是人类对野生动植物在人工选择条件下进行改造的过程,经过人类驯化的过程,野生动植物在多个方面的性状发生了显著的变化以满足人类需求。驯化是人类社会、文明发展的重要基础,也是农业发展必不可缺的环节。人工选择过程中农艺性状改变,往往是通过影响农艺性状相关的基因产生作用的,比如落粒基因sh4,以及株型相关基因prog1。在全基因组层面研究人工选择过程中基因组发生的变化,寻找人工选择的基因组区域和有用的农艺性状相关的基因,将在已有单个基因研究的基础上进一步阐述人工选择作用于基因组的机制,并进而帮助提高物种改良的效率。本人在博士期间的研究工作主要以家养动植物,特别是以水稻和山羊为主要研究对象,开展了其在人工选择作用下基因组进化的规律研究。 水稻是禾本科稻属的物种,是当今重要的粮食作物。水稻的栽培有着悠久的历史,在水稻的栽培历史中,栽培稻很多方面的性状同野生稻相比都发生了很大的变化,这些变化让水稻更加符合农耕的要求,并让水稻逐渐成为亚洲主要的粮食作物之一。作物的遗传学研究中,探索栽培驯化过程的遗传学基础,将帮助揭示重要农艺性状的遗传学基础,为进一步的作物改良奠定基础。同时,随着第二代测序技术的发展,开展大规模的全基因组研究成为可能,这大大加速了遗传学研究的过程,通过进行大规模基因组数据的分析,一方面让全基因组水平上的遗传基础研究成为可能,另外一方面也将加速整个科研进程,并帮助相关的产业转化。在本论文的研究中,我们选取了代表性的四十株栽培稻和二十五株野生稻,进行了全基因组测序。其中的五十株测序深度达到了15倍,很好地覆盖了全基因组。将这些测序数据分别同参考序列进行比对,我们鉴定出了这些品系在全基因组上的存在的差异,其中包括六百五十万个高可信度的单核苷酸多态性位点(single nucleotide polymorphism,SNP),八十万个小的插入删除(insertion anddeletions,InDel),九万五千个大的结构性变异(structure variation,SV)和一千六百多个拷贝数变异(copy number variation,CNV),这构成了水稻基因组上全基因组的变异图谱。我们发现栽培水稻在全基因组水平上的多态性为5.4×10-3(π),其中粳稻多态性水平更低,为3.7×10-3,籼稻相对较高,为5.7×10-3。而野生稻的多态性则高达7.7×10-3,其中O.rufipogon为7.2×10-3,O.nivara为6.3×10-3。除了上述的变异之外,我们也将不能够比对到参考基因组上的序列进行了组装,在排除污染等影响下,鉴定出了1,415个在不同品系之间存在却没有包含在参考基因组上新基因。同时也鉴定出1,327个参考基因组上的基因在某些水稻品系中被丢失。这些新基因和基因丢失事件,从一个侧面反映出水稻基因组动态变化造成的差异。 利用高准确度的SNP位点,我们首先进行了主成分分析(PCA),主成分分析中,四种主要的水稻类型(野生稻rufipogon,野生稻nivara,栽培稻粳稻japonica,栽培稻籼稻nivara)各自分开,表明基因组水平上能够区分四个群体。进而我们构建了被测序个体的系统进化树,从系统进化树上我们可以看出两种主要类型的栽培稻(粳稻和籼稻)之间差异明显,并且分别同两种野生稻(rufipogon和nivara)聚类到一起,说明两种栽培稻经历了不同的驯化过程,此进化树更加支持两次独立起源或者一次起源之后籼稻同nivara野生稻之间发生大规模基因交流的两种水稻驯化模型,群体结构分析也同样表明不同类型栽培稻的不同驯化过程。我们也分析了水稻基因组上的连锁情况,通过计算连锁不平衡,我们发现野生稻中连锁距离较短,两种野生稻基本在10Kb之内连锁就降低到了最强连锁的一半,而籼稻中这个距离是65Kb,粳稻更是达到了200Kb,这提示了进行数量性状位点分析(QTL mapping)可能能够达到的精度。 通过对比栽培水稻和野生水稻在不同的基因组区域的多态性差异,我们鉴定了在基因组上栽培水稻多态性显著低于野生水稻的区域,这些区域更加有可能是在栽培水稻驯化过程中受到了选择的,这些区域通过其他参数(FST)衡量同样也是栽培稻和野生稻之间存在较大差异的区域,这样我们分别在粳稻和籼稻中鉴定出了739个和750个候选的受选择区域。同时,包括sh4和prog1在内的一些已知驯化相关基因位于这些区域中,说明这些区域的确更有可能受到了选择。我们发现有73个基因位于两种栽培稻受选择区域中,这些基因可能决定了栽培种重要的性状,所以在两种栽培稻中同样地受到了选择。通过全基因组重测序,我们研究了水稻的驯化历史,通过数据分析也发现了一些可能同重要农艺性状相关的基因,这不仅仅从遗传学的角度阐释了水稻驯化和栽培水稻的性状改变的基因组基础,为后续的水稻研究积累了数据,也将加速水稻品种的进一步改良。 除了对水稻驯化进行深入的研究之外,我们也针对山羊展开了基因组研究,以期获得在植物驯化的基因组基础研究之外,探索动物驯化的相关基因组基础。山羊在全世界范围内被广泛饲养,尤其是在中国、印度和其他发展中国家。山羊是肉、奶、纤维、皮毛的重要来源。自从有人类文明以来,山羊在农业、经济、文化甚至宗教方面也扮演了重要的角色。虽然其重要性如此之高,由于缺乏参考基因组,目前对山羊的遗传育种研究还略显滞后,而山羊基因组测序对于遗传标记辅助育种、改善山羊的经济性状具有重要作用。尽管山羊在农业和生物上具有重要性,由于缺少其基因组参考序列,严重阻碍了其育种和遗传研究。此研究中采用Illumina下一代测序技术,获得了山羊基因组序列。在没有完善的全基因组物理图谱的情况下,本研究创新的使用了一种新的构建染色体物理图谱的方法,借助于全基因组酶切图谱Optical Mapping技术对基因组在染色体水平进行了拼接,最后结合序列拼接的结果整合形成了基因组完成图。基于注释的基因集,取已阐明羊绒产生机理的内蒙绒山羊的初级毛囊与次级毛囊的转录本进行比较分析,确认了驯化过程中快速进化的基因。 在水稻和山羊研究中的这些结果提示,基于全基因组测序技术使得我们能够更加清楚的了解人工驯化作用下家养动植物基因组进化的规律,有助于找出在人工驯化作用下受选择的与农艺性状相关的基因,这些规律和基因信息也许能进一步改善优良品种的选育。