论文部分内容阅读
“荷兰植物基因组学研究中心(CBSG)”由荷兰几家大学、研究所及十几家育种公司组成,主要研究作物为番茄和马铃薯,主要研究方向为这两种作物的消费品质、环境品质以及与种植和加工技术等方面相关的农艺性状。五年前,该中心启动了一项主要以番茄和马铃薯为研究对象的基因组学和代谢组学研究项目。在这些研究项目中,以提高番茄品质,探明影响番茄品质的基因表达及代谢网络路径是一项重要的研究内容。该项目旨在揭示决定番茄(Solanumlycopersicum)感官(风味)等品质性状的遗传基础,通过一系列技术分析不同的分子标记、生化代谢物和蛋白质等,对94个番茄品种进行鉴定与评价。主要目标首先是阐明分子标记、生化代谢物等与番茄感官(风味)等品质性状组成成分的关系;其次是将不同层次的信息联系起来,并建立与番茄感官(风味)等品质性状有关的基因表达的层次、网络及路径。
该项目选择的94个番茄品种来自荷兰5家育种公司,这些品种中,56个果实大小正常,形状为圆形,称为圆形番茄;20个果实较大,称为牛肉型番茄;18个果实较小,称为樱桃型番茄。该研究分以下几个方面:第一是对这些番茄品种进行分子标记,研究它们的遗传多样性,二是测定与番茄果实风味品质相关的生化代谢物等性状,三是通过培训尝味员,让他们对25个番茄感官(风味)性状进行评价,四是对消费者进行问卷调查,研究相关的消费品质。
在这个项目中,许多研究小组得到的大量数据都由生物信息小组进行分析处理。本文的主要研究内容是运用遗传学、统计学以及生物信息学的知识对所得到的数据进行分析处理,研究番茄的遗传多样性、连锁不平衡、单倍型结构与模块的建立、单个标记与性状的关联以及单倍型模块与性状的关联等。
本文分为六章,
第一章绪论包括文献综述和本文研究的背景知识。近年来分子遗传学迅猛发展,越来越多的诸如SNP、AFLP、RFLP等分子标记使作物的高密度连锁图谱的建立成为可能,利用全基因组扫描对标记与性状进行关联分析来检测影响作物复杂性状的基因或者QTL越来越受到研究人员的重视。和传统的连锁分析相比,连锁不平衡作图(关联作图)不需要建立F2,BC和RILs等作图群体,并且可以利用群体历史重组信息,因此连锁不平衡作图可以节省大量人力物力,并且可以对影响作物重要性状的基因或者QTL进行精细定位。在高密度连锁图谱中,邻近标记间彼此相关,一个标记的信息往往可以预测邻近标记的信息。一条染色体上相邻位点的集合可以看作一个超位点,在这样一个超位点,或者单倍型模块内,标记之间的连锁不平衡值很高。在这些模块内只有少数单倍型出现,并且部分标记可以包含整个模块大部分的信息。由于单倍型模块一般包含多个标记,和单个标记相比,它们能提供更多信息,因此利用单倍型模块与性状进行关联分析时,其检测效能一般要高于单个标记。
第二章利用882个AFLP标记(其中304个标记图谱位置已知)研究这些来源不同的番茄品种的遗传多样性、群体结构、连锁不平衡的强度及衰减等。研究结果显示AFLP标记在染色体上的分布不均一,第4、6和9号染色体上相邻标记平均距离小于1cM,75%的相邻标记间距离小于3cM;但第2、3和7号染色体上相邻标记间距离一般要大于3cM。这些番茄品种的连锁不平衡值很高,而且在基因组上跨度较长,直到20cM才开始衰减,适于进行标记-性状关联分析。不同染色体上标记间连锁不平衡强度差异较大,第4、5、6和9号染色体上连锁不平衡较强,不同染色体上标记间连锁不平衡一般较小。群体结构分析表明可以至少将这些番茄品种分为两组:一组主要包括樱桃型番茄,另外较大的一组主要包括牛肉型和圆形番茄。樱桃型番茄组内品种间遗传距离比牛肉型与圆形番茄组内遗传距离要大,而这两组品种之间的遗传距离则最大。在第二章中我们发现部分染色体上紧密连锁的标记处于强连锁不平衡,使基因组的这些区域呈现单倍型模块结构。
第三章中利用AFLP标记在第1、4、5、6、9、11和12号染色体上划分单倍型模块,在得到的56个模块中,Brillouin多样性指数变化范围为0.244-0.996,75%的单倍型模块的Brillouin多样性指数超过了0.5。模块内单倍型的数量变化幅度较大,并且与模块内标记的多少有关。9号染色体上第3和第5个单倍型模块内标记数量超过40个,而这两个模块的遗传距离分别为12.45cM和9.45cM;与此相反,1号染色体上的第5个模块与9号染色体上第1个模块仅仅含有2个标记,而这两个模块的遗传距离较大,分别为24.95cM和19.15cM。对模块内单倍型分布研究发现,樱桃型番茄具有特定的单倍型,而牛肉型和圆形番茄则倾向共有相同的单倍型。与之前应用AFLP标记进行连锁不平衡分析相比,基于单倍型模块的分析能更好地反映连锁不平衡随遗传距离的增加而衰减。利用所建立的56个单倍型模块及未进行单倍型模块划分的标记,我们同时应用贝叶斯算法及邻接聚类算法进行遗传多样性分析。与之前应用单个AFLP标记所得到的结果相比,基于单倍型模块能得到更好的聚类结果,这可能是由于和单个的标记相比,单倍型模块能减少标记密集分布区域对聚类分析带来的偏差。
本文研究的94个番茄品种来自5家育种公司,多数是栽培种,因此不能按照常规的QTL作图来发掘影响番茄品质性状的QTL。但这些番茄品种来源较广,包括牛肉型、樱桃型和圆形番茄,因此可以对它们进行连锁不平衡作图来寻找与品质性状紧密关联的分子标记。
第四章中我们利用AFLP标记对主要品质性状进行关联研究,结果显示在使用未校正数据时,基因组许多区域与性状都呈现很强的关联性。特别是在第4和第5号染色体上,我们发现许多标记与性状呈现很强的关联性。原始数据经番茄类型校正后,许多原先所观察到的关联很多都消失了。25个感官性状中,检测到与AFLP标记关联的主要是与味道有关的性状,其次是与口感和气味有关的性状。总的来说,与品尝后相关的性状没有显示多少遗传变异。许多彼此相关的挥发性代谢物与第6和9号染色体的一些区域存在较强的关联。这些成分中的甲基丁醇,甲基丁醛和2-异丁基噻唑被认为与典型的番茄气味有关。这些成分都是异亮氨酸代谢途径中的中间产物,并且它们彼此之间呈显著性相关,因此我们可以推断这些检测到的关联与影响异亮氨酸代谢途径的遗传因子有关。
第五章是在前两章的基础上,利用单倍型模块对主要品质性状进行关联分析,并重点比较基于单倍型模块与单个AFLP标记的关联结果。单倍型模块实际上是将基因组上彼此邻近而又处于强连锁不平衡的标记看作一个模块,或者是一个超位点。应用单个AFLP标记与应用单倍型模块得到的关联结果相近,但单个AFLP标记检测不到的关联,利用单倍型模块则可以检测到。表明利用单倍型模块进行关联研究,在全基因组水平上控制第一类统计错误时,其检测效能要高于单个AFLP标记。
第六章是全文的结论和讨论。
本文创新点主要包括以下几个方面:
1)基于单个AFLP标记的连锁不平衡分析结果显示本研究所采用番茄材料连锁不平衡值很高,而且在基因组上跨度较长,直到20cM才开始衰减;
2)首次利用AFLP标记在番茄部分染色体上建立单倍型模块;
3)和利用单个AFLP标记得到的连锁不平衡结果相比,利用单倍型模块所得到的结果发现连锁不平衡的衰减趋势更为明显;
4)在遗传多样性研究中,与AFLP标记相比,应用单倍型模块可得到更好的聚类结果。分子标记的权重信息可少受标记在基因组上不均一分布的影响;
5)将94个番茄品种分为两组(樱桃型番茄一组、牛肉型和圆形番茄为另一组),这可以减少关联分析的假阳性;
6)第6和9号染色体的一些区域与甲基丁醇,甲基丁醛和2-异丁基噻唑存在显著性关联,这些关联与影响异亮氨酸代谢途径的遗传基因有关;
7)利用单倍型模块进行关联分析,其检测效能比利用单个标记进行分析要高;
8)本研究采用的单倍型模块与性状关联分析的模型,以及在Genstat软件中开发的将单倍型模块转化为遗传决定因子的程序,不仅可以应用于单倍型模块关联分析,还可应用于SSR标记关联分析。