论文部分内容阅读
小麦(Triticum aestivum)是世界种植范围最广的粮食作物,并提供了全球20%的卡路里和25%蛋白质消耗,因此提高小麦产量和品质具有重要意义。现代农业粮食产量的提高主要依靠遗传改良和施肥量的增加,为了避免施肥过多造成的资源浪费,解析作物重要性状的遗传调控机制,利用分子生物学的方法辅助育种是现代育种的一个重要手段。由于小麦是一个异源六倍体,基因组庞大,80%以上为重复序列,为小麦基因克隆带来很多困难。关联分析作为一种强大的数量遗传分析工具,已经应用于拟南芥、水稻、玉米等模式植物和作物,成功鉴定到控制复杂性状的新遗传位点。本研究尝试用关联分析的方法发掘小麦重要性状新遗传位点和优异等位变异。 供试材料为实验室收集的381份栽培种和农家种,这些材料来源广泛,来自美国农业部(United States Department of Agriculture,USDA)的种质资源库的农家种和中国与美国的栽培品种,381份小麦材料有丰富的表型多样性。于2013-2015年共3年在河北赵县试验基地四种不同氮磷水平的环境中评价了381份小麦材料,并收集了开花期、株高、籽粒蛋白含量和单株产量等表型数据。大部分小麦在减施氮肥条件下比减施磷肥条件下提前开花。与正常施加氮磷肥的情况相比,株高和籽粒蛋白含量在不施加任何氮磷肥的情况下显著下降。 用Affymetrix公司开发的Wheat660K SNP芯片对381份材料进行基因型分析,按以下标准对SNPs进行筛选:1)可以准确定位到小麦基因组参考序列IWGSC RefSeq v1.0;2)最小基因型频率不小于0.01;3)缺失率小于0.05;4)杂合率小于0.05。最后将筛选得到341,175个高质量SNPs用于群体结构分析和关联分析。这些SNPs基本覆盖了整个染色体组,但在染色体上的分布很不均匀。用主成分分析和邻接树两种方法进行群体结构分析,发现这些材料之间有明显的群体结构。 全基因组关联分析选择了MLM和FarmCPU两种模型,都加入了PCA控制群体结构。分别用两种模型对多种环境的开花期、株高和籽粒蛋白含量进行全基因组关联分析,选择显著关联的阈值为-log10(P)=5。对大田和温室条件下开花期的关联分析,分别检测到73和49个显著关联SNPs,其中包含与已知基因Ppd-D1和VRN1共定位的SNPs。对未知基因位点的染色体区段分析,发现7DS上最显著关联的SNP的上游2Mb有MADS-box转录因子,下游2Mb有一个FT基因,这两个基因很可能是该位点影响开花期的候选基因。对株高的关联分析,共检测到191个显著关联的SNPs,其中有7个相互独立的SNPs可以在多种环境中被重复检测到,这些位点间有明显的加性效应,这7个位点有3个分别与已知基因Rht-B1、Rht-D1和Ppd-D1共定位。对籽粒蛋白含量的关联分析,在不同环境中检测到的位点大都不显著并且在不同环境中重复性不高,可能是这个性状受环境影响较大。 关联分析发现一些有基因多效性的染色体区段,对大田小麦开花期、株高和籽粒蛋白含量的关联分析同时检测到与位于2D的基因Ppd-D1共定位的SNPs,另外,一段位于染色体5A的染色体片段在多种性状的关联分析中被检测到。 对开花期和株高的关联分析发现已知基因Ppd-D1、Rht-B1和Rht-D1与其共定位的显著SNPs标记之间有高度的连锁不平衡,说明用关联分析的方法发掘小麦复杂数量性状遗传位点是可行的。