论文部分内容阅读
杂种优势是一种普遍而复杂的生物学现象,其遗传分子基础一直是农作物遗传学家研究的热点。两优培九(LYP9)是中国水稻育种学家育成的超级杂交稻,其产量比推广种植稻高出了15%;还表现出其他优异的农艺性状,如生长势、抗逆性强等。本论文主要介绍了采用新注释策略对超级杂交稻LYP9及其亲本九个样本的SAGE转录组数据的重定位和结果分析,从转录组水平寻找子代和亲本间差异表达的基因;及后续杂种优势相关候选基因数据库的构建工作,为揭示杂种优势的分子机理奠定了基础。
我们结合目前已有的LYP9的父本93-11和母本PA64s的基因组序列、基因注释数据,以及公共数据库中全长cDNA、EST、UniGene数据,通过构建评估数据集进行数据评估,设计了新的SAGE标签注释策略,重新对已有SAGE转录组数据进行注释。最后我们新注释了10,268个标签,共达到20,595个标签。还检测到1,216个显著差异表达(p<0.01)的基因,分布在12种不同的表达模式中,其中新检测到469个显著下调的基因主要与信号传导和蛋白质加工有关。另外我们还检测到一组与雄性不育相关的基因显著上调。芯片数据的平行验证表明:69%的基因,在子代和父母本间表达变化的趋势是一致的(spearman coefficient=0.479,p<0.0005)。通过数据的挖掘使我们对水稻杂种优势相关基因有了一个更全貌的认识,为进一步探索其分子机理奠定了数据基础。
随着高通量测序技术的发展和不同农作物杂种优势的研究,通过比较杂交种与亲本间基因表达产物的差异,越来越多的杂种优势相关的基因已经被发现。但目前还没有一个专业的数据库来搜集、整理、存储这些数据。我们整合了北京基因组研究所用SAGE和芯片技术对超级杂交稻组合杂种优势研究中检测到的显著差异表达基因,同时还搜集了公共数据库及文献中报道的其它物种的信息,构建了杂种优势相关基因的数据库HRGD。我们还根据数据分析需要开发了功能注释、表达模式分析、染色体分布、多序列比对等分析工具,提供了功能强大的search功能模块和可视化视图,可以使用户通过设定各种组合的选项得到自己所需数据。使寻找和杂种优势形成有关的基因或基因群,进一步探索杂种优势与基因组结构和组成的关系,与基因表达和调控的关系,从整体的分子水平上了解杂种优势形成的机理成为可能。