基于gap填补的油菜参考基因组升级及泛基因组构建

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:linlinlin123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
甘蓝型油菜(Brassica napus L.)是主要的油料作物之一,在驯化和育种过程中产生了广泛的变异,高质量的参考基因组对于挖掘农艺性状相关的遗传变异、推动品种改良具有重要意义。油菜是异源四倍体,有复杂的基因组结构,受限于测序读长,已发表的油菜参考基因组上仍然存在大量的组装错误和gap区域,单个品种的参考基因组也不具有广泛的代表性,给基因定位克隆和更加深入的比较基因组学分析造成了困扰。本研究中,我们用Nanopore超长读长测序技术对已发表的中双11(ZS11)参考基因组进行升级,纠正了组装错误,填补了存在的gap。此外,为了更全面了解不同品种间的遗传变异,我们对中双2(ZS2)等6个具有代表性的甘蓝型油菜品种进行了Pac Bio测序和de novo组装,结合已发表的多个参考基因组构建了甘蓝型油菜泛基因组。主要研究结果如下:1.对ZS11分别进行了两次建库测序,第一次构建了Nanopore Ligation 1D文库,测得reads平均读长为11.82 Kb;第二次构建了Nanopore Ultra-long reads测序文库,测序平均读长达到了38.24 Kb,共有64条reads长度大于500 Kb。两次测序数据总量为92.75 Gb,组装得到990.60 Mb序列,contig N50为43.36Mb。2.通过Nanopore组装得到的contig与已发表的ZS11参考基因组比对分析,发现参考基因组上contig末端的组装错误率高于contig内部。比较发现,ZS11参考基因组的gap共有4种基本类型:(1)gap区域代表了参考基因组中序列缺失;(2)gap两侧的序列重复;(3)gap处存在一个(或多个)不正确放置的较小contig;(4)gap一侧(或两侧)组装错误。结合ZS11参考基因组上gap的上述特征,我们开发出一套自动化gap填补流程。经过运行gap填补流程和人工校正,最终填补了ZS11参考基因组上4,398个gap,占总数的98.39%。升级后的ZS11参考基因组大小为999.57 Mb,仅剩72个gap,contig N50达到了55.94 Mb,是现有油菜参考基因组中最大的。最后,我们使用Illumina PE150 reads对升级后的参考基因组进行了6轮polish纠错。3.我们用多种方式评估了基因组升级的准确性和完整性。(1)将Illumina reads比对到升级后的ZS11参考基因组上,比对率从96.90%提高到97.43%,反映出升级后的参考基因组具有很高的碱基准确性。(2)在升级前参考基因组gap两侧及潜在的组装错误两侧共设计了100引物,成功扩增并测序83个PCR产物,Sanger测序结果与升级后的参考基因组完全一致,证明本研究的纠错及gap填补过程是准确可靠的。(3)从ZS11的BAC文库中随机挑选9个BAC并混合测序,组装出8条完整的环状BAC序列。本研究组装出的BAC序列和已发表的11个油菜BAC序列均能完整地比对到升级后的ZS11参考基因组上。(4)升级后的ZS11参考基因组上BAC末端序列(BAC-end sequences,BESs)距离分布的变异系数较升级前更小。(5)BUSCO分析表明基因组完整性由98.88%提升到99.09%。4.本研究对升级前后ZS11参考基因组的注释结果进行了详细的比较分析。升级后的ZS11注释到55.82%的重复序列,比升级前注释到更多类型的DNA转座子。升级后共注释到101,115个蛋白编码基因,比升级前多196个;注释到基因的平均长度为2,709.03 bp,比升级前长502.27 bp;升级后注释到了更多的多外显子基因,有更多的基因获得了UTR信息。在升级后ZS11参考基因组的19条染色体上都鉴定到了着丝粒区域,A亚基因组着丝粒平均长度为9.51 Mb,是C亚基因组的2倍。升级前着丝粒区域有个2,637个gap,而升级后着丝粒区域仅有14个gap,15条染色体获得了没有gap的完整着丝粒序列。在升级后的15条染色体末端鉴定到了端粒序列。5.我们对6个具有代表性的油菜品种(中双2号(ZS2)、Bugle、352、862、日本油菜(Ribenyoucai)和白花(Baihua))进行了Pac Bio测序,组装得到824.77-949.56 Mb序列,注释到90,960-98,777个基因。我们还收集了近年来通过三代测序组装得到的9个高质量油菜参考基因组,比较分析发现15个基因组分别有8.20-15.30 Mb序列在ZS11上不存在,通过向ZS11参考基因组添加15个基因组的存在缺失变异(Presence and absence variations,PAV)序列,构建出大小为1109.12 Mb的油菜泛基因组。对来自16份甘蓝型油菜注释基因集的蛋白序列聚类,得到102,720个同源基因簇,其中核心基因簇、可变基因簇和稀有基因簇的个数分别为33,763(32.87%)、66,196(64.44%)和2,761(2.69%)。
其他文献
土壤侵蚀威胁全球粮食安全,影响生境质量,阻碍可持续发展。随着粮食需求增长与耕地土壤保护的矛盾日益凸显,防治耕地土壤侵蚀已成为农业生态领域热点问题。各国粮食需求通过农产品贸易得到满足的同时导致耕地土壤侵蚀压力的潜在转移,致使本地发生的侵蚀与异地农产品消费之间存在空间分离现象。明确国际农产品贸易对全球耕地土壤侵蚀的影响对于深入理解土壤侵蚀演变机理、提出合理的侵蚀治理策略意义重大。本研究以2017年全球
学位
病毒流行不仅严重危害人类的健康,而且造成巨大的经济损失,发展抗病毒药物是控制病毒流行的主要手段之一。金属纳米材料具有抗病毒活性及良好的生物相容性,未来有望发展成为新一代的抗病毒药物。如何进一步提高金属纳米材料的抗病毒效果是当前需要解决的一个关键问题。本论文以中药活性成分(甘草酸(GA)、姜黄素(Cur))为修饰试剂,合成了甘草酸修饰的金纳米粒子(GA-Au NPs)及姜黄素修饰的铜簇(Cur-Cu
学位
随着现代社会的不断发展,化石燃料的使用不可避免地造成了环境污染以及能源危机等问题,所以亟需开发绿色、经济以及高效的新型能源来替代化石燃料的使用。氢能源具有来源广泛、危险系数小且二次燃烧无污染的优点,是新型能源的最佳选择。光电化学(PEC)分解水制氢是目前最具潜力的制氢方案,其利用水资源与太阳能这类十分丰富的资源;产物主要为氢气与氧气,对环境无污染。因此,光电化学(PEC)分解水受到了研究者的广泛关
学位
抗生素抗性基因(Antibiotic resistance genes,ARGs)广泛分布于土壤、水体和空气等环境介质中,在近年被国内外环境科学家定义为一种新型环境污染物,严重威胁着全球生态安全。传统畜禽养殖模式高度依赖抗生素,使畜禽肠道微生物选择出高丰度和高多样性的ARGs,其通过养殖粪污或粪肥扩散进入自然环境,促进了环境中ARGs的蓄积。我国自2020年实行饲料禁抗,但近年在饲料禁抗实践中却发
学位
积分器在模拟电路和脉冲数字电路中扮演了重要角色,它的功能包括实现波形转换,相移以及消除失调电压等等。然而,运算放大器所引入的零点漂移以及电容器的充放电过程中产生的固有泄漏误差,使得传统的电阻-电容积分器(RC积分器)无法胜任较长时间内的高精度的积分运算工作。为了解决这一问题,许多基于RC积分器的改良方案被设计并广泛使用在托卡马克装置的积分电路中,但这些改良方案的代价是更复杂的电路和更高的功耗,并且
学位
内毒素是一种外源性致热原,进入机体易导致炎症、发热等症状,严重时危及生命。因此,在环境、食品以及医药等领域对内毒素进行检测和去除显得尤为必要。建立内毒素的检测和去除方法离不开良好的亲和试剂。聚合物纳米颗粒作为一种高比表面积,高吸附能力的亲和试剂在生物分子的检测和去除方面应用广泛,其优越性能取决于侧链结构中的功能单体。核酸适配体作为一种高吸附力,高特异性的亲和探针已经应用于内毒素的检测。因此,本项目
学位
通过活化过硫酸盐(PDS/PMS)产生SO4·﹣可以显著去除水体中污染物质,但该工艺的固有缺陷限制了其广泛使用。例如,其成本太高;过硫酸盐较稳定,残存于处理过后的水体中,可能会引发未知的生化反应,对环境具有毒害作用;活化的催化材料多具有环境毒性。近年来,运用亚硫酸盐产生SO4·﹣降解有机污染物成为研究热点。与过硫酸盐相比,亚硫酸盐造价便宜,在环境水体中可以直接与溶解氧反应进而被完全消耗,对水体生态
学位
不同豆科物种种子贮藏物质含量差异较大,大豆和鹰嘴豆种子平均含油量分别为20%和6%,平均淀粉含量分别为2%和44%。种子油脂和淀粉生物合成所需的底物大部分均来自以糖酵解为主的碳代谢产物,深入挖掘导致大豆和鹰嘴豆种子油份和淀粉含量差异的可能分子机制,对改良大豆和鹰嘴豆种子含油量和淀粉含量及其组成具有重要经济价值。目前,关于大豆油脂和鹰嘴豆淀粉的合成相关基因及其调控机制研究比较匮乏,特别是microR
学位
氮在茶树全株中的含量约占干重的4.5%,是游离氨基酸、咖啡碱等茶叶品质成分的重要组成部分。然而,高水平施氮对环境有负面影响,因此,选育氮高效茶树种质是提高茶园氮利用效率的根本途径。自噬在植物体内氮循环中起着关键作用,具有提高氮利用率的潜力,许多自噬相关基因ATGs参与了自噬过程。本研究首先明确了自噬基因和蛋白在茶树不同成熟度叶片中的表达。然后从茶树基因组中鉴定出ATG3亚家族的两个同源基因,CsA
学位
随着科技的进步和人类社会的发展,能源危机与环境问题备受人们的关注。为解决这些难题,寻找高效、清洁和资源丰富的可再生能源是人类亟需完成的任务。光电化学(PEC)分解水是一项依靠太阳能和电场驱动,且不需要消耗化石燃料的具有前景的技术。在众多光阳极材料中,二氧化钛(TiO2)具有廉价无毒、生物相容性良好、合适的能带结构等优点。但其可见光吸收率低,载流子快速复合等问题限制了TiO2在光电化学分解水中的应用
学位