基于深度学习模型的根系微生物组数据和植物产量的关联分析

来源 :中国科学院大学(中国科学院武汉植物园) | 被引量 : 0次 | 上传用户:yuexianglian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微生物组是指包括细菌,真菌,古生菌,低等真核生物,病毒等微生物的基因和基因组。植物微生物群落定殖于植物器官内和植物表面,某些特定微生物群落具有宿主偏好性,只定殖在某些特定类群或者特定器官,例如根际微生物群落只在植物根表面狭窄区域内受到植物分泌物等影响而形成。微生物群落在植物生长和植物抵抗胁迫方面发挥着重要作用,同时环境,植物的遗传因素和代谢调节可以塑造和影响群落。微生物群落与宿主的互作关系,比如遗传物质、代谢产物的交流等相关研究已经成为当前的研究热点。随着高通量测序技术以及生物信息学分析手段的发展,利用组学分析角度研究微生物群落以及群落与宿主的关系已经成为当前研究趋势。这使得研究不再局限于孤立地研究某些特定已知的微生物,更容易地发现具有重要功能价值的遗传信息。研究核心微生物组组成及其与植物宿主互作关系,我们可以最大限度地利用微生物组学数据,提前预测宿主表型,帮助植物在生物或非生物胁迫下实现产量的提高。深度学习方法在处理复杂、稀疏、有噪声、高维的数据方面具有强大的能力,可被应用于阐明微生物组与宿主表型的互作关系。然而相关研究尚处于起步阶段。首先我们对深度学习方法在关联研究分析的应用进行了调研。通过对相关文献搜索调研,系统总结并比较了目前微生物组数据处理的分析策略和关键步骤,讨论了在植物-微生物组相关分析和预测任务中可用的现有模型,并阐明了模型的优势。我们探讨了深度学习方法在关联研究模型构建和生物学意义解释方面的优越性,也讨论了模型在数据分析的流程中的作用和优势,并撰写了综述。此外,我们以根际微生物和植物产量能力之间的关联为研究对象,基于小米的有类别标签的产量数据,获得研究中的微生物丰度统计数据,采用了卷积神经网络对基于植物微生物丰度特征数据的小米的产量能力高低进行预测,用交叉验证和多模型比较的方法来测试模型,模型精度最高可达到70%,该深度学习训练平台搭建在本地GNU/Linux操作系统服务器中,基于Tensorflow v1.14.0(CPU版本),keras2.0.8和theano1.0.1,python3.5.6等环境,该研究为植物微生物组数据进行宿主表型关联研究提供了新的视角。本论文调研了目前植物相关微生物组数据的研究策略,总结了关联和预测分析任务的一些关键步骤的深度学习方法的工作,提出了建模中存在的问题并撰写了相关综述,为深度学习方法在宿主表型关联研究分析的应用提供了参考。同时,我们采用了卷积神经网络对基于植物微生物丰度特征数据的小米的产量能力高低进行模型构建与预测,也为研究植物微生物组数据进行宿主表型关联研究提供了新的范例。
其他文献
氮是所有生物体不可或缺的组成元素,适量的氮素在湿地中为生物提供营养并维持着湿地生态系统的正常运转。高负荷的氮素通常导致湿地营养过剩,引发湿地生态系统失衡,严重威胁人类生存与健康。氮素循环主要是由微生物驱动,因此揭示氮循环微生物的多样性、生物地理分布及其群落构建机制显得尤为重要。近些年来,人们一直围绕着微生物群落的生物地理分布模式、生物多样性格局以及群落构建机制开展研究,且已取得了初步进展,但对湿地
树木分布海拔范围上限(upper elevational tree limit)作为一类生物群落交错区,是植被能够在较短的空间距离内发生剧烈变化的区域,其对于气候变化非常敏感。本研究以树木分布海拔上限为研究对象,分别在两种不同尺度上进行分析研究。局域尺度上,本研究在秦岭地区沿海拔梯度针对三种树木[即树线树木落叶针叶树太白红杉(Larix chinensis)以及树线之下的常绿针叶树巴山冷杉(Abi
草地生态系统是陆地生态系统重要组成部分,在碳(C)和氮(N)循环过程中起着重要作用。我国三峡地区次生草地由于气候变化和人类活动(森林砍伐)极大地影响了其生态系统功能,从而改变了短期土壤有机质(soil organic matter,SOM)的周转和氮的转化,以及长期的碳和氮的固存。同时,土壤CN动态和酶活性密切相关,并且受气候、生物和土壤条件等多因子的影响。但是在三峡地区次生草地,对SOM组分、N
树木沿海拔分布的上限归根结底是一条物种特异性的低温界限,它的形成与维持是物种对长期低温的生理生态适应结果,然而到目前为止,基于碳“源-汇”平衡来揭示不同功能型树种海拔上限形成的生理机制尚不清楚。本研究以秦岭三种不同功能型树种(阳生落叶阔叶树、耐阴常绿针叶树、喜光落叶针叶树)海拔上限为研究对象,通过原位对照试验和室内模拟增温试验的结合,来探讨树木非结构性碳水化合物(Non-structural ca
苔麸(Eragrostis tef)是埃塞俄比亚种植最广泛的谷类作物之一,具有重要农业价值,同时也是一种在全球广受欢迎的健康食品。埃塞俄比亚生物多样性研究中心基因库中已保存了从不同的农业生态区域中收集的大量苔麸种质资源,然而,目前对这些种质资源的基础生物学研究十分有限,其遗传变异水平及地理分布模式、农艺性状的遗传学基础等仍不十分清楚。全基因组关联研究和开发高分辨率的分子标记对于Eragrostis
位于肯尼亚的阿伯戴尔山脉(Aberdare Ranges)孕育着典型的热带山地森林,是非洲最重要的自然保护区之一。在过去的一个世纪里,这片森林一直被各种因素干扰、破坏,但它的植物种类仍然十分丰富,还有许多珍稀特有植物。因此,此地被列入热带东非山地生物多样性热点地区,是世界上36个生物多样性热点地区之一。然而,有关于整个阿伯戴尔山脉的维管束植物区系和分布模式的研究工作却很少。本研究以肯尼亚中部高原阿
南迪森林(Nandi Forests)位于肯尼亚裂谷省卡卡梅加森林以东的南迪悬崖顶部,它是几内亚-刚果雨林最东部残余的重要组成部分,具有丰富的生物多样性,被认为是非洲山地生物多样性热点地区的一部分。同时它具有重要的生态价值,如涵养水源,为生物提供宝贵的栖息地,为境内流域生态提供保护,同时也起着碳汇的作用。由于大面积栖息地的丧失和频繁的人为活动,加上气候变化的影响,南迪森林处于物种灭绝危机的最前沿。
泽泻目是单子叶植物基部类群之一,该目包含了14科166属的水生植物,分布于世界各地。泽泻目是水体环境中重要的初级生产者,是水生动物的食物,其中一些植物,如水鳖科、泽泻科、花蔺科和水蕹科的一些物种可以作为水族馆和户外花园中的观赏性水生植物。泽泻目中的水生植物具有形态复杂多变等特点,长期以来,该目植物的分类鉴定一直存在困难,其系统发育等问题也一直存在争议。植物叶绿体基因组DNA序列及结构变异等能为解决
Streptocarpus ionanthus(苦苣苔科:海角苣苔属)是坦桑尼亚和肯尼亚特有的草本植物,分布在坦噶,莫罗戈罗和基利菲地区。该物种包括九个密切相关的亚种,亚种之间有着复杂的形态特征和尚不明晰的演化关系,导致该物种复合体一直以来在分类处理上未能达成一致。悬而未决的物种界定使得弄清其种下分类单元之间的亲缘关系变得复杂,这又严重影响了对这一濒危物种保育工作。同时Str.Ionanthus也
生物多样性的本底资料及其自然分布式样,以及影响生物多样性的内在机制,对生态系统的研究和保护至关重要。然而,相关资料不足,妨碍了人们对生物多样性相关问题产生的原因以及重要性的认识,甚至难以避免生态系统的进一步损失。若某一地区缺乏对动植物区系详尽的清查,很难确定该地区受到威胁的生物资源。东非沿海森林是一个独特的生物地理区域,有多样的特有动植物群,因此被确定为世界生物多样性热点地区之一。然而,该地区植物