系统发育树构建的关键技术研究与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:radarcauc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近20年快速积累的基因和基因组信息为生命之树的构建奠定了重要基础,在多源数据的获取过程中,目前主要是依靠研究人员手动获取,大大降低了科研人员的效率。另外一方面,急速膨胀的基因组信息对系统发育分析的构树算法的性能提出了更高的要求,在保持构树算法精确度的基础上,需要能够计算更大规模的基因序列。因此对于系统发育分析而言,序列数据的自动采集和更高效的计算方法成为其迫切需要处理的问题。   本文以达尔文树(DarwinTree)平台为基础,分析和总结了DarwinTree一体化流程中的关键技术,并针对存在的技术难点进行研究、设计与实现。论文的主要工作和贡献是:   1.设计了序列自动采集流程,其中涉及到序列采集驱动方式、数据清洗规则的设定,以及序列日更新的实现。   2.设计了分类系统数据模型以实现物种与序列数据的关联,提出了快速建立私有分类系统的算法流程,通过添加计算分类系统树的节点信息来加速序列提取的速度。   3.深入研究和分析了一系列的构建系统发育树的算法,重点研究了适应于大规模序列的PhyML、RaxML和FastTree算法,分析总结了各种算法的精确度和效率;在此基础上对FastTree算法进行改进,提出了FastTree+算法,并通过实验验证FastTree+算法在效率上优于FastTree算法。   通过本文的研究,解决了DarwinTree平台的序列自动采集和提取问题,同时为计算模块的构树工具的集成提供参考依据,使得平台能够计算大规模序列,从而提高DarwinTree平台的整体效率。
其他文献
湖北荆能输变电工程有限公司(以下简称荆能公司)属建安企业性质,安全责任大于天,基建安全是荆能公司的头等大事,如履薄冰,头悬利剑.近年来,荆能公司积极探索临时党支部建在一
在UMU平台的基础上,加强生理学的深度学习理论运用,重点是需要教师充分的运用这种教学的效果,掌握学生学习的兴趣点和平台的特征.教师要基于这一平台鼓励学生通过自主学习以
我国经济实力的提升带动了供电企业的发展,不过这也因此导致企业内部的腐败问题日益突出.因此对于供电企业来讲,要对重点岗位进行监督,同时做好员工的思想工作,把监督工作列
人体运动捕获技术应用范围广泛,包括医疗和健康监测、舞蹈和体育运动分析、电影动画特效和虚拟现实游戏、士兵训练和战场模拟等。基于微型传感器的人体运动捕获技术,由于其不受
随着我国道路运输业迅速发展,行业能源消耗规模逐年上升,节能减排任务艰巨.为了做好节能减排工作,本文剖析当前道路运输节能减排面临形势、存在的问题,提出推进运输结构调整
近年来,统计机器翻译取得了很大的发展。基于短语的翻译模型和层次短语翻译模型被广泛用于机器翻译评测和在线翻译系统中,成为统计机器翻译的主流技术。同时,基于混淆网络的系统
本文以桃源县职业中专2019年省职业教育教改项目《中职英语对分课堂研究》(项目编号:ZJZB2019091)进展为例,结合团队成员和部分一线中职英语教师的教学体会,中职英语课堂受各
淄博矿务局针对矿区衰老,困难职工多的实际,坚持把搞好扶困工作,帮助困难职工脱贫解困和解决好他们的实际生活困难作为调动保护和发挥职工积极性,推动改革,促进发展,维护稳
本文围绕公路体制改革过程中职工思想政治工作的重点及思路分析为课题进行阐述,主要讨论了树立双向政治观念,建设并完善实效性的思想机制,加速公路文化建设,提出良性公路体制
本文通过对荣华二采区10