基于全蛋白质组的系统发生学:组分矢量方法

来源 :中国科学院理论物理研究所 | 被引量 : 0次 | 上传用户:aiwuziji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们提出了一个用以推断生物系统发生关系的新方法——组分矢量方法.它以物种的全蛋白质组作为数据集,通过比较物种间的氨基酸短串频度差异来构建亲缘树.该方法避开了序列联配在全基因组应用中所遇到的困难和基因选择的主观性,而且仅有唯一一个"参数"——氨基酸短串的长度K,它相当于某种分辨率.基于组分矢量方法所得到的原核生物亲缘树与《伯杰系统细菌学手册》(第2版),即2003年第4次发布的细菌系统分类大纲相当一致.我们还把该方法应用到叶绿体基因组的比较以及包含人类SARS病毒的冠状病毒分类中,均得到了较好的结果.组分矢量方法的关键步骤和创新之处在于:从短串的实际出现频数中扣除了随机背景,它起到突出自然选择压力带来的偏好性的作用.本文将详细讨论有关扣除随机背景的步骤和意义,以及组分矢量方法在各类物种完全基因组中的分类上的应用.本文包含以下几个部分:第一章(引言):本章回顾系统发生学是如何从基于表型的分析过渡到分子进化研究的.第二章:本章首先详细讲述组分矢量方法的细节,然后是该方法在原核生物亲缘关系研究的应用,最后讨论扣除随机背景的作用.第三章:本章主要讨论组分矢量方法在叶绿体分类中的应用.在分类结果中,叶绿体整体作为一个大的分支,与真细菌中的蓝细菌门聚集在一起.这个结果与叶绿体的一级内共生学说相符合.第四章:使用组分矢量方法,并结合外类群的适当选取来研究冠状病毒的分类,其结果表明人类SARS病毒和以哺乳动物为宿主的第二组冠状病毒亲缘关系最近.第五章:超度规是分类学中的一个重要概念,本章将对这一概念以及如何对矩阵进行超度规化的方法作详细的介绍,还将解释超度规与阶层树状结构的等价性.第六章:在本章中,我们使用蛋白质家族取代全基因组构造原核生物的亲缘树.基于核糖体蛋白质家族与氨酰tRNA合成酶家族两组数据得到的结果都与使用全蛋白质组的结果在很大程度上相一致.第七章:我们为组分矢量方法构造了一个服务器,以使之可以在网络上提供计算服务.本章主要介绍该服务器的实现和使用方法.第八章(结论):在本章中对组分矢量方法和应用作简短的回顾,以及对该方法的展望.
其他文献
随着计算机和网络技术的迅速发展和广泛应用,系统安全的重要性已受到相应重视.在此入侵检测则是安全体系结构的首要组成部分.但面对日益更新的网络环境和层出不穷的攻击方法,
准一维纳米材料及其有序阵列体系具有许多奇异的物理和化学性质,在纳米器件功能化和集成化等领域具有重要的潜在应用前景,已成为当前纳米材料科学研究的前沿和热点.低维半金
原子力显微镜是凝聚态物理实验中的重要仪器,在表面科学、纳米技术等领域有着广泛的应用。除了实现表面原子成像和单原子操纵外,利用针尖与样品间相互作用,我们可以对样品的应力
本论文工作分两部分;第一部分生物膜的形状和力学稳定性研究这一部分旨在用现代微分几何理论讨论闭合磷脂双层膜,开口磷脂双层膜,两相磷脂双层膜和含有蛋白质交联结构的细胞
该文研究了多体复杂系统中具有代表性的两个例子,即世界股票市场的关联性和辐射效应对一维系统的热传导行为的影响.在世界股票市场的关联性研究中,我们利用本征值和本征矢量
光学全息存储是一种可实现并行读写的海量存储技术,已成为当今存储技术发展的主导方向.全息技术的应用在很大程度上取决于存储材料,掺杂菲醌(PQ)的聚甲基丙烯酸甲酯(PMMA)材
该论文首先介绍了原子核高自旋态研究的一般概况以及其物理解释的基本理论,然后介绍了在束γ谱学及其实验技术.在此基础上分析和讨论了Rn核的高自旋态实验研究.利用能量为85M
近年来,表面和界面优异的催化特性引起了人们广泛的关注。理解表面和界面催化反应的机制,对设计新型催化剂和优化现有催化剂的性能至关重要。本人使用基于密度泛函理论(Density Function Theory,DFT)的第一性原理计算方法,研究了金属表面/界面氢气解离和卟啉类分子内环化的反应机制,设计了基于金属和低维纳米材料表面的催化剂模型,并提出对其催化性质进行调制的策略。一、设计了一种氢气分子解离
金属氮化物通常具有超硬、高熔点、化学惰性、高热导性等优越性能,在诸多领域有着广泛应用,基于金属氮化物的超导材料,由于高硬度和较高超导转变温度(Tc)共存,从而被认作为一类具
阳离子-π作用在分子识别,酶催化反应,蛋白质分子结构的稳定,药物设计,生物膜等许多过程中起着非常重要的作用。这种相互作用广泛存在于阳离子与π电子丰富的碳基材料,如芳香环,碳