DNA序列数量图形表示及其应用

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:stonefountain
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划(HGP)的顺利完成和进一步深入标志着生命科学已步入后基因组时代。基因和蛋白质已成为现代生命科学的主要研究对象。科学家们将着重于研究DNA序列信息、蛋白质结构信息以及它们之间的相互作用。破译每一水平的生物信息提出了与基因或蛋白质有关的统计和组合数学问题;生物信息的急剧增长也带来了对计算机科学的挑战。为此,计算分子生物学和生物信息学便应运而生。这两个‘孪生’的学科,不仅具有重大的科学意义,而且具有巨大的经济效益。它们已成为当前生命科学中最关键、最重要的部分,也是21世纪自然科学的核心领域之一。在本文绪论部分里,概述了生物信息学产生的历史、产生背景和理论意义,简单叙述了其研究对象和主要研究内容,并介绍了一些生物学的简单知识。   1983年Hamori和Ruskin提出了DNA序列图形表示的思想——将DNA序列投影到一条平面或空间中的曲线,自此国内外不少专家学者如M.Randic,A.Nandy以及国内郭晓峰、王天明等人提出了众多的图形表示法。我国著名理论物理专家张春霆院士也提出了一种DNA序列几何图形表示——Z曲线,天津大学生物信息中心用这种思路研究了真核和原核基因组中若干重要问题,证明这样的思路是切实可行的。综合所有数量图形表示方法,根据其对应的空间,分为二维(2D)图形表示法、三维(3D)图形表示法和高维数量图形表示法。   针对现有的图形表示法的缺点:(1)DNA序列对应的图形上存在重叠和回路,导致退化现象,容易造成生物信息的丢失,(2)由于碱基初始定义不同,导致对应图形不唯一;我们在第二章中分别提出了一种新四维数量图形表示法和一种新三维图形表示法。这两种方法都很好地避免了退化现象的产生,而且新四维数量图形表示方法具有唯一性,三维图形表示法只对应两种图形,明显少于其它图形表示法,在一定程度上减少了计算量。   第三章给出利用新图形表示法计算序列相似性的方法,首先利用图形表示法构造特征矩阵并计算矩阵不变量(特征值),用该不变量组成向量,最后通过计算两个向量终点的欧式距离得到相似性数据。我们结合第二章提出的两种新数量图形表示方法,针对十一种生物的β-globin exons-1基因与十一种灵长类生物的线粒体DNA序列进行了相似性计算和分析。比较了本方法与其它方法的结果,说明了这种方法的有效性并分析了产生误差的可能原因。   第四章给出了一种构建系统进化树的方法。该方法以我们提出的新的数量图形表示法为基础,将序列数值化,并以核苷酸替代数作为进化距离矩阵构建系统进化树。在这种方法下,我们分别构建了七种和十一种灵长类生物的进化树。比较了用PHYLIP软件以及张玉森等构建的进化树与我们构造的进化树之间区别,验证了本方法的有效性。   第五章探讨了我们的新数量图形表示法在分子生物学中的其它应用。分别给出了关于DNA序列核苷酸替代数计数方法、核苷酸含量计数方法。最后探讨了数量图形表示方法在RNA序列的图形表示和结构相似性分析方面的应用。   最后一章总结全文,阐述了我们所做的工作以及取得的成果,并提出了未来的工作方向以及需要解决的问题。
其他文献
图像分割是很多高级图像处理技术(如可视化、图像压缩、医学图像诊断等)的重要基础工作。迄今为止,已经有很多种不同的图像分割方法提出。阈值法因其实现的简单性而成为图像分
本文主要是研究如下的三个问题的解的大时间行为:   一,带人工粘性的p-系统的初边值问题:公式略这里v(t,x)>0,且v±(>0)和u±是已知的常数.p(v)∈C3(0,∞),p(v)<0,p"(v)≥0.当(v±,u±
学位
一、引言语文,作为小学阶段的最重要的基础课,不仅是学生学习的一门课程,也是学习其他课程的基础,所以学好语文,不仅影响的是语文学科本身,对于其他科目也有重要意义。虽然我
20世纪以来中国改革开放的深入发展,我国与国外的交流不断地加深,这带给我国的不仅仅是经济上的新生机会,也是我国科技的再次飞跃——计算机和网络技术的广泛运用.随之而来也
在教学实践中,我发现不少的小学生对作文的态度基本上是厌恶、编造、惧怕,把作文当成是学习中的头等苦差事。如果不扭转这种情势,学生语文素养的形成将受到严重阻碍,更谈不上
股指期货是一种重要的金融衍生品,是为了投资组合避险的目的才产生的。但是股指期货市场中并非只有避险交易者,还有套利者和投机者,他们也是股指期货的重要参与者,本文重点讨论股
本文主要研究了两个方而的问题:其一是在制造商和零售商之间存在非对称信息条件下,为满足顾客需求零售商如何快速地购得货物的问题;其二是订单装配系统中库存费用有限条件下顾客
学位
考虑一个金融市场模型,其中标的股票由一个Léw过程和常数利率驱动。那么,永久看涨期权价格的闭形式解由此Lévy过程的整体上确界表示;相应地,永久看跌期权价格的闭形式解由此Lé
设图G=(V(G),ε(G))为简单无向图,其点集和边集分别记为V(G)和ε(G)。令图G的顶点个数为n,分别记为v1,v2...vn。图G的邻接矩阵A(G)=(aij)是一个n阶方阵,其中若点vi和vj有边相连,则aij=1;若没有边相连,则aij=0。图G的能量是指该图的邻接矩阵的所有特征值的绝对值之和,我们用符号E(G)表示。图的能量的研究是化学图论中的一个重要的课题,该课题的一个主要研究方
学位
本文分别讨论了脉冲时滞的抛物型和双曲型方程及方程组在不同边界条件下解振动的充分和充分必要条件.其中分别利用了积分不等式法结合特征值法、比较方法、Green公式、Jesen不