生物序列比对算法研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:sjmaomaoqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多种基因组计划的逐步实施,产生的有关核酸、蛋白质序列和结构的“海量”数据,对生物信息学研究既是机遇也是挑战。企图完全通过生物实验的方法来确定所有序列的结构、功能非常困难,同时也不经济。因而利用序列比对寻找与功能未知序列同源的己知序列,用己知预测未知就显得尤为重要。在这个过程中,提高序列比对的有效性、减少运行时间和存储空间具有重要的理论意义和实用价值。本文利用动态规划、概率统计等方法对多序列比对问题进行了研究。在理论方面;提出了相对多序列比对差异性、压缩矩阵等概念;对算法中部分迭代公式进行了归纳、抽象,给出了基于压缩矩阵的表达递推形式。在算法方面:设计了具有监控机制的多序列比对遗传算法;提出了多序列比对的剖面广义相关隐马尔可夫模型。 主要工作和研究成果如下: 1.为了描述一个多序列比对是否具有某种特征统计特性,提出了多序列比对相对于某已知特征统计矩阵的代价概念,并给出了具体定义。在此基础上,定义了一组多序列比对差异性量化指标,用于种群多样性判别。 2.针对多序列比对的遗传算法中缺少利用已知种群先验信息的问题,提出了一种利用种群多样性监控、指导多序列比对的遗传算法执行步骤的比对算法。结果表明,新算法在避免局部最优解方面有较好的表现,且比对结果宜具有区块性。 3.针对剖面隐马尔可夫模型中状态转换及符号输出的特性,以及目前基于此模型的迭代表达公式过于繁琐的问题,提出了压缩矩阵、向前、向后概率向量等概念。其中状态压缩矩阵是由一个阶数为3(L+1)×3(L+1)的矩阵压缩后得到的阶数为9×(L+1)的矩阵(L为正整数),且保留原有矩阵的全部信息。显然,原矩阵阶数越大,压缩矩阵节省的存储空间就越多,为编程实现提供了节省存储空间的理论依据。此外,给出了基于压缩矩阵表示的递推关系式,使迭代过程直观化、模块化,易于编程实现。 4.针对剖面隐马尔可夫模型没有考虑输出的观测字符依赖前一时刻输出的观测字符,而生物序列中的字符实际上又不是相互独立的这一矛盾,将语音识别领域的双重分次约束隐马尔可夫模型用于多序列比对,建立了用于多序列比对的剖面广义相关隐马尔可夫模型,新模型更符合生物序列固有的特性。 5.设计并实现了一个基于Windows操作系统的序列比对系统。该系统采用VB6.0和EXCEL进行开发。系统界面友好,操作简单,有便捷的工具栏、系统菜单、帮助等模块。为研究、利用多序列比对人员提供了一个平台。
其他文献
纳米TiO_2因具有高活性、安全无毒、化学性质稳定(耐化学及光腐蚀)、难溶、成本低等优点,其应用前景极好,成为人们研究的热点。当前,人们利用纳米TiO_2光催化降解有机污染物的研究已相当多。但是对无机污染物的光催化研究也不容忽视。NO_2~-离子是一种危害较大的环境污染物,主要来源于空气中的氮氧化物,存在于空气和水中,可致癌。因此,本研究以NO_2~-离子作为目标降解物,将溶胶—凝胶法制备的掺Fe
本文介绍了聚合物纳米粒子的制备方法及其应用,综述了树枝状大分子的组成、结构以及制备方法。文章选用已经商品化的两种树枝状大分子聚丙烯亚胺DAB和聚酰胺胺PAMAM(polyamido
本论文采用新型交流脉冲微弧氧化电源,在LY12铝合金表面制备了以氧化铝为主晶相的陶瓷膜,系统地研究了陶瓷膜的组成、结构、机械和光热性能。   EPMA、EDS、XRD、SEM和TEM研
当前,整个世界经济发展缓慢,一方面传统市场萎缩,另一方面新的市场拓展难以进行。国内消费需求和出口需求增长继续走低,从而加剧了市场竞争,使企业效益明显下降,拍卖行业无可
随着教育改革的不断推进,初中物理实验教学成为教师关注的重点.大家都在积极对实验教育进行改革,以激发学生的学习兴趣.通过对学生兴趣的引导,让学生积极参与物理实验课堂,发
本文主要研究内容是大型机床铸造过程的数值模拟仿真及工艺优化。计算机数值模拟作为新兴产业已经越来越多的被铸造企业接受并应用,一般企业主要针对中小铸件进行模拟仿真,但对
学位
1981獲‘奇妙的亞洲’晝集評選第一名。香港博雅藝術公司出版(徐希畫選)1982作品‘湖上晨曲’獲第八届國際繪畫展大獎1985作品‘江南喜雨固’獲日本世界博覽會三等獎。1988被
本文是在国家科技支撑项目和新疆维吾尔自治区“十二五”科技重大专项的支持下,具体研究方法是由理论分析确定试验方法与技术路线,对试验区两年的数据进行整理与分析,最后利
氮化硅陶瓷具有优良的高温力学性能,是很有发展前途的结构陶瓷材料,研究氮化硅陶瓷的连接具有十分重要的理论和实用价值.该文利用Cu-Zn-Ti和Cu-Pd-Ti两种钎料来钎焊连接氮化