生物序列比对的并行计算以及启发式算法

来源 :扬州大学 | 被引量 : 0次 | 上传用户:java_xz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学以计算机、网络为工具,用数学等科学理论、方法和技术研究生物大分子,主要包括脱氧核糖核酸(DNA)和蛋白质(Protein)的序列、结构和功能。生物序列的比对,是生物信息学中最基本、最重要的操作,在序列分析、基因识别、蛋白质结构预测、生物进化树的构建等领域中有着广泛的应用。通过序列比对可以发现生物序列中的功能、结构以及进化信息。在本文中,我们提出了可重构光总线并行计算模型LARPBS模型上的一个快速可扩放的双序列比对并行算法,以及用蚁群算法求解多序列比对问题的三种不同方法,并给出了该方面工作的进一步研究思路。生物序列的信息量很大,对其进行比对操作需要花费大量的计算时间,所以,序列比对的并行计算已经成为研究的一个热点问题。我们利用可重构的光总线并行计算模型LARPBS,设计了一个快速可扩放的双序列比对并行算法,对于长度为m、n的两个序列,该算法使用p个处理机可以在O(mn/p)时间完成序列的比对计算,这里,p满足1≤p≤max{m, n}。该算法允许通过对p的选取来调节处理机的个数和时间复杂度,使得算法不仅在计算时间上达到最优,而且具有很好的可扩放性。由于生物序列较长,求解序列比对特别是多重序列比对的计算复杂度较高。可以证明,即使对于最简单的计分函数,寻找最优的多重序列比对也是一个NP-完全问题。在实际计算中不太可能用精确的算法求得多重序列的准确比对,而只能用启发式的算法在合理的时间内求得近似解。本文研究了对生物序列如何用启发式的算法,在综合考虑解的正确性以及计算速度两方面因素的前提下,求得质量较高的多序列比对。我们设计了多重序列比对的蚁群求解算法Ant-Align,利用人工蚂蚁逐个选择各个序列中的字符进行配对。在算法中,蚂蚁根据信息素、字符匹配得分以及位置偏差等信息决定选择各序列中的字符的概率,通过信息素的更新与调节相结合的策略,以及参数的动态自适应调节方法,有效的解决了局部收敛的问题,加强了算法寻求全局最优解的能力。针对Ant-Align算法在比对较长序列时正确性下降的问题,我们设计了基于分
其他文献
本文主要研究基于有限字符集(如QPSK调制信号)的MIMO系统盲均衡算法。具体内容如下: 第一章概括介绍MIMO盲均衡的方法。 第二章简单介绍了基于高阶统计量的恒模算法(CMA
实体链接工作已经取得了较多的关注,其工作目的是将文本中的实体指称链接到知识库中对应的实体。大部分实体链接工作都是针对论坛或者博客的长文本信息,然而微博作为一种新的社
由于市场竞争的加剧和客户需求的快速变化,制造企业,特别是开发生产大型复杂产品的企业,对产品结构定义和配置管理提出了新的要求,而基于PDM构架的产品结构定义和配置管理是
近年来,由于计算机和网络技术的高速发展,企业信息化的成本已不再高昂。各行各业都在建设自己的信息化平台。传统的钢铁交易市场也在建立自己的网上信息平台,让用户在因特网
下一代网络是以IP技术为核心的,可以提供包括语音、数据和多媒体等业务的综合开放的网络。软交换作为下一代网络的核心控制设备,已经成为电信界和计算机界共同关注的研究热点。
随着计算机网络应用的普及,网络安全已经成为不容忽视的问题。如今数据加密、病毒防护程序、防火墙、入侵检测等网络安全防护措施日趋成熟。防火墙能够阻断大多数来自外部的
本文将对RDM和TRDM中的基于常规角色的转授权与撤销机制进行扩展,扩展后的模型称为基于角色的带时限的转授权与撤销模型(TemporalRole-basedDelegationandRevocationModel,TRDR
本文通过研究Linux 2.6.10内核IPsec框架与跟踪IPsec v2最新标准RFC4301,讨论了IPsec v2框架下VPN与防火墙的联合设计,同时研究了32位嵌入式系统开发和Linux内核移植,最后实
作为一种新兴的短距离高速无线通信技术,超宽带(Ultra-Wideband,UWB)通信已成为诸如无线USB、无线1394等高速无线应用中的关键技术。本论文针对采用m序列为扩频码、BPSK为调制
近年来,随着多媒体技术和网络技术的飞速发展,Internet上的音频和视频等多媒体应用层出不穷,这些应用需要网络提供端到端的QoS控制和保证。当今的Internet只能提供尽力而为的服