【摘 要】
:
DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片
【机 构】
:
东北大学信息科学与工程学院,沈阳,110004
【出 处】
:
第二十三届中国数据库学术会议(NDBC2006)
论文部分内容阅读
DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern repetition)和模式单元的概念.对于长度为n的DNA序列,其中的LPR的数量是O(n)数量级的,但提供了与个数可多达n2/4的tandem repeat相同的重复片段信息.基于模式单元设计了可用于重复片段查找的全新索引--后继数组.后继数组有效地降低了索引空间,很好地突破了重复片段查找中的索引空间瓶颈.在后继数组上,通过模式单元可发现构成LPR的全部原子模式,并通过判断相同模式是否在原序列中连续出现完成LPR的查找.理论分析和实验结果均表明,设计的LPR查找算法的时间和空间复杂度均为O(n).
其他文献
双向网改造是近年有线电视行业的热点.本文阐述了双向网改造的意义,概述了改造的现状,介绍了改造的相关技术及应用,并分析了双向网改造的前景.
电信网、计算机网、有线电视网三种网络的融合是未来媒体网络发展的趋势,本文对三大网络特点作了介绍,并着重分析了三网融合的技术问题及三网融合的技术发展.
为了进一步了解野战条件下血尿(FCH)与病理性血尿(肾性血尿、非肾性血尿)的鉴别,2002-07-2002-09我院对在对抗演习中发生FCH者红细胞体积(MCV)、红细胞体积分布宽度(RDW)进
如何有效地对海量数据尤其是诸如音频、视频之类的多媒体数据进行分析、存储和检索是一个亟待解决的问题,而将音频检索出的结果用于相应视频的索引标注则更是一个崭新的研究
基于查找ROM表来实现的直接数字频率合成-Direct Digital Frequency Synthesis(DDS或DDFS).由于ROM表的大小直接影响到系统的功耗(约占50%),因此在无线通信领域要想实现系统的
数字电视整体转换正在全国各地如火如荼地展开,并呈现出加速发展的喜人景象.在这场由总局领导的"全民运动"中,社会各界人士都投入了极大的热情和关注,国内外业界的各种团体,
如何在平移完成后进行业务的运营,是目前CATV运营商所面临的挑战.DMX整体平移方案,完成了在单向网络上对机顶盒的资源管理,进而实现了机顶盒软硬件的分离,提供了"背靠背付款"
无线传感器网络是近期研究热点之一,并有很多的应用.其中,能量的有效利用是无线传感器网络中最主要的研究目的.提出了一个基于局部性特征的聚簇算法,并提出一个3层的数据处理
本文针对宽带互动电视对互动业务保护的需求,提出了双层安全策略及双模有条件接收系统,实现了以授权中心为核心的用户认证、密钥更新以及节目的加解扰保护.前端通过多层密钥
鲁毕克魔方问世不过几年,已畅行全世界,被称为“本世纪的玩具”.鲁毕克本人也大走红运,现在月收入3万美元左右.两年来全世界已销售了2,000万个鲁毕克魔方.不少人在潜心研究