基于B样条小波域的多尺度积短外显子检测

来源 :汕头大学 | 被引量 : 0次 | 上传用户:mulang608
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
外显子是真核生物脱氧核糖核酸序列重要的功能区,准确地定位外显子区有利于理解蛋白质的结构与功能。真核生物包含长度为几个到几千个不等碱基对的外显子,而且较大比例外显子的长度都很小(<200碱基对)。鉴于短外显子缺乏明显的特征,因此寻找准确可靠的方法以自动确定短外显子的长度和位置显得尤为重要。而且准确定位基因组中外显子有利于设计药物与疾病治疗。例如,既往研究表明一些短外显子的突变在肿瘤侵袭的各个环节有着重要的作用。因而,识别短外显子仍然是一个开放性的问题。  目前,预测外显子的方法大致可以分为两类:独立模型方法和依赖模型方法。依赖模型方法利用先验的基因组信息或者是在分析阶段通过训练分类器学习模型,独立模型方法不需要假设任何先验的信息来训练模型或估计参数。本文根据外显子与内含子信号的小波变换系数在相邻尺度之间的传播特性,利用B样条小波多尺度积来实现短外显子的预测,记为MP方法。该方法属于独立模型范畴。  MP方法首先计算了外显子与内含子的小波系数在相邻尺度的Jensen-Shannon距离,发现相邻尺度上内含子信号的小波变换系数相关性比外显子弱。根据外显子与内含子小波系数在相邻尺度间存在的不同相关特性,通过将相邻尺度的小波系数相乘以增强外显子信号,抑制内含子噪声,进而实现对短外显子的准确预测。数据集HMR195和BG570是评估外显子预测方法性能的通用数据集,且这两个数据集中短外显子具有较高的比例。本文利用这两个数据集对MP方法在预测短外显子的预测性能进行评估,与现有五种独立模型方法相比,MP方法对长度范围(0,24]、[25,49]、[50,74]、[100,124]、[125,149]、[150,174]、[175,199]、[200,299]和[300,300+]外显子的探测准确率分别至少有26.8%、9.5%、8.2%、3.5%、10.2%、4.5%、7.8%、10.0%和4.4%的提高。  基于MP的方法对短外显子进行预测的优点主要体现在两方面:(1)设计了一种新的B样条小波函数,在多尺度域提取外显子的周期三成分;一方面消除了窗口长度对预测结果的影响,另一方面该小波函数具有较高的曲线编辑自由度;(2)探索短外显子在B样条小波变换域在各相邻尺度的空间相关性,这些相关性特征有利于显现传统检测方法无法观测的潜在信息;(3)采用正向与反向结合的成对数值表示方法计算输出值,不仅反映了DNA的真实结构,而且提高了计算效率。
其他文献
随着智能终端与移动互联网的发展,现今的无线通信系统需要在有限的频率资源上提供更高的速率,而多天线技术由于能够开拓空域资源使得在不需要额外功率、频谱资源的情况下大大提
传统的路面信息管理与决策系统将业务逻辑直接编写在应用程序代码之中。当业务逻辑发生变化时,系统的更新往往要花费很大的代价。随着业务逻辑变化的不断加快,这种高度耦合的
近年来,随着移动通讯技术的迅猛发展,人们对天线的性能要求不断提高。由于现代移动便携设备的结构非常紧凑,天线需要具备多频段覆盖能力,因此,同时实现天线的小型化和多频段覆盖能
学位
随着无线通信技术蓬勃发展,传统的点到点传输技术已经非常逼近了香农信道容量。因此,从更为复杂的网络角度寻求提高网络容量的新型网络结构及传输策略,成为目前移动通信研究领域
图像匹配技术是模式识别和计算机视觉的研究热点,是图像融合、拼接等技术的前提。尽管近几十年来该方面的研究有着丰硕的成果,但是由于人为因素、设备、外部场景等因素的影响
随着流媒体应用的流行和移动终端的日益普及,业界积极在无线网络上开发流媒体业务以满足不断增长的用户需求。然而在无线网络的传输条件下,无线信道具有误码率高、延迟和抖动
合成孔径雷达(SAR)具有全天时、全天候工作的能力,在环境保护、灾害监测、海洋观测、资源勘查、地质测绘和政府公共决策等方面发挥着巨大的作用。随着合成孔径雷达成像技术和
随着移动互联网的发展,越来越多高速率要求的应用与服务出现并刺激着无线通信服务速率的增长。除了多天线技术、调制解调、编码解码、干扰相消等技术的采用,无线中继也作为一个
火灾是指失去控制的燃烧所造成的灾害,在各类灾害中,火灾是最常见,也是对公共安全和社会发展威胁最严重的灾害之一,其中建筑火灾不仅会造成巨大的经济损失,还会带来巨大的生命危险