论文部分内容阅读
随着生物信息学的发展,用计算机进行生物学方面的研究越来越成为一个热门的研究领域。膜蛋白跨膜螺旋区段的预测就是一个引起了广大研究者关注的方面。膜蛋白跨膜螺旋区在生物膜上占据特殊的位置,决定了它具有特殊的生物功能,尤其是其可以作为新药物设计的靶分子,因此预测膜蛋白跨膜区具有重要的意义。传统的预测膜蛋白跨膜螺旋区段的方法基本都是采用统计学模型或神经网络的算法,这些算法具有依赖于训练序列集以及序列集的大小的缺点。小波分析的发展,带来了一种克服这些缺点的算法——Waveprd算法。Waveprd算法在对小波系数的处理过程中,由于过度平滑,产生对膜蛋白跨膜区的漏测,这种漏测的跨膜区即是假阴性片段,其个数越多对跨膜区的预测精度就越低。本文针对Waveprd算法存在的不足,提出了一种小波阈值与自相关去噪相结合的算法,目的是通过减少假阴性片段数来提高预测精度。主要的工作如下: 介绍小波变换的原理和基于离散小波变换的Waveprd算法在膜蛋白跨膜区预测中的处理方法及实现流程,并用MATLAB实现Waveprd算法的仿真,根据仿真效果图,观察Waveprd算法在膜蛋白跨膜区预测中产生的漏测现象,分析其产生漏测的可能原因,指出Waveprd算法在信号处理中的不足之处。 根据Waveprd算法的不足,即可能是其产生了过滤波,从而丢失了大量有用信号。据此提出一种改进的算法,主要是对小波变换后的高频系数(尤其是中间值域的系数)进行非线性放大,并与自相关去噪相结合。这样不仅尽可能的保留了信号的细节而且可以最大限度的去除噪声。最后对改进的算法进行了MATLAB仿真,并与Waveprd算法对跨膜区的预测结果进行了对比,验证了理论的有效性,最终将Waveprd算法对跨膜区的预测精度提高了2.1个百分点。