论文部分内容阅读
随着计算机技术和生物科学技术的共同飞速发展,将计算机技术运用到生物领域中是当今生物学的重要转变。其中,无序蛋白质的研究引起了研究者们的兴趣。传统的蛋白质与无序蛋白质在结构上有着很大的区别,其没有稳定的高级结构,是对生物学中“序列一结构一功能”这一理论的挑战。由于无序蛋白质可以与不同的配体结合,形成不同的蛋白质结构,因而也具有不同的功能。因此,它对于蛋白质的设计以及药物的制造都有着重要的指导作用。无序蛋白质分为两种,分别为完全无序蛋白质与部分无序蛋白质。预测的方法有很多种,最简单快速的为FoldIndex算法与GlobPlot算法,且前者准确率高于后者。 预测完全无序蛋白质时,先将FoldIndex算法通过MATLAB实现,然后对FoldIndex算法进行效果改进,方法是将FoldIndex算法与GlobPlot算法两者结合,并对算法中的氨基酸疏水性参数、电荷性参数以及倾向性参数进行优化。然后根据参数之间的相互关系,推导出预测完全无序蛋白质的最佳算法。并用MATLAB进行效果仿真,将改进后的算法与原算法相对比,当数据集为无序时,准确率提高1.41%,当数据集为有序时,准确率提高0.92%,仿真结果证明这种改进是有效的。 预测部分无序蛋白质时,是在原算法的基础上提出对序列进行加窗,根据预测算法选择合适的窗函数。在选择合适的窗口长度时,对不同序列长度的蛋白质分别加窗,找出窗口长度与序列长度的关系。用MATLAB仿真加窗后的预测效果,将原算法与改进的算法进行对比,并分别选择了不同类型的蛋白质,包括完全无序蛋白质、部分无序蛋白质、有序蛋白质。通过仿真图形可以看出,改进的算法比原算法效果更好,证明改进的算法是有效的。