论文部分内容阅读
随着蛋白序列数据和结构数据之间差距的日益增大,以及蛋白质结构模型在功能分析和机制研究中的日益重要,快速有效地预测蛋白质的三级结构显得越发迫切。蛋白质的结构预测研究已经有五十多年的历史,近年来,基于结构模板的预测方法获得了较快发展。
本论文中发展了一个全新的基于分级结构模板的蛋白预测平台TJ_Jiang。它基于一个基本假设,即蛋白质结构的形成受到两方面因素的影响,首先是构成分子的内部原子和周围环境原子都必须遵循物理的作用规律,另外蛋白分子为了保证生物学功能在结构上必然要受到进化的制约。具体实现时,将这一蛋白结构预测问题转化为构象空间搜索问题,并且将主链拓扑结构和侧链排布分成两个相对独立的构象空间。本论文主要集中在发展预测主链拓扑结构的算法。开发的流程中包括三个相辅相成的模块,即评分函数、构象空间构造和搜索策略。
为了将目标构象和大量的非目标构象区分开来,发展了一套基于残基五点模型的统计的构象评分函数。整个评分函数由三项组成:原子间的接触势、局部3-残基的序列和构象偏向势以及潜在氯键势。与同类的粗粒化评分函数相比,这一评分函数不仅有更强的构象识别能力,而且使构象评分值与RMSD之间呈现更好的相关性,非常有利于在构象搜索中形成一个快速收敛到天然构象的光滑的能量图景,从而更有效地找到目标构象。
在平台中,构象空间通过局部片段的偏向性候选构象组合而成。传统的基于局部片段的拓扑预测中,一般通过片段间的随机组装生成起始搜索构象。这样就具有很大的随机性,在TJ_Jiang中,通过相邻的部分重叠片段之间的结构“兼容性”优化,逐步生长出全长的起始构象,尽可能保证了组成初始构象的局部片段之间共存于同一个拓扑中的合理性。然后再通过局部片段替换进行构象空间的搜索,由构象评分函数和搜索算法的引导,逐步收敛到稳定构象。多次重复上述生长-替换的构象生成过程,最后通过聚类得到预测的主链拓扑。
为了测试完整的TJ_Jiang平台对于新折叠子类型(NeW Fold)蛋白的预测能力,用TJ_Jiang对CASP7中的19个New Fold目标进行了预测。预测结果表明,TJ_Jiang对New Fold的整体预测能力已经可以媲美于CASP7中排名最好的五个预测组。并且在19个预测目标中,有5个目标的预测效果排名前三,有8个目标能形成正确的全局拓扑,这在参与CASP7中New Fold目标预测的169个组中是非常少见的。
论文中,还基于TJ_Jiang平台的结构预测和分析能力,对两个具体的蛋白从结构上开展了相关研究。一是流感A H3N2亚型的HA蛋白。通过对不同病毒株的HA结构模建以及HA与不同受体类型之间作用机制的分析,推测受体结合区222位点和225位点的协同变化,可能是导致Fujian病毒在禽和人中结合能力有别于Panama病毒的重要原因。另外一个则是钾离子通道蛋白Kv1.2。通过对四种不同截断长度C-末端的结构模型的模建,从分子水平阐明了C-末端是如何和门控体系相互作用并调节离子通道的开关状态的。即一个亚基C-末端对于通道活性的调节是通过和相邻亚基的S4-S5 linker区的相互作用实现的,而且这种相互作用很好地将四个亚基从结构上偶联在一起,为将膜电位信号的变化快速地转化为通道的构象变化提供了结构基础。