论文部分内容阅读
由于蛋白空间结构的复杂性和动态多变性,长期以来,预测蛋白质空间结构一直是分子生物学领域一个具有挑战性的课题。关键是如何得到可靠的蛋白质空间结构,并快速获得潜在的所有可能蛋白构象。我们最近开发的蛋白质折叠构象码(PFSC)为解决这些问题提供了一个简单和完整地描述蛋白结构的数学模型。通过严格地推导得到的一组27个蛋白质折叠码可以完全地覆盖5个氨基酸形成的封闭几何空间,即能够描述5个氨基酸的任何折叠形状。任何已知三维结构的蛋白质的空间折叠构象可以运用数字化的蛋白质折叠码来完全表达。反之,通过预测蛋白质折叠码就可以获得蛋白质的空间构象。在此基础上,通过20种氨基酸和27个蛋白质折叠码之间的关系,建立任何5个氨基酸全排列的可能折叠构象,依据蛋白质序列就可以直接转换成为蛋白质折叠码描述。蛋白质三维构象的全信息预测方法(CPPC)一览无遗地展示蛋白全部构象变化特征。这个新方法不仅可以快速地预测蛋白质的全部可能空间构象,而且能够从海量的构象中筛选最可能的蛋白折叠构象。大量的结果显示,蛋白质三维构象预测的全信息很好地涵盖了已知的蛋白结构。该方法的进一步发展对预测超过五千万未知三维结构的蛋白质,以及开展生物大数据挖掘,蛋白组学,微生物组学和生物医药研究具有重要意义。