论文部分内容阅读
蛋白质折叠问题是计算分子生物学最为困难的问题之一。幸运的是,蛋白质折叠速率的预测比一般想象的要简单得多。预测折叠动力学可以揭示潜藏着的折叠机理。 在生物物理学和生物信息学中最富挑战性的问题之一是从蛋白质的氨基酸序列来预测结构,也就是所谓的蛋白质折叠问题。因为蛋白质三维结构的全部信息都包含在它的氨基酸序列中了,所以蛋白质折叠的机理和动力学能够从序列和二级结构中预测出来。如果这样,那么氨基酸和二级结构的性质就必然会对蛋白质折叠行为产生重要的影响。关键的问题是:哪些氨基酸和二级结构元素对蛋白质折叠起到了关键的作用,并且它们的什么物理性质会激发或抑制折叠反应。 折叠速率与28个字母(20个氨基酸和8个二级结构)的字母表密切相关,这表明折叠机制是由氨基酸序列和二级结构所决定的。这里我们使用一个氨基酸和二级结构的子集来预测的折叠速率。三种回归方法被用来精简字母表的尺寸。研究发现,含10个字母的字母表可以实现与折叠速率良好的关联,它接近完整28元字母表所达到的相关性。而许多其他缩减的字母与折叠动力学速率无关。这表明,并不是所有的氨基酸和二级结构对蛋白质折叠机制都同等重要。这10个结构元素可以被看作是必不可少的折叠砖块。 此外,我们观察到二级结构只能决定大蛋白质的折叠速率,而不能预测那些小折叠物的速率。并不是所有的氨基酸对促进蛋白质折叠都是等同的。二级结构对蛋白质折叠的重要性被排列为:β-折叠股>α-螺旋>弯曲>转角>未明确二级结构>310-螺旋>隔离的β-联桥>π-螺旋。只有3种二级结构(β-折叠股、α-螺旋和弯曲)就能够实现对大蛋白折叠速率良好的关联。它们可被视为关键的二级结构。这3种二级结构的形成速率控制着蛋白质的折叠速率。减少二级结构字母表的基数而不失去关键的折叠动力学信息可在蛋白质设计领域中开启一扇可加快机器学习应用的大门。 在实验上,与尿素、GdnHCl和SDS变性剂诱导的去折叠不同,我们利用电场拉伸蛋白质分子的构象,引发变形和去折叠。结果表明,静电场能有效地诱导胰蛋白酶蛋白构象的变形。在除去电场后,部分蛋白质构象可以缓慢地恢复到天然状态。但是,这种恢复是不彻底的,这表明蛋白质的去折叠已经发生了。可以观察到,蛋白质形变和去折叠随着电场强度的增大而上升。电驱动的蛋白质变性是一个用于测量蛋白质折叠动力学(特别是前稳态动力学)的简单技术。这项研究或许可为蛋白质折叠的进一步研究提供一种新的实验方法。