论文部分内容阅读
研究疾病基因的进化保守性对于发现疾病发生机制有重要的意义。目前,对于人类疾病基因尤其是癌基因的保守性的研究存在很大的争论。现有研究仅从单基因的角度研究疾病基因的保守性,而忽略了它们编码蛋白质之间的功能联系。功能相关的蛋白质之间的物理互作倾向于模块化。在进化过程中,这种模块化趋势会影响进化的模式和速度。从而,研究人类蛋白质互作网络的模块化进化使我们可以从系统生物学的角度研究疾病基因的保守性。
本文通过人和小鼠之间的共进化模块网络来研究癌基因。我们首先根据基因在人和小鼠之间的进化速率,利用聚类算法从人类蛋白质互作网络上提取到452个共进化模块,其中62个包含癌蛋白的模块(癌相关模块)。然后,根据共进化模块研究模块内外癌蛋白的保守性,以及癌症发生过程中癌相关模块之间可能的交互作用。
通过分析,我们发现共进化模块大都是高度保守的。模块内癌蛋白倾向于分布在保守的大模块中,更加保守、进化起源更早;模块外癌蛋白的进化年龄较年轻,其进化速率与所有非癌蛋白相比没有显著区别。因此,癌基因的保守性应主要归因于模块内癌蛋白的编码基因。通过对癌相关模块进行功能富集分析,我们发现,癌相关模块所涉及的功能大都是一些重要的、本质的生物学过程,如细胞的增殖分化等。模块外癌蛋白在共进化模块网络上倾向于处于十分重要的“枢纽”位置,同时调控若干癌相关模块。结合癌症样本的高通量体细胞突变扫查数据,我们发现癌相关模块之间4种重要的交互作用,包括枢纽蛋白互作和3种共突变方式,为识别新的候选癌基因以及探索癌症发生机制提供了新线索。