论文部分内容阅读
目前,已经有研究表明生物系统是由执行确定生物学功能的模块组成的。因此,鉴别这些功能模块对于理解生物系统的模块性和组织结构是十分必要的。已经有一些基于复杂网络的功能模块挖掘算法,但是大部分的研究仅仅利用了网络的拓扑性质。因此,本文提出功能模块的挖掘不应该仅仅利用网络的拓扑性质,而应该同时利用其它的数据资源。构建权重网络可以更好的表示蛋白质之间的关系,并且基于权重网络挖掘的功能模块具有更好的生物学意义。
在本文中,通过整合蛋白质互作网络和基因表达数据提出了一个框架来鉴别功能模块。首先,利用酵母蛋白质互作网络的拓扑性质以及基因表达相似性构建了一个双重加权蛋白质互作网络,然后提出了一个基于最短路径由种子蛋白质扩增的新算法来挖掘功能模块。在双重加权蛋白质互作网络中应用本文的算法得到了120个功能模块。这些模块显著的富集在蛋白质相关的GO的生物学过程上。得到了几种不同类型的功能模块,特别是微效模块。在120个功能模块中,82个功能模块同时具有内部互作数目大于外部互作数目的紧密连通性和高的共表达的性质,这与之前的研究获得的模块性质相同。15(11)功能模块同时具有内部互作数目大于外部互作数目的紧密连通性(外部互作数目大于内部互作数目的紧密连通性)和低的共表达的性质(高的共表达的性质)。
本文还获得了12个微效功能模块,也就是这些模块同时具有外部互作数目大于内部互作数目的紧密连通性和低的共表达的性质,但是这些功能模块同样具有生物学意义。如果仅仅考虑蛋白质互作网络的拓扑性质或者是基因表达的相似性,是无法获得这些模块的。除此之外,已知的蛋白质复合物可以大量的包含在功能模块中。功能模块中的蛋白质具有显著的共调控、共亚细胞位置的性质。本文挖掘的功能模块间存在交集。这反映了功能模块间的相互关系并且能更好的代表真实的生物系统。把MCL算法和本文提出的算法进行了比较,结果显示本文的算法挖掘到的功能模块具有更好的生物学意义。通过一些功能模块的例子,本文发现功能模块可以用来帮助预测基因的功能。因此,本文提出的算法可以很好的挖掘蛋白质互作网络中功能模块,并且本文提供了一个有用的方法来更好的理解生物系统。