论文部分内容阅读
随着人们对蛋白质一蛋白质相互作用在生命过程中的重要性的认识不断提高,在全基因组水平上构建出各模式生物的蛋白质.蛋白质相互作用网络的研究变得越来越重要。通过度量Gene Ontology(GO)的两个结点之间的相对特异的语义相似性,我们提出了一个重构蛋白质.蛋白质相互作用网络的计算方法,并成功应用于芽殖酵母(Saccharomyces cerevisiae)基因组。该方法综合考虑了一对蛋白质之间的功能相似性和细胞定位相近程度,并给出对应的可信度值,最后生成了高质量的相互作用正数据集和负数据集。基于正数据集,我们构建了酵母蛋白质与蛋白质相互作用网络(最新数据包括3600个蛋白质和92257个相互作用)。
然后我们建立了一个高质量的酵母蛋白质与蛋白质相互作用网络数据库及可视化检索系统-SPIDer(http://cmb.bnu.edu.cn/S PIDer/index.html)。该系统为用户提供多种检索方式,如按照蛋白质或者GO结点的信息来检索一个或多个蛋白质所对应的相互作用;检索两个GO结点之间的RSS值;特别是我们还允许用户输入一组蛋白质(如蛋白质复合体),从而获得这组蛋白质内部的相互作用(inter-member interactions)子网络及相关信息。另外,该平台还提供一个可视化子系统,用户可以按照给定的RSS阈值来可视化所查询的蛋白质的相互作用子网络。
全基因组水平上的蛋白质相互作用数据的获得使得人们可以在网络的层面来理解生物学功能。不过目前相互作用网络层次的动态性质研究(比如关键蛋白质的研究)还是基于一个由两两相互作用所聚集的网络(aggregated network)。我们对酵母蛋白质相互作用网络进行时间上的动态分解,即将聚集的相互作用网络投影到细胞周期的四个阶段内,分别是G1、S、G2和M。然后我们研究关键蛋白质在聚集网络和四个子网络中的生物学特性。聚集网络中一共有157个关键蛋白质,其中74%(116个)至少在一个子网络中依旧保持关键蛋白质的角色;而余下的只在聚集网络中是关键蛋白质,在任何子网络中均不是关键蛋白质,并且它们倾向于执行多种分子功能。这两组关键蛋白质在生物学过程和拓扑位置方面也表现出不同的特征。同时,我们也分析了动态关键蛋白质和两类静态关键蛋白质的生物学特性。我们通过动态分解蛋白质相互作用网络来分析各子网络中的关键蛋白质的特性,这可以为目前的细胞环境依赖和时间依赖的网络动态特性研究提供一定程度上的补充。