论文部分内容阅读
本文对大规模蛋白质相互作用网络的构建进行了研究。文章以胎肝中鉴定蛋白质为研究对象,采用文献挖掘和生物信息学预测方法,并整合酵母双杂交实验数据,建立了小规模的胎肝蛋自相互作用网络,并在此网络中发现了一些胎肝中可能存在的对其发育和分化的分子机制有较强提示作用的功能模块。其中一个模块已经部分为实验证实,表明该项研究对实验有一定的理论指导意义。在胎肝蛋白相互作用网络的研究中,本文还发展了大规模蛋白质相互作用研究的生物信息学支撑平台,用以实现酵母双杂交实验数据的收集和存储、蛋白质相互作用的预测、蛋白质相互作用网络可视化等多种功能。该平台预测的人蛋白参考网络已成功用于指导国内大规模酵母双杂交实验的诱饵遴选。
其次,本文引入了基因本体论(GO,GeneOntology)用于高通量蛋白质组数据的生物学功能分析。传统文献挖掘方法分析高通量蛋白质组数据耗时且低效。基于等级化、结构化的词汇表GO和蛋白质在数据库中的GO注释,本文发展了一种对高通量蛋白质组数据进行功能分析的策略。该策略可自动对蛋白质组数据进行功能注释和功能聚类,提供功能分析所需的基本信息;同时给出蛋白质功能分布和类别统计信息,有助于从整体上理解蛋白质集合的功能。本文基于该策略发展的网络分析工具GOfact已经在蛋白质表达谱分析、蛋白质相互作用数据可信度评估和胎肝蛋白网络功能模块分析方面都发挥了重要作用。
第三,本文对蛋白质相互作用网络的拓扑结构进行了系统分析。分析网络拓扑结构往往是研究复杂蛋白质相互作用网络的第一步。本文通过对酵母、线虫和果蝇三个大的蛋白质相互作用网络的研究,在更大的范围内证明了蛋白质相互作用网络具有无尺度和模块化的性质,并且证明网络中蛋白质的等级组织形式是蛋白质网络无尺度和模块化性质的根源。本文指出网络直径是描述蛋白相互作用网络连通性的重要指标,并首次揭示了蛋白质相互作用网络的保守直径现象。通过模拟外界环境对蛋白质相互作用网络直径的随机扰动,本文发现了蛋白质相互作用网络的高度稳健性,并进而通过计算模拟的方法指出了蛋白质网络的稳健性来自于网络中少量高连接度蛋白的存在。该项研究有助于人们认识蛋白质相互作用网络的复杂性,对指导大规模蛋白质相互作用网络的构建和分析乃至今后的系统生物学研究都有重要意义。
最后,本文将贝叶斯方法用于高通量蛋白质相互作用数据的可靠性分析并取得了很好的效果。高通量筛选蛋白质相互作用会产生大量的假阳性结果,因此,高通量蛋白质相互作用数据分析中非常关键的一步即是评估蛋白质相互作用数据的可信度,并得到一个可靠的核心数据集。本文使用似然比考察了不同蛋白质相互作用证据的可靠性,并使用朴素贝叶斯网络整合多种证据到一个统一的概率模型中。通过对该评估模型的测试,发现其相对于单一证据方法和简单投票方法具有更高的灵敏度和特异性。在建立的贝叶斯评估模型的基础上,本文还发展了一个用于蛋白质相互作用数据可信度评估的网络分析工具PICASSO。作为一个专门用于蛋白质相互作用数据可信度评估的网络分析工具,PICASSO将在大规模蛋白质相互作用网络研究领域发挥重要作用。