论文部分内容阅读
复杂疾病发生、发展与代谢通路特定区域(子通路)的功能异常密切相关。精绍的识别复杂疾病相关的风险代谢子通路对揭示疾病的发生发展机制意义重大。然而,现存的大部分通路识别的生物信息学方法仅仅具有全通路识别能力,无法精细的识别疾病的代谢子通路。本文首先利用基因组信息和通路结构信息识别疾病风险代谢子通路。我们开发了k-cliques疾病风险子通路识别方法,通过将该方法应用到肺癌的表达谱数据,有效的识别了36个肺癌的风险代谢子通路区域。这些子通路对应10个代谢全通路,其中3个通路无法被现有通路识别方法有效识别。进一步,通过利用GAD疾病风险基因数据,我们采用k-cliques子通路识别方法构建了疾病与子通路的全局关联网络。通过系统的分析k-cliques方法识别的疾病与子通路的关系,我们发现k-cliques子通路策略的确能够有效的适用于多种复杂疾病的子通路识别。为了进一步提高子通路识别的精度和稳定性,我们整合疾病风险基因和疾病风险代谢子信息在通路结构中的级联关系开发了识别疾病高风险代谢通路区域的Subpathway-GM方法。方法基于的思想是:既然代谢通路由基因编码的酶和代谢子构成,整合疾病风险基因和疾病风险代谢子信息的风险子通路识别策略应能更加精细的识别风险通路区域。我们将该方法应用到两套结肠癌数据和一套转移的前列腺癌数据中,结果显示Subpathway-GM方法能够有效的识别26个结肠癌和16转移的前列腺癌风险子通路。更重要的是该方法能够根据疾病风险基因和代谢子在通路中的位置信息更加精确的定位子通路区域,而且能够有效的识别不同形态的子通路区域。进一步的分析发现基因和代谢子信息整合和利用通路拓扑的子通路策略的联合使用是Subpathway-GM方法有效识别疾病风险通路区域的关键因素。我们构建了通路分析平台,提供利用疾病风险基因及代谢子识别多种复杂疾病风险代谢通路区域的功能。