论文部分内容阅读
生物体细胞是一个有机联系的整体,其中调控作为生物联系得以维系的必然因素,正日渐成为复杂疾病相关机理研究领域的一个热点和难点。转录调控是在基因互作层面去揭示主导基因表达水平改变的直接遗传因素,而表观调控则是通过遗传物质DNA之外的表观修饰水平的改变去间接推断可能发生的生物学事件。本研究将从转录调控和表观调控两个层面,逐一深入地去解读,复杂疾病相关的核心转录因子及其失调的关系,差异表观修饰区间和介导异常表观修饰发挥功能的分子机制。 本研究由三个紧密关联,却又渐进深入的科研部分构成:首先,基于转录调控网络识别驱动疾病间关联的核心转录因子及其失调的关系。利用正常炎症,以及癌症的多套表达谱数据构建不同状态下的转录调控网络。进而提出网络水平的整合算法,基于网络间转录因子对于炎症和癌症基因的调控相似性对不同状态下的网络进行整合聚类。网络间聚类的结果显示,同一疾病类别内存在高度的调控相似性,尤其是正常状态的调控网络之间。更令人惊喜的是,聚类结果中一个分支同时包含了炎症和癌症的调控网络,这暗示了炎症同癌症在转录调控层面的关联。为了确保结果的鲁棒性,我们还采用了网络扰动聚类分析进行验证,其结果强有力地支撑了炎症同癌症之间关联的存在,以及我们在转录调控层面对其进行刻画的合理可靠性。通过整合不同状态下的失调网络,我们识别获取了驱动炎症同癌症间关联的核心转录因子及其失调的疾病基因。此外,通过简单合理的生物学实验对其在驱动复杂疾病间关联方面所发挥的功能进行检测和证实,对于我们更好地刻画复杂疾病间的关联具有坚实的实际意义。 随后,基于多维数据整合,包括癌症的表达谱数据,物种间保守性数据,基因组功能元件区域如增强子数据,以及多种疾病中识别的差异表观修饰区域数据,对疾病相关的差异表观修饰区间进行整合优化。结果显示,在特征全部整合,部分整合和不进行整合的横向比较过程中,排秩靠前的DMR其相应的基因倾向于显著富集更多已知的疾病相关甲基化基因。与此同时,功能富集的结果也进一步支撑了多维特征整合的必要性,其富集的显著功能类多是疾病相关的GO分支以及KEGG通路。此外,我们还对整合之后的结果进行了细胞系的验证。在野生型癌症细胞系中,排秩靠前的区间其转录激活型标记H3k4me3同排秩靠后的区间相比存在显著差异,而抑制型组蛋白修饰标记H3k27me3则并不显著。同时在野生型和甲基化酶双敲除的癌症细胞系中,我们则观测到,H3K27me3显著地富基于排秩靠前的区间,这同无显著富集的H3K4me2形成了鲜明对比。细胞系分析的结果提示,甲基化同组蛋白修饰之间存在着复杂的关联,同时组蛋白的修饰改变也能暗示异常甲基化修饰区间的功能重要性。基于额外的表观和表达谱数据,利用排秩靠前的区域作为生物标记去划分未知的样本,取得了优异的成果,这对于推动“表观治疗”领域的发展是非常重要的,具有实际的应用推广价值。 最后,基于疾病同正常样本的表观和表达测序数据,深刻探讨疾病条件下介导差异表观修饰区间发挥功能的分子机制。通过基因组元件及功能元件区域对DMR的富集分析,我们发现大部分的DMR区域倾向于落在内含子内。鉴于甲基化对基因表达影响的研究现状,以及内含子潜在的调控功能,提示我们DNA甲基化通过影响内含子内的选择性启动子从而影响部分基因的表达改变,进而影响疾病表型。然而这部分启动子的数目很少且注释信息极不完整,这就暗示DNA甲基化通过非直接的方式去影响基因表达。后续的全基因组转录因子绑定位点分析,不同基因集同金标准差异基因集的横向比较分析,以及不同基因集功能富集结果的横向比较分析也强有力地支撑DNA了甲基化通过影响调控子microRNA进而间接调控全局的基因表达,最后促进疾病的演进。 综上所述,本研究囊括了转录调控和表观调控分析,深刻探讨了复杂疾病的发生,发展,恶性演进,以及疾病间彼此关联的错综关系。无论是从转录调控还是表观调控层面,本研究对于复杂疾病相关的潜在分子机制进行了深入刻画。本研究的主要方法不仅具有鲁棒性,同时还具有良好的应用拓展价值,为推动相关领域的科学研究做出了重要的贡献。