论文部分内容阅读
DNA甲基化是一种重要的表观遗传修饰,在胚胎发育、X染色体失活、基因组印记和染色体结构方面发挥着重要的调控作用。DNA甲基化是基因沉默和基因表达调控的重要机制。DNA甲基化和基因表达之间存在着复杂关系,到目前为止,尚未有明确定论。目前相关领域学者针对与年龄有关的DNA甲基化进行了大量的研究,然而年龄有关的差异甲基化基因特点还不明确。本文针对这些存在的问题,研究差异甲基化区域和基因表达之间的关系,鉴别它们的特点。论文的主要研究工作和成果如下:(1)本文使用年龄间距大的匹配的DNA甲基化和基因表达的数据,基于区域方法识别出样本中与年龄有关的差异甲基化区域(DMR),并提取差异甲基化且差异表达基因。(2)为了分析差异甲基化区域的特点,本文结合基因组注释数据对其进行分析,结果发现差异甲基化区域的变化模式在基因的坐标区域内具有很高的一致性(同时高甲基化或同时低甲基化)。进一步,从差异甲基化区域分布上着手研究,结果发现高甲基化区域和低甲基化区域分布不均,分别倾向于CGI promoter基因和non CGI promoter基因上。另外,我们的研究也发现,Gene Body包含大部分差异甲基化区域(包括差异表达基因和非差异表达基因),是DNA甲基化的重要调控区域。(3)为了研究DNA甲基化与基因表达之间的关系,本文结合基因表达数据分析,结果发现非差异表达/差异上调/差异下调基因的差异甲基化区域都同时存在正关联,负关联和无关联,这一结果揭示了甲基化和基因表达间的复杂关系。进一步从细节上分析,发现差异甲基化区域的甲基化水平和基因表达之间依然存在一种倾向性,非差异表达的DMR偏向正相关,差异表达的DMR偏向负相关。(4)为了进一步分析正关联和负关联差异甲基化且差异表达基因的特点,首先,本文通过对不同数据库中蛋白质相互作用数据集成分析,构建人类蛋白质相互作用网络,并利用中心性等方法构建分类特征,对两类基因分类,我们发现利用蛋白质互作数据有助于提高两类基因分类效果。另外,通过对这两类基因进行GO富集性分析,发现两类基因的富集GO term间存在极大差异。以上结果提示两类基因与蛋白质互作的不同功能模块有关联性,两类基因很可能关联于不同的表达调控模式。