论文部分内容阅读
在转录、基因组印记以及亚核的定位等复杂的生物学过程中,多功能的转录因子CTCF发挥着关键的调控作用,其与基因结合的活性能够被DNA甲基化所影响。作为表观遗传学研究的重要方面,组蛋白修饰通过构建总体的染色质环境,从而达到影响基因表达及基因组功能的目的。随着高通量测序技术的广泛应用和数据库的完善,使得研究转录因子CTCF结合与DNA甲基化的关联以及它们对组蛋白修饰分布的影响成为了可能。 本文以人类血液组织中的GM12878(B淋巴细胞系)和K562(骨髓性白血病细胞系)为研究对象。首先,由UCSC基因组浏览器下载了人类全基因组Feb.2009(GRCh37/hg19版本)的基因注释数据,经筛选得到12207个在TSS前后20kb内无重叠的基因。然后,对每个基因,计算了转录因子CTCF与基因的关联强度得分Aij以及TSS区域的DNA甲基化水平Mij,并分析了Aij和Mij之间的关系,发现转录因子CTCF结合与DNA甲基化之间存在竞争,一定程度上DNA甲基化阻碍了CTCF结合到相应的基因上。接着,根据Aij和Mij的值将12207个基因分为四个集合,分别统计了每个集合中TSS侧翼3800bp区域内的11种组蛋白修饰信号的分布情况,结果显示H2AFZ、H3K4me2、H3K4me3、H3K9ac、H3K27ac和H3K79me2这六种呈现明显的双峰分布,且在GMⅢ和KⅢ集合中信号最强,在GMⅡ和KⅡ集合中信号最弱,表明CTCF结合与DNA甲基化可以影响组蛋白修饰的分布;其余的五种分布没有明显的特征,且信号较弱,说明CTCF结合与DNA甲基化对它们的分布影响较小。最后,由R语言中的DEGseq包计算了基因的表达水平RPKM,并在两类细胞系中对其中的三个基因集合分别计算了RPKM与Aij和Mij之间的相关性,结果显示出TSS附近的DNA甲基化水平与基因的表达呈弱负相关,而转录因子CTCF结合却与基因的表达呈弱正相关。