论文部分内容阅读
背景:
随着基因组测序技术的迅速进展,人们已经精确测定了多种生物的基因组序列。探索人类疾病发生机理为核心的基因调控研究主要以高等真核生物为模型,高等真核生物的基因组碱基数目多达数十亿碱基对,如此巨量的信息绝大部分以染色质的形式包装在细胞核中。越来越多的证据表明细胞间期核内折叠的染色质纤维在调控基因表达过程中发挥着重要的作用。尤其是特异的调控元件如增强子和启动子之间相互作用成环对基因的表达起着决定性的作用。染色质构象捕获技术(chromatin conformation capture,3C)主要依赖于小分子物质甲醛能够迅速进入细胞核交联蛋白质与DNA,能够瞬时获得核内分子之间的结合状态。3C技术的检测灵敏度相当高,使得利用该技术确定的染色质问相互作用定性准确。
我们在本研究中还以EGFR作为模型,建立了单基因染色质构象研究的捕获测序法。缈基因是鸟类成红细胞白血病病毒致癌基因同源体,为HER/ErbB家族的四个成员之一,又名HER1或ErbB-1。Egfr基因位于第7号染色体p13~q22区,全长200kb,由28个外显子组成,编码1186个氨基酸。Egfr基因有其独特的启动子序列及多个转录起始位点,启动子序列中不含TATA盒和CAAT盒,有多个起始位点可以进行转录,有非常高的GC含量(88%),多项研究表明EGFR的过表达与实体瘤的发生和预后不良相关。有数据显示,高表达EGFR的原发性乳腺癌患者对化疗药易产生耐药性,预后较差。研究表明,egfr基因拷贝数增加或者过度表达,均能促进正常细胞的转化和恶性肿瘤的转移。缈的高转录机制现在还不清楚,可能与egfr基因的内含子1中增强子附近的CA二核苷酸重复序列数量多态性有关,重复单位的数目14~21次不等。
深入了解egfr基因在肿瘤内的表达调控将有助于我们对该基因的表达进行干预及治疗相应肿瘤。进行这类研究需要大规模、多样本的基因组重测序。尽管第二代测序成本已明显降低,但全基因组重测序需要大量的时间和高额的成本,制约其应用于疾病研究。基因组目标区域重测序策略不需对全基因组进行测序,只对基因或其他感兴趣的基因组区域的基因序列重新测定,国际上已发表的研究报告均采用商业公司推出的目标序列捕获解决方案。本研究以宫颈癌细胞系HeLa S3egfr启动子为模型,在染色质构象捕获技术的基础上,建立了一套简便易行的RNA捕获靶序列的富集体系,结合Solexa测序方法,分析不同染色质间的相互作用。通过生物信息学分析,得到了宫颈癌细胞系HeLa S3内与egfr启动子片段有相互作用的DNA片段。
目的:
以表皮生长因子受体(epidermal growth factor receptor,egfr)启动子片段为目标靶序列,在染色质构象捕获技术(3C)的基础上,建立了一种RNA捕获法在全基因组进行靶序列的富集,并结合第二代测序技术,以实现候选基因区段的深度测序,寻找与egfr启动子片段有相互作用的DNA片段。
方法:
1以宫颈癌细胞系HeLa S3为模型,提取细胞核后用HindⅢ酶切,末端补平后用生物素标记,DNA成环,加接头,用磁珠吸附生物素标记的DNA后PCR,回收400bp-1000bp的DNA片段作为3C模板,挑单克隆50个进行测序,验证方法可行后进行高通量测序。通过生物信息学方法对测序结果进行分析,寻找染色质之间的相互作用。
2以宫颈癌细胞系HeLa S3 egfr为模型,并用egfr启动子RNA与制备的3C模板杂交将egfr启动子片段富集,富集的DNA片段PCR扩增15轮后用solexa高通量测序。通过生物信息学方法对测序结果进行分析,寻找egfr启动子远距离的相互作用。
结果:
1.建立了3C方法分析染色质问的相互作用,为研究细胞内染色质的三维空间构象提供了实验依据。对测序结果进行分析得到宫颈癌细胞系HeLaS3不同染色质间以及同一染色质内部的的相互作用。
2通过生物信息学技术分析,从实验组中随机取总条数为106reads,比对到egfr启动子片段reads条数为1889条,而比对到随机挑选的Notch1、pdgf-B(platelet derivedgrowth factor-B)、Src基因reads条数分别为2、3、3条。从人类全基因组随机取总条数为106的等长reads作为对照组,比对到Notch1、pdgf-B、Src、egfr基因reads条数分别为3,2,3,2条。在本实验中egfr启动子片段通过RNA捕获法被富集了630倍。通过生物信息学技术分析,得到HeLa S3细胞内egfr启动子片段有相互作用的DNA片段。
结论:
用本研究建立的RNA捕获法对3C文库中egfr启动子序列捕获、富集、测序文库建立的技术路线可行,所建DNA文库可直接用于Solexa测序仪的测序。通过生物信息学技术分析,得到了HeLa S3细胞内不同染色质之间以及同一染色质内部的相互作用、egfr启动子有相互作用的DNA片段。RNA捕获技术与第二代高通量测序技术结合能应用于靶区域的重测序,研究可变剪切、核小体分布,发现和分析新的单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs)位点,寻找许多复杂疾病相关基因及位点,针对性强,简便易行,节约成本。