论文部分内容阅读
研究背景:乙型肝炎病毒(hepatitis B virus,HBV)慢性感染导致的肝细胞癌(hepatocellular carcinoma,HCC)是我国最重要的死亡原因之一。体细胞变异是HCC进化的基础,而HBV基因整合是HBV-HCC特有的突变类型,也是HBV直接损伤人体基因组的方式。大量研究发现HBV整合事件在HCC基因组中积累,提示这类突变可以赋予变异细胞生存优势,进而促进癌症发生。目前该领域的研究存在以下局限性:首先,关于HBV整合的研究都局限在基因组水平,缺乏转录组水平的研究。基因组水平的HBV整合突变影响基因转录的方式和程度尚不明确;前基因组RNA的合成与逆转录是HBV复制的关键步骤,目前不能确定在相关过程中病毒RNA是否可以直接整合到人体RNA链。其次,个体间的HBV突变谱差异较大,阻碍了HBV整合突变的有效检测和全面分析。第三,目前仅有TERT和MLL4基因被证实为常见的HBV整合基因,上述2种基因中的HBV整合突变仅占此类突变总量的2%以下;其余大量HBV整合突变的促癌功能尚待研究。最后,HBV整合的发生机制也不明确。载脂蛋白B mRNA编辑多肽3家族(apolipoprotein B mRNA editing enzyme catalytic polypeptide 3,APOBECE3)是诱导体细胞突变和病毒突变产生的重要分子,可以诱导人体和病毒核酸链断裂,但是尚无研究阐明APOBEC3对HBV整合的作用。HBV-HCC的发生发展是遗传、免疫和病毒因素共同作用的进化过程。研究APOBEC3的单核甘酸多态性(single nucleotide polymorphism,SNP)在病毒突变和癌症发生中的作用对明确HBV致癌过程有重要意义。研究目的:明确HBV整合在基因组和转录组水平的分布规律;研究HBV整合的发生机制以及这类突变在肝细胞癌进化过程中的作用;阐明APOBEC3致突变基因与HBV整合的关系;分析APOBEC3遗传多态性与病毒清除、病毒突变和HCC风险的相关性;为HBV感染者的癌症防治提供新靶点。研究方法:应用50例HCC患者的癌和癌旁组织进行HBV-捕获测序以及RNA测序。以HBV各基因型的标准序列为基础,利用患者体内的HBV突变信息进行校正,生成每个患者个体化的病毒参考序列。将测序片段与人核基因组、线粒体基因组以及病毒基因组参考序列进行比对,确定HBV整合突变。随机挑选80个DNA和RNA水平的整合位点,以巢式PCR和Sanger测序的方法进行验证。分别利用标准化配对测序片段数(support PE-assembled reads,NNSS)和嵌合测序片段数(reads)评价DNA和RNA水平的整合突变信号强度。在DNA水平,NNSS≥1的HBV整合突变纳入分析;在RNA水平,reads≥2的HBV整合突变纳入分析。以χ2检验分析HBV整合突变在人基因组、病毒基因组以及人群间的分布特征。为排除低频随机整合的影响,以HBV整合突变信号强度的上四分位点为界值,筛选高强度的整合突变,重复验证HBV整合突变分布规律。采用Wilcoxon非参数秩和检验分析HBV整合突变的数量差异;以t检验或方差分析评价基因表达水平的差异;以Pearson相关性检验分析APOBEC3表达与HBV整合突变的相关性;以Log-Rank检验评价HBV整合突变对HCC患者预后及复发的影响;以KEGG和GSEA分析确定HBV整合突变显著影响的信号通路和生物功能。P<0.05则判定差异具有统计学意义。下载HCC人群的高通量测序和表达谱公共数据库,包括HBV捕获测序数据库(SRP068532,426例样本)、癌症基因组联盟(The Cancer Genome Atlas,TCGA)的HCC随访队列数据库(LIHC,366例)以及基因表达数据集(Gene Expression Omnibus,GEO)的HCC表达谱数据库(GSE14520,242例)。利用上述数据库对本研究发现的HBV整合突变规律及功能进行验证。挑选APOBEC3A、APOBEC3B、以及DNA修复基因UNG的4个SNP位点进行研究。使用荧光定量PCR的方法对1449例健康对照和3772例HBV感染者(包括1271例HCC患者)进行SNP分型,使用巢式PCR扩增病毒preS和BCP区片段,使用MEGA软件分析病毒突变。用logistic回归计算SNP基因型与病毒清除、病毒突变以及HCC风险的相关性。研究结果:1.DNA和RNA水平的HBV整合规律有显著差异以HBV突变信息校正参考序列,可以提高HBV整合事件的检出率。本研究在基因组和转录组水平分别检测到HBV整合突变2777个和2918个。在DNA水平,癌症组织中的HBV整合数量显著高于癌旁组织(P=1.0×10-4);HCC术后未复发人群→HCC术后晚期复发人群(大于2年)→HCC术后早期复发人群(小于等于2年)的癌症组织中,HBV整合突变数量逐渐升高。在RNA水平,癌症组织中的HBV整合数量显著少于癌旁组织(P=1.2×10-3);各HCC进化阶段的人群之间,HBV整合突变数量没有显著差别。DNA水平的HBV整合突变仅有0.5%分布在线粒体基因组,而RNA水平的HBV整合突变则有19.43%分布在线粒体基因组。这一差别在验证队列中得到重复。2、HBV X片段是整合入人体基因组的主要片段HBV X区(nt1374-nt1835)的整合事件数在DNA水平、RNA线粒体基因组水平以及RNA核基因组水平的比例分别为31.6%,35.1%,以及58.0%,显著高于随机整合率(14%)。在高信号强度的HBV整合突变中,HBV X片段的比例更高。3、HBV高频整合基因在DNA水平,292个基因在≥2个样本中均检测到HBV整合突变,定义为重复整合基因;其中仅有11个(3%)在RNA水平也被鉴定为重复整合基因;只有2个(MLL4和TERT,0.6%)可以在同一样本的DNA和RNA数据中发现高度一致的HBV整合突变。在DNA水平,TERT的HBV整合突变检出率最高(16%),全部分布在启动子区。在RNA水平,ALB的HBV整合检出率最高(51%);同时,全部13个线粒体编码基因均发生了HBV整合突变,而且重复检出率均在13.2%-43%。4、HBV整合与基因表达的相关性在DNA水平,TERT启动子区的HBV整合与TERT基因在癌症组织中的表达升高有关(P=3.89×10-8);同时TERT上游3kb区域中HBV X片段的反向插入也有促进TERT表达的趋势;MLL4、MT-ND4等重复整合基因的表达水平与HBV在DNA链的整合无关。在RNA水平,MLL4、ALB、HP、MT-CO2和MT-CYB上的HBV整合突变与基因表达水平升高有显著相关性。5、HBV整合突变相关的信号通路DNA水平的整合突变显著富集于PI3K-mTOR通路和染色质重塑通路,通路整体整合突变率分别为30%和20%。RNA水平的整合突变显著富集于IL2-STAT5和IL6-STAT3等炎症通路。6、HBV整合对HCC预后的影响癌旁组织中DNA水平的HBV整合总数过高预示早期复发(P=0.012),该作用在验证队列中得到重复(P=0.014)。RNA水平上,癌旁组织中核基因组以及线粒体基因组上的整合突变总数过高,均可以预示HCC患者整体生存预后不良(P=0.027,0.033)。7、APOBEC3表达与HBV整合的相关性癌组织中APOBEC3A的表达与DNA和RNA水平的HBV整合突变总数呈显著正相关(DNA:Pearson相关系数=0.374,P=0.008;RNA:Pearson相关系数=0.302,P=0.035);UNG的表达与RNA水平的HBV整合突变总数呈显著负相关(RNA:Pearson相关系数=-0.388,P=0.008);癌旁组织中APOBEC3B的表达量与RNA水平的HBV整合突变总数呈显著正相关(Pearson相关系数=0.322,P=0.024)。癌症组织中APOBEC3A、APOBEC3B和UNG的表达升高均与HCC的预后不良有显著相关性;APOBEC特征性体细胞突变数仅在非HBV感染的HCC中与患者预后不良有显著相关性,但在HBV感染导致的HCC患者中与预后无关。8、APOBEC3B和UNG SNP与HCC发生风险的关系在HBV感染人群中,校正性别和年龄因素后,APOBEC3B的rs2267401 TG+GG基因型可以显著增加HCC发生风险[AOR(95%CI)=1.52(1.226-1.889)];UNG的rs3890995 TC+CC基因型可以显著增加HCC发生风险[AOR(95%CI)=1.28(1.109-1.477)]。9、APOBEC3B和UNG SNP与HBV突变的关系在HBV基因型C感染人群中,校正性别和年龄因素后,rs2267401 TG+GG基因型显著增加APOBEC相关的病毒突变水平,同时显著增加A1762T/G1764A的发生频率;rs3890995 TC+CC基因型显著增加G146C等11个促癌病毒突变的发生频率。10、APOBEC3B和UNG SNP与HBV突变在乙肝后肝癌中的交互作用在HBV基因型C感染人群中,校正性别和年龄因素后,rs2267401 TG+GG与A1762T/G1764A的交互作用显著升高HCC发生风险[AOR(95%CI)=6.05(3.407-10.726)],rs3890995 TG+GG基因型与G146C的交互作用显著升高HCC发生风险[AOR(95%CI)=4.14(2.679-6.399)]。研究结论:1、HBV整合突变的分布规律在DNA和RNA水平存在显著差异,绝大多数RNA水平的HBV整合突变不是由DNA的整合突变转录而来,而是在RNA链上直接插入病毒片段导致。2、RNA水平的HBV整合显著影响线粒体有氧氧化呼吸链的相关基因,DNA水平的HBV整合基因显著富集致癌通路;基因组和转录组水平的HBV整合事件数量过高均与预后不良有显著相关性,初步明确了HBV整合的促癌作用。3、发现RNA水平整合突变的发生与致突变基因APOBEC3A、APOBEC3B的表达呈正相关,同时也与体内炎症免疫通路密切相关;初步证明炎症通路刺激下诱变分子表达升高可以促进HBV整合突变的产生。4、APOBEC3A、APOBEC3B以及UNG的表达水平可以影响HCC患者预后,但APOBEC特征性的突变仅在非HBV感染导致的HCC患者中与预后相关;APOBEC3B和UNG的SNP位点(rs2267401和rs3890995)可以通过促进高危HBV突变产生,进而增加癌症风险;提示在HBV-HCC中,APOBEC3A、APOBEC3B和UNG不是通过直接损伤人体基因组致癌,而是通过与HBV相互作用导致癌症发生。