论文部分内容阅读
肝细胞癌(Hepatocellular carcinoma,HCC)是最常见的原发性肝癌,近年来在中国大陆地区,肝癌的发病率和死亡率在所有癌症中分别排名第4位及第3位,在我国约65%的肝癌由乙型肝炎病毒(HepatitisBvirus, HBV)感染引起。HBV基因组包含4个相互重叠的开放读码框(Open reading frame,ORF) : preS/S、preC/C、P和X,编码HBV各种蛋白,包括:乙肝病毒表面抗原(Hepatitis B surface antigen,HBsAg)、乙肝病毒核心抗原(Hepatitis B core antigen,HBcAg)及乙肝病毒X蛋白(Hepatitis B x antigen,HBx)等,其中 HBcAg 及 HBsAg 属于结构蛋白,而 HBx属于调控蛋白,这些蛋白通过影响宿主细胞增殖、侵袭、分化、表观遗传特征、染色质稳定性,在HCC发生发展均起到了重要作用。由于HBV聚合酶缺乏校读活性以及病毒在宿主体内的高丰度存在,HBV基因组高度变异,进一步改变了上述病毒蛋白的功能,使得其对肝癌发生与发展的影响更为复杂,故HBV基因变异及其与肝癌发生发展的关系至关重要。尽管众多研究揭示了 HBV基因变异与HCC发生发展的关系,但HBV分型众多,且具有高度时空异质性,不同地区、不同人群、不同疾病阶段的研究仍然不可或缺,同时HBV基因变异与HCC患者预后的关系研究相对有限,并主要集中于基本核心启动子区域(Basal core promoter,BCP),有关HBV基因组其它区域变异与HCC患者预后的关系研究非常有限,同样值得研究,本文重点分析了 HBVpreC/C基因及HBx基因与HCC患者预后的关系,以期拓展对HBV基因变异及其对HCC进展影响的认识。此外,近年来研究表明,HBV在宿主体内并非以单倍体的形式存在,而是以复杂的准种形式存在,且随着感染进程变得愈加复杂,而传统的Sanger测序方法仅能获取有限的准种信息,难以深入探查HBV准种信息。近年来,下一代测序(Next generation sequencing,NGS)技术突飞猛进,其高通量、高灵敏度的特征为同时检测整个HBV准种提供了可能,故我们在一代测序的基础上,进一步使用NGS技术对慢乙肝(Chronic hepatitis B,CHB)患者及HCC患者的HBV基因组preS区进行深度测序,基于生物信息分析及临床关联分析,利用机器学习方法,探究HBV不同感染阶段HBV准种特征的差异及其作为新的肿瘤标志物的可行性。第一部分:HBV preC/C区变异与HCC患者预后的关系研究本研究旨在探讨本地区HBV相关HCC患者HBVpreC/C区进化规律,癌组织(Tumor tissue, TT )与癌旁组织(Adjacent non tumor tissue,ANTT)之间 preC/C区的差异,以及HBV preC/C区变异与HCC患者预后的关系。我们入选了 98例接受肝癌根治性切除术的HBV相关HCC患者,对HCC患者TT与ANTT的HBV preC/C区进行Sanger测序,构建基因进化树,计算同一患者TT与ANTT的HBV preC/C区之间进化距离并分析其与患者病毒学指标的关系,使用COX比例风险模型分析了 HBVpreC/C区变异与HCC患者术后总体生存期与无瘤生存期的关系,并对相关重要突变位点进行了临床分层分析。通过构建Neighbor-Joining进化树,我们发现所有的HBV preC/C区均属于C型,TT与ANTT preC/C区变异无显著差异,同一患者TT与ANTT的HBV preC/C区进化距离与血清及肝内HBVDNA水平呈显著负相关。多因素分析表明HBc E77突变是HCC患者术后总体生存期较短的风险因素,而HBc S87突变及P156突变是HCC患者术后更易复发的独立风险因素。分层分析表明,相比未携带突变HCC患者,携带HBc S87突变的HCC患者,其血清HBVDNA与肝内HBVDNA无显著相关性。综上所述,肝内HBV preC/C区的序列分析有助于了解病毒状态并可为HBV相关HCC患者预后评估提供更多依据。第二部分:HBV X区变异与HCC患者预后的关系研究本研究旨在探讨本地区HBV相关HCC患者HBV X区(HBx)的进化规律,癌组织与癌旁组织之间HBx的差异,HBx区变异与HCC患者预后的关系,以及重要的HBx突变对肝癌细胞功能的影响。我们入选了 90例接受肝癌根治性切除术的HBV相关HCC患者,进行了 48个月的随访,并对HCC患者TT与ANTT的HBx基因进行了 Sanger测序,构建了进化树,使用COX比例风险模型分析了 HBx区变异与HCC患者术后总体生存期与无瘤生存期的关系,并对相关重要突变位点进行了临床分层分析,此外我们还构建HBx及其突变体的表达载体,研究了 HBx及其突变体对肝癌细胞细胞功能的影响。通过构建Neighbor-Joining进化树,我们发现69例HBx属于C型,20例属于B型,TT HBx突变频率显著高ANTT组。多因素分析表明HBx 1479位(HBx第36位氨基酸)及1799位核苷酸(同义突变)突变是HCC患者术后复发的风险因素,而HBx第119位氨基酸突变则是HCC患者术后总体生存期更短的独立风险因素。B型HBV相关HCC患者预后更差,同时B、C型HBx序列存在较多差异,为排除分型对HCC患者术后影响,我们单独分析了 69例C型HBV感染患者的HBx序列变异情况及其与HCC患者预后的关系,结果表明C型HBx序列变异在TT与ANTT间无显著差异,多因素研究表明仅HBx 1479位核苷酸变异是HCC患者术后复发的风险因素,携带HBx 1479C的HCC患者,肿瘤更大,γ-谷氨酰转肽酶水平更高,临床症状更严重。成功构建了携带HBx及其P36T、K118T突变体的真核表达质粒,转染至肝癌细胞系后,HBx及其突变体促进了细胞的增殖与侵袭,但HBx及其P36T突变体、K118T突变体对细胞功能影响无显著差异。综上所述,HBx序列分析及HBV基因分型可以为HCC患者个体化诊疗及预后判断提供更多依据。第三部分:基于HBV基因preS区二代测序的HCC预测模型构建及验证本研究旨在探讨HCC患者血清、癌组织及癌旁组织HBVpreS序列特征及缺失特征差异,比较不同分型HBV感染者preS区序列特征及缺失特征差异,比较CHB患者与HCC患者preS区序列特征及缺失特征差异,并利用preS区序列特征、准种复杂度及缺失特征构建了 HCC预测模型。我们入选了 94例接受肝癌切除术的HBV相关HCC患者及45例CHB患者,对HBV preS区进行了高通量测序,根据preS区测序结果计算了单个样本的preS区k-mer频率,并计算了样本间Manhattan距离,同时,提取了 preS区核苷酸缺失频率,并计算了样本间Cosine距离,使用层次聚类、多维度标量方法比较了血清、癌组织及癌旁组织preS区序列特征及缺失特征,使用层次聚类、多维度标量方法比较了不同型别HBV preS区序列特征及缺失特征,以及CHB及HCC患者preS区序列特征及缺失特征,基于preS区序列特征或核苷酸缺失频率,分别训练了预测HCC发生的支持向量机(Support vector machine,SVM)模型,基于preS区序列准种复杂度,构建了预测HCC发生的弹性网络logistic回归模型,并对上述分类预测模型进行了 5-重交叉验证(Five fold validation,5-CV)及独立样本验证(Independent cohort validation,IV)。结果表明,HCC患者,血清、癌及癌旁组织之间preS区序列特征差异及缺失特征差异并不显著,相比癌组织,癌旁组织preS区序列缺失特征与血清样本更为相似。B型与C型HBV preS区序列特征及缺失特征均存在显著差异,相比HCC患者,CHB患者B型与C型HBVpreS区序列特征差异更为显著,相比CHB患者,HCC患者B型与C型HBV缺失特征差异更为显著。CHB患者与HCC患者preS区序列特征及缺失特征均存在显著差异,具有不同preS区缺失特征的HCC患者其临床指标存在一定差异。基于preS区序列特征或核苷酸缺失频率的预测HCC发生的SVM模型,在 5-CV 时平均曲线下面积(Area under receiver operation curve,AUROC)分别达到0.956及0.729,而使用独立样本验证时平均AUROC仅为0.624为0.694,基于preS 区序列准种复杂度的预测HCC发生的弹性网络logistic回归模型,在5-CV及IV时AUROC最高分别为0.98及0.840。综上所述,基于NGS的研究表明,血清、癌及癌旁组织preS序列特征及缺失特征无显著差异,不同分型HBV preS序列特征及缺失特征存在显著差异,基于preS序列特征、缺失特征特别是准种复杂度的机器学习模型可用于预测HCC的发生,具有成为HCC预测指标的潜力。以上三部分的研究表明,HBc及HBx的突变位点,与HCC患者预后密切相关,经扩大样本及功能实验验证,未来可用于HCC患者精确诊疗及预后评估。通过对HBVpreS区的二代测序结果的定量分析,为HBV准种结构及HBV变异在HCC进展中的作用研究提供了新的工具,利用前沿的机器学习方法,构建了基于二代测序结果的HCC预测模型,为HCC的诊断及治疗提供了新的研究思路与方法。