论文部分内容阅读
鼻咽癌是我国华南地区高发的恶性肿瘤,早期症状不明显,易造成漏诊误诊。鼻咽癌诊断存在血清学标志物敏感度及特异度不高、影像学筛查费用昂贵、分辨率不高、病理活检侵入危害等限制。因此开发更多特异性生物标志物是亟待推进的问题。本研究目的是筛选一批与鼻咽癌发生发展相关的非编码RNA(non-coding RNA)和基因标志物,阐述它们相互之间的调控模式,为进一步研究鼻咽癌病理过程中的生物学功能提供新视角。以鼻咽癌为研究对象,通过生物信息学技术分析高通量竞争性内源RNA(ceRNA)芯片、来源于GEO数据库甲基化芯片和基因表达谱芯片,筛选差异表达环状 RNA(circular RNA,circRNA)、长链非编码 RNA(long ncRNA,lncRNA)、差异表达基因(Differentially expressed gene,DEG)、差异 DNA 甲基化 CpG 位点(Differential methylation CpG sites,DMCs)。利用 GO 和 KEGG 进行功能分析,构建 lncRNA-mRNA、circRNA-miRNA 和 circRNA-mRNA 相互作用网络,使用STRING数据库和Cytoscape软件对差异基因构建蛋白互作网络(protein-protein interaction,PPI),并寻找核心基因。构建随机森林分类模型筛选显著基因。在微阵列芯片中筛选出差异表达的hsacirc0007542,使用实时荧光定量聚合酶链反应(Quantitative real-time polymerase chain reaction,qRT-PCR)在4株鼻咽癌细胞系和1株永生化鼻咽上皮细胞中验证。最后综合分析差异表达基因和异常甲基化位点基因,筛选高甲基化-低表达和低甲基化-高表达基因,在TCGA数据库中验证筛选出基因的甲基化和表达水平。我们在ceRNA芯片中发现了 3048个差异表达的circRNAs、2179个lncRNAs、2015个mRNAs、GEO数据库中92个差异表达基因、3264个异常DNA甲基化位点;在GO功能富集中,circRNA主要涉及到转化生长因子-β(transforming growth factor-beta secretion),lncRNA顺式和反式靶基因分别富集到L-蛋氨酸回收(L-methionine salvage)和舌咽神经发育(glossopharyngeal nerve development),mRNA 富集到自我抗原耐受性诱导(tolerance induction to self-antigen),GEO中差异表达基因则富集在药物代谢-细胞色素P450途径(drug metabolism-cytochrome P450 pathway)功能中;KEGG 通路分析中,circRNA 主要参与磷酸和磷酸代谢(phosphonate and phosphinate metabolism)通路,mRNA参与B细胞受体信号通路(B cell receptor signaling pathway),lncRNA顺式靶基因主要参与糖胺聚糖生物合成-硫酸肝素/肝素(glycosaminoglycan biosynthesis-heparan sulfate/heparin),反式靶基因主要参与磷酸和磷酸代谢(phosphonate and phosphinate metabolism)通路,GEO 中差异表达基因则与纤毛部分(ciliary part)、运动纤毛(motile cilium)等通路有关;基于4-mRNAs(STOML3、MROH2A、AMY1C 和 FERMT1)构建风险评估模型:0.7889×FERMT1-1.4967×STOML3-1.0247×MROH2A-0.5226×AMY1C,其敏感性 94.4%和特异性100%,表明该风险评估模型能有效用于鉴别鼻咽癌患者;CLIC6和CLU构成的模型分类效果较好,其ROC曲线下面积最高达0.985,能有效鉴别鼻咽癌组织和正常对照组织;差异表达hsacirc0007542真实存在,且与正常鼻咽细胞相比,其在鼻咽癌细胞中显著上调(P<0.05);筛选出5个高甲基化-低表达基因(CLDN10、CLIC6、LRRC10B、SORBS2 和 UBXN10 基因),经过在 TCGA 数据库验证,CLDN10、CLIC6和SORBS2基显著高甲基化且表达下调,而LRRC10B和UBXN10呈现低甲基化,表达水平无统计学意义。本研究呈现了鼻咽癌中异常表达的非编码RNA、表达基因、DNA甲基化位点的分析图谱。它们可能通过参与鼻咽癌发病密切相关的通路,调控鼻咽癌的发生发展,有望成为鼻咽癌诊断生物标志物和药物治疗靶点,加深对鼻咽癌发病机制的理解。图18 表格5 参考文献125