论文部分内容阅读
目的:本研究旨在利用生物信息学的方法分析乙肝、丙肝和酒精肝诱发的肝细胞癌(HCC)差异基因的表达,探讨影响肝细胞癌发生发展的机制,筛选出与肝细胞癌生存预后有关的关键基因,进一步为临床治疗提供重要的理论基础。方法:从基因表达综合数据库(Gene Expression Omnibus,GEO)中下载GSE62232基因芯片的表达谱,并利用R软件中的Limma包筛选出差异表达基因(Differently Expressed Genes,DEGs)。利用DAVID数据库对差异表达基因(DEGs)进行GO(Gene Ontology)富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)信号通路分析,并对差异表达基因进行功能注释。基于STRING数据库,对差异表达基因(DEGs)构建蛋白-蛋白相互作用(Protein-Protein Interaction,PPI)网络,将所得结果进一步导入Cytoscape软件,筛选出重要的功能模块。最后利用R软件中的Survival包,结合TCGA数据库对重要功能模块的关键基因进行生存预后分析。结果:从HBV相关性肝细胞癌中筛选出差异表达基因827个,其中包括309个上调基因和518个下调基因;从HCV相关性肝细胞癌中筛选出差异表达基因531个,包括187个上调基因和344个下调基因;从酒精相关性HCC筛选出差异表达基因461个,包括139上调基因个和322个下调基因。乙肝、丙肝和酒精肝诱发的肝细胞癌共同的差异表达基因有355个,包括99个上调基因和256个下调基因。GO富集分析提示:差异表达基因(DEGs)主要集中在物质代谢过程,氧化还原酶活性,染色质结合,胞外体和细胞外间隙等。KEGG信号通路主要富集在与代谢相关的途径,视黄醇代谢,化学致癌作用,P53信号通路等。此外,还构建了一个包含328个节点和1291个边缘的PPI网络,筛选出一个重要的功能模块,选出排列位置靠前的10个关键基因,分别是:CDK1、CCNB1、MAD2L1、CCNA2、TYMS、TOP2A、HHMR、CDKN3、NDC80和AURKA。通过对这10个关键基因进行生存预后分析,发现除了TYMS和CDKN3这2个基因表达水平的高低与患者的预后生存时间无关外,差异无统计学意义;其余8个基因高表达组较低表达组预后差,生存时间短,差异具有统计学意义。提示这8个基因的高表达可能促进了肝细胞癌的发生发展,进一步探讨其作用机制,可以为肝细胞癌的治疗提供重要的理论依据及新的治疗靶点。结论:1、乙肝、丙肝和酒精肝诱发的肝细胞癌共同的差异表达基因有355个,包括99个上调基因和256个下调基因。2、物质代谢过程,氧化还原酶活性,染色质结合,视黄醇代谢,化学致癌作用和P53信号通路等相关的基因可能促进了肝细胞癌的发生发展。3、CDK1、CCNB1、CCNA2、MAD2L1、TOP2A、HHMR、NDC80和AURKA与肝细胞癌患者的生存预后密切相关,高表达组较低表达组预后差,生存时间缩短,差异具有统计学意义,可作为肝细胞癌生存预后的关键基因。