论文部分内容阅读
目的潜在治疗靶点的筛选鉴定是肿瘤研究的关键。本研究利用癌症和肿瘤基因图谱计划(The Cancer Genome Atlas,TCGA)中RNA-Seq数据构建乳腺癌相关长链非编码RNA(long non-coding RNA,lncRNA)-微小RNA(microRNA,miRNA)-mRNA共表达网络,并筛选验证其中的关键基因。方法对TCGA中1 213例乳腺样本RNA-Seq数据及临床资料进行整理。提取其中113例乳腺癌及癌旁配对样本分析其中lncRNA、miRNA及mRNA的表达差异。利用WGCNA计算上述差异基因在1 100例乳腺癌样本中表达的相关性并构建共表达网络。通过排列网络中基因与基因连接的数量关系分别筛选出关键的lncRNA、miRNA及mRNA,并利用本地标本库乳腺癌样本对关键基因在癌和癌旁的表达进行验证。最后,结合TCGA的临床资料采用Kaplan-Meier分析不同表达患者的生存率差异。结果在113例配对乳腺癌及癌旁样本中共发现4 582个差异基因,其中3 514个表达上调,1 068个表达下调。对上述差异基因的聚类分析可以有效地区分肿瘤与正常组织。构建的共表达网络包括739个节点及17 375个连接,其中lncRNA 65个,miRNA 3个,mRNA 671个,占整个差异表达基因的16.1%。网络中的关键基因CDK1(P<0.001)、RP11-214F16.8(P=0.048)和MIR27A(P=0.027)在肿瘤组织中的表达均高于正常癌旁组织。低表达RP11-214F16.8、MIR27A患者总体生存显著好于高表达患者,均P值<0.001;CDK1的表达与预后有一定程度的关联,但尚未达到有统计学意义的水平,P=0.061。结论乳腺癌相关lncRNA-miRNA-mRNA共表达网络为后续更深入研究乳腺癌关键基因及基因间的调控关系提供了参考和方向。通过共表达网络筛选关键基因是一种兼具高效性和生物学意义的方法。