大数据挖掘影响肺腺癌总生存的分子机制

来源 :青岛大学学报(医学版) | 被引量 : 0次 | 上传用户:q344494
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]目的大数据挖掘影响肺腺癌总生存的分子机制。方法分析癌症基因组图谱(TCGA)数据库中肺腺癌RNA测序数据,将肺腺癌样本中上调的mRNA分别在10套GEO基因芯片数据中进行生存分析。应用生物信息分析方法探索微小染色体维持蛋白4(MCM4)基因上游相关的微小RNA(miRNA)以及长链非编码RNA(lncRNA)。结果MCM4 mRNA高表达,在10套独立数据中均可致肺腺癌总生存下降(χ2=4.16~10.70,P<0.05)。与MCM4呈显著线性负相关的miRNA为miR-338-3p(r=-0.379,P<0.01),与MCM4呈显著线性正相关的lncRNA为ENSG00000228801.5(r=0.438,P<0.001)、ENSG00000234129.3(r=0.461,P<0.001)、ENSG00000259758.1(r=0.431,P<0.001),并且利用miRanda及DIANA tool数据库证明了调控的可信性。结论ENSG00000228801.5→miR-338-3p→MCM4、ENSG00000234129.3→miR-338-3p→MCM4、ENSG00000259758.1→miR-338-3p→MCM4通路与肺腺癌病人的总生存相关。
  [关键词]肺肿瘤;腺癌;生存时间;数据挖掘;微小染色体维持蛋白类
  [中图分类号]R734.2[文献标志码]A[文章编号]2096-5532(2018)06-0639-04
  MOLECULAR MECHANISM INFLUENCING THE OVERALL SURVIVAL OF LUNG ADENOCARCINOMA: A STUDY BASED ON BIG DATA MINING ZHANG Jianbo, LIU Huamin, WANG Guie, XIA Yujun(Department of Human Anatomy and His-toembryology, School of Basic Medicine, Qingdao University, Qingdao 266071, China)
  [ABSTRACT]ObjectiveTo investigate the molecular mechanism influencing the overall survival of lung adenocarcinoma based on big data mining. MethodsBased on TCGA lung adenocarcinoma RNA sequencing data, we first collected up-regulated mRNAs in lung adenocarcinoma samples, and then conducted survival analysis using the up-regulated mRNAs in 10 independent GEO datasets. Bioinformatics methods were used to find the potential upstream long non-coding RNAs (lncRNAs) and microRNAs (miRNAs) of minichromosome maintenance complex component 4 (MCM4). ResultsUp-regulated MCM4 mRNA was asso-ciated with significantly reduced overall survival of lung adenocarcinoma in all 10 datasets (χ2 =4.16-10.70,P<0.05). miR-338-3p was negatively correlated with MCM4 (r=-0.379,P<0.01), and three lncRNAs, ENSG00000228801.5 (r=0.438,P<0.001), ENSG00000234129.3 (r=0.461,P<0.001), and ENSG00000259758.1 (r=0.431,P<0.001), were positively correlated with MCM4. Furthermore, we used miRanda and DIANA tool to attest the validity of these regulations. ConclusionThree lncRNA-miRNA-mRNA regulations, ENSG00000228801.5→miR-338-3p→MCM4, ENSG00000234129.3→miR-338-3p→MCM4, and ENSG00000259758.1→miR-338-3p→MCM4, are related to the overall survival of lung adenocarcinoma patients.
  [KEY WORDS]lung neoplasms; adenocarcinoma; survival time; data mining; minichromosome maintenance proteins
  肺癌是發病率和死亡率增长最快的恶性肿瘤,中国国家癌症中心2015年发布的数据显示,我国2006—2011年的5年肺癌患病率在男性恶性肿瘤中居第2位,在女性恶性肿瘤中居第4位[1]。肺癌由于早期诊断困难及缺乏有效的治疗手段,其5年生存率仅为15%左右[2-4]。肺腺癌作为肺癌最常见的病理类型,恶性程度高,容易复发和发生远处转移,导致病人生存率低,预后差[5-8]。肺腺癌发生的分子机制复杂,涉及染色体不稳定、抑癌基因失活、癌基因激活、信号传导通路异常及DNA错配修复缺失等多分子事件。研究影响肺腺癌病人总生存的相关分子事件,或可为提高肺腺癌的疗效提供转化医学的证据。本文拟利用癌症基因组图谱(TCGA)数据库及GEO数据库样本进行数据挖掘,初步探索影响肺腺癌总生存的分子机制。   1材料与方法
  1.1实验样本信息收集
  于TCGA数据库(https://cancergenome.nih.gov/)中收集肺腺癌相关的RNA测序数据(Level 3),筛选所有同时具备肺腺癌组织与癌旁正常组织的测序数据的样本,共58对。
  640青岛大学学报(医学版)54卷
  收集TCGA数据库中肺腺癌RNA测序数据(Level 3),筛选同时具备微小RNA(miRNA)、长链非编码RNA(lncRNA)及mRNA测序信息的样本,共420例。
  1.2独立验证样本信息收集
  于GEO数据库(https://www.ncbi.nlm.nih.gov/gds/)中收集具备生存时间信息的肺腺癌相关mRNA基因芯片数据,共10套,分别为GSE43767、68465、3141、41271、11969、30219、42172、50081、13213、8894。
  1.3统计学处理
  所有数据均采用R语言(版本号2.15.3)进行分析。差异表达mRNA热图绘制应用“pheatmap”包,生存曲线绘制及生存分析计算应用“survival”包,线性相关分析绘图应用“ggplot2”包。总生存率的比较采用χ2检验,以P<0.05为差异有显著性;相关性检验采用线性相关分析,以P<0.001为差异有显著性。
  2结果
  2.1癌与癌旁配对样本差异表达的mRNA
  将58对肺腺癌标本癌及癌旁正常组织的RNA测序数据进行差异基因分析,取经FDR校正后的P<1×10-6、差异倍数(fold change)>4,得到肺腺癌中表达上调的574个mRNA以及表达下调的900个mRNA,热图见图1。
  2.2微小染色体维持蛋白4 (MCM4)mRNA与总生存的相关性
  将上述肺腺癌样本中上调的574个mRNA,依据RNA表达量的中位值分为高、低表达两组,分别在10套带有生存信息的GEO基因芯片数据(共计1 367例样本)中进行Kaplan-Meier生存分析。结果显示,只有MCM4 mRNA在10套GEO数据中均能显著区分生存,并且均是在MCM4 mRNA高表达时,肺腺癌的总生存率下降(χ2=4.16~10.70,P<0.05)。见图2。
  2.3与MCM4相关的miRNA和lncRNA筛选
  为深入研究MCM4影响肺腺癌总生存的分子机制,进一步在TCGA数据库中筛选与MCM4相关的miRNA和lncRNA,探索可能的lncRNA-miRNA-MCM4调控通路。将所有表达的miRNA与MCM4进行线性相关分析,入选条件:①R<-0.3,P<0.001;②符合miRanda miRNA-mRNA关系对预测算法。结果满足条件的miRNA仅有1个,为miR-338-3p,与MCM4呈显著线性负相关(r=-0.379,P<0.001)。将所有表达的lncRNA与MCM4进行线性相关分析,入选条件:①r>0.3,P<0.001;②符合DIANA tools lncRNA-miRNA关系对预测算法。结果共筛选到3个lncRNA,分别为ENSG00000228801.5、ENSG00000234129.3以及ENSG00000259758.1,三者均与MCM4呈显著的线性正相关(r=0.431~0.461,P<0.001)。据此,可以得到3条可能影响肺腺癌总生存的lncRNA-miRNA-MCM4通路:ENSG00000228801.5→miR-338-3p→MCM4、ENSG00000234129.3→miR-338-3p→MCM4、ENSG00000259758.1→miR-338-3p→MCM4。miRNA和lncRNA与MCM4 mRNA的相关性分析见图3。
  3讨论
  近10余年来,随着分子靶向药物的不断涌现,肺腺癌的治疗已经从以铂类为基础的化疗发展到个体化分子精准治疗。越来越多的驱动基因被发现并被应用于临床治疗。本研究应用生物信息分析技术从大数据挖掘影响肺腺癌总生存的mRNA角度着手,对1 367例mRNA基因芯片样本进行分析,结果显示,MCM4 mRNA高表达可显著缩短肺腺癌病人的总生存时间。查阅文献未见MCM4 mRNA与肺腺癌侵袭、转移及总生存时间之间关系的报道。MCM4是微小染色体维持蛋白家族成员[9-11],与DNA复制的启动相关[9,12-15]。MCM4在妇科肿瘤中的研究较多,结果显示MCM4在宫颈癌、卵巢浆液性肿瘤、子宫内膜腺癌中高表达,并与其不良预后相关[16-17]。亦有研究显示,MCM4在食管癌中高表達,并与食管癌的早期发生相关[18]。MCM4在肺癌
  6期张建波,等. 大数据挖掘影响肺腺癌总生存的分子机制641中的研究较少,KIKUCHI等[19]研究显示,MCM4高表达可促进肺癌细胞增殖,并且MCM4高表达与男性、吸烟、组织低分化相关,可促进Ki-67及细胞周期蛋白E的表达。然而,MCM4促进肿瘤细胞增殖及导致不良预后的机制研究仍较少,在卵巢癌中的研究发现,转录因子E2F2可诱导MCM4的高表达,并缩短病人的总生存时间[20]。
  本研究对TCGA数据库中RNA测序数据进行分析,结果显示,MCM4在肺腺癌样本中高表达,并且其高表达在10套独立GEO数据中均可显著缩短病人的总生存时间。进一步行生物信息分析得到了其上游的3条通路:ENSG00000228801.5→miR-338-3p→MCM4、ENSG00000234129.3→miR-338-3p→MCM4、ENSG00000259758.1→miR-338-3p→MCM4。这为后续研究MCM4影响肺腺癌总生存的分子机制提供了思路,或可通过深入探索为肺腺癌的精准治疗提供分子依据。
  [参考文献]   [1]CHEN Wanqing, ZHENG Rongshou, BAADE P D, et al. Cancer statistics in China, 2015[J].  CA-A Cancer Journal for Clinicians, 2016,66(2):115-132.
  [2]LI Chihan, CHEN Yangchao. Targeting long non-coding RNAs in cancers:progress and prospects[J].  The International Journal of Biochemistry & Cell Biology, 2013,45(8):1895-1910.
  [3]LEE H W, LEE C H, PARK Y S. Location of stage Ⅰ-Ⅲ non-small cell lung cancer and survival rate:systematic review and meta-analysis[J].  Thoracic Cancer, 2018.doi:10.1111/1759-7714.12869.
  [4]ALBANO D, BILFINGER T, NEMESURE B. 1-,3-,and 5-year survival among early-stage lung cancer patients treated with lobectomy vs SBRT[J].  Lung Cancer(Auckland, N.Z.), 2018,9:65-71.
  [5]LITTLE A G, GAY E G, GASPAR L E, et al. National survey of non-small cell lung cancer in the United States: epidemiology, pathology and patterns of care[J].  Lung Cancer, 2007,57(3):253-260.
  [6]LU Shun, YU Yongfeng, CHEN Zhiwei, et al. Maintenance therapy improves survival outcomes in patients with advanced non-small cell lung cancer:a meta-analysis of 14 studies[J].  Lung, 2015,193(5):805-814.
  [7]JIMNEZ-BONILLA J F, QUIRCE R, MARTNEZ-ROD-RGUEZ I, et al. The role of PET/CT molecular imaging in the diagnosis of recurrence and surveillance of patients treated for non-small cell lung cancer[J].  Diagnostics(Basel, Switzerland), 2016,6(4):36.
  [8]LANUTI M. Risk stratification for distant recurrence of resected early stage non-small cell lung cancer is under construction[J].  The Journal of Thoracic and Cardiovascular Surgery, 2018,155(3):1225-1226.
  [9]WANG Xuan, ISHIMI Y. Function of the amino-terminal region of human MCM4 in helicase activity[J].  Journal of Biochemistry, 2018.doi:10.1093/jb/mvy072.
  [10]CHOY B, LALONDE A, QUE J W, et al. MCM4 and MCM7, potential novel proliferation markers, significantly correlated with Ki-67, Bmi1, and cyclin E expression in eso-phageal adenocarcinoma, squamous cell carcinoma, and precancerous lesions[J].  Human Pathology, 2016,57(57):126-135.
  [11]WATANABE E, OHARA R, ISHIMI Y. Effect of an MCM4 mutation that causes tumours in mouse on human MCM4/6/7 complex formation[J].  Journal of Biochemistry, 2012,152(2):191-198.
  [12]MAINE G T, SINHA P, TYE B K. Mutants of S.cerevisiae defective in the maintenance of minichromosomes[J].  Gene-tics, 1984,106(3):365-385.
  [13]SHEU Y J, KINNEY J B, LENGRONNE A, et al. Domain within the helicase subunit Mcm4 integrates multiple kinase signals to control DNA replication initiation and fork progression[J].  Proceedings of the National Academy of Sciences of the United States of America, 2014,111(18):E1899-E1908.   [14]CASEY J P, NOBBS M, MCGETTIGAN P, et al. Recessive mutations in MCM4/PRKDC cause a novel syndrome involving a primary immunodeficiency and a disorder of DNA repair[J].  Journal of Medical Genetics, 2012,49(4):242-245.
  [15]YUN H J, HYUN S K, PARK J H, et al. Widdrol activates DNA damage checkpoint through the signaling Chk2-p53-Cdc25A-p21-MCM4 pathway in HT29 cells[J].  Molecular and Cellular Biochemistry, 2012,363(1/2):281-289.
  [16]ISHIMI Y, OKAYASU I, KATO C, et al. Enhanced expression of Mcm proteins in cancer cells derived from uterine cervix[J].  European Journal of Biochemistry, 2003,270(6):1089-1101.
  [17]ASFORA W T, KLAPPER H B. Case report:treatment of subdural hematoma in the emergency department utilizing the Subdural Evacuating Port System[J].  South Dakota Medicine:the Journal of the South Dakota State Medical Association, 2012,65(9):354-355.
  [18]HUANG Xiaoping, RONG Tiehua, WU Qiuliang, et al. MCM4 expression in esophageal cancer from southern China and its clinical significance[J].  Journal of Cancer Research and Clinical Oncology, 2005,131(10):677-682.
  [19]KIKUCHI J, KINOSHITA I, SHIMIZU Y, et al. Minichromosome maintenance(MCM)protein 4 as a marker for proliferation and its clinical and clinicopathological significance in non-small cell lung cancer[J].  Lung Cancer, 2011,72(2):229-237.
  [20]XIE L, LI T, YANG L H. E2F2 induces MCM4, CCNE2 and WHSC1 upregulation in ovarian cancer and predicts poor overall survival[J].  European Review for Medical and Pharmacological Sciences, 2017,21(9):2150-2156.
其他文献
“移民车间”尊重员工个体独特性、深层情感和发展需求,不断提升员工幸福指数,实现员工与企业共同发展。荆门石化联合三车间现有236名员工,其中188人是来自11个关、停、并、
煤制油初具规模,煤制气快速发展,煤化工项目频繁获批,我国煤化工产业正在加速。
"我要利用大师工作室这个平台,不断创新,为催化装置的平稳运行保驾护航,为公司创造更多的效益。"自担任集团公司技能大师以来,金陵石化炼油一部催化裂化装置操作工张思豪一直用
必须严格管控,规范运作,确保向北部湾排放的每一滴水都符合国家标准,还海洋—份洁净。“大力推进加油站生态文明建设,不仅是保护环境,履行社会责任的重要举措,也是造福员工、建设基
镇海炼化、茂名石化是中国石化炼油板块中装置规模、经济技术指标、效益、管理水平领先的两大企业,可以称为中国石化的"炼油双雄"。两大企业怎样打造世界一流?记者在近日采访中
我院 2 0 0 0年 9月用化学消融方法治疗肥厚性梗阻型心肌病患者 1例 ,经长期随访取得良好疗效 ,现报道如下。患者男 ,6 2岁 ,心悸、气短 2 2年 ,加重 4 0余天于 2 0 0 0年9月
期刊
混合风格是文学作品实际存在但却被长期忽视的一种十分普遍的文学现象,是一条艺术规律,是一种体现作家创作个性的艺术风格,是作家成熟、作品成功的重要标志,有着独特的美学意
连续数年的低油价不仅打击了巴西原本蒸蒸日上的油气工业,也影响了这个南美最大国家的经济发展。奥运会之后的巴西,有意通过修订引资政策,大举拍卖油气区块,以期重振油气雄风
国网无锡供电公司(以下简称“无锡公司”)隶属国网江苏省电力公司(以下简称“省公司”),肩负着无锡两市五区的电力保供任务。近年来,公司大力弘扬“努力超越,追求卓越”的企
[摘要]目的探讨红细胞体积分布宽度(RDW)与衰弱老年急性心肌梗死(AMI)病人短期预后关系。方法选取2012年12月—2016年12月入住我院并且诊断为AMI的衰弱老年病人669例,根据总体RDW的四分位数分为4组,比较4组病人的住院病死率。通过ROC曲线估算RDW的诊断截点,并根据此截点将病人分为2组进行生存分析,再通过寿命表法、COX回归分析评估RDW的预后预测价值。结果随着RDW的增大,病