论文部分内容阅读
研究背景作为当前全世界发生率及死亡率最高的恶性肿瘤,肺癌具有很强的异质性。根据几十年来沿用的组织学分类方法指导下的肺癌治疗,目前已遭遇重大瓶颈,而基于生物学特性的肺癌分类,仍是当前选择治疗策略的基础。根据非小细胞(non small cell lung cancer, NSCLC)患者表皮生长因子受体(epidermal growth factor receptor, EGFR)是否存在敏感突变来选择治疗方案,这种量体裁衣的策略为靶向治疗目标人群带来了突破性的生存获益,已成为NSCLC基于分子分型个体化治疗的典范。然而,NSCLC患者中分子驱动事件未知的仍占据相当份额,为了这部分患者也能得到最适宜的个体化治疗,需要更详细的NSCLC分子分型。2007年,间变性淋巴瘤激酶(anaplastic lymphoma kinase, ALK)基因和棘皮动物微管相关蛋白样4(echinoderm microtubule associated protein like4, EML4)融合型肺癌的发现,堪称NSCLC临床研究史上的又一里程碑事件。研究提示,该分子亚型的肺癌患者约占所有患者的5%;同时将EML4-ALK转染入正常细胞后,该细胞可转化为肿瘤细胞,进入体内后将最终定位于肺部形成肿瘤;体内实验证实,表达EML4-ALK融合基因的NSCLC中瘤细胞在应用针对ALK的特异性小分子酪氨酸激酶抑制剂(tyrosine kinases inhibitors, TKIs)Crizotinib后,肿瘤可显著缩小乃至消失;早期临床试验亦显示,ALK融合型肺癌患者在给予ALK TKI后,其生存获益较标准治疗有显著提高。目前美国食品药品监督管理局(Food and Drug Administration. FDA)已批准将ALK TKI应用于发生ALK融合的晚期NSCLC患者。因此,EML4-ALK已成为继EGFR之后NSCLC的一个新治疗靶标。本研究所就收治的连续NSCLC病例进行了流行病学的初步研究,发现EML4-ALK在未经选择的国人患者中,发生率高于已报道的欧美日等发达国家和地区:且多发生于腺癌患者中。在与EGFR, K-RAS突变等常见肺癌分子事件间的相关性研究发现,EML4-ALK与上述两者基本呈互斥性。目前,ALK作为受体酪氨酸激酶之一,其下游调控细胞恶性转化生长的分子机制和相关关键信号通路尚不清楚,需要依靠流行病学数据提供的概率和趋势,应用高通量的生物信息学手段,从海量数据中总结其独特之处,并根据计算结果对关键分子进行后续的功能验证。因此本研究分成二个部分:第一部分采用生物信息学领域相关工具,全面分析发生EML4-ALK基因融合的NSCLC在肿瘤信号转导中各信号通路的变化状态,并与发生其他分子事件的肺癌组织进行比较,筛选差异表达基因,对其进行注释及归类,在整体水平初步探索EML4-ALK融合型NSCLC的发病机制、特异性的生物学行为及信号转导特征。第二部分主要对第一部分的发现进行初步的功能验证。通过对表达谱芯片的数据挖掘,我们发现STAT3参与的诸多肿瘤生物学过程和信号转导通路在EML4-ALK融合型肺癌的信号转导中发挥了关键性作用,该基因在多条重要通路中处于枢纽位置。为初步验证STAT3的功能,我们通过RNAi技术在出现EML4-ALK融合及对照细胞系中沉默STAT3的表达,并通过构建STAT3表达载体,利用分子克隆技术,将其在靶细胞中过表达,尝试从正反两个方面论证STAT3主导的信号转导过程中,该分子表达水平的高低对通路各关键节点的影响,并初步分析该基因与肿瘤细胞增殖、凋亡间的相互作用,为后续的临床研究及个体化治疗提供理论支持。课题设计与主要结果第一部分EML4-ALK融合型肺癌生物学特性的数据挖掘与分析第一章ALK表达水平与EML4-ALK融合发生的关系目的分析NSCLC组织中EML4和ALK基因表达水平与EML4-ALK融合型肺癌发生的相关性。材料与方法将本研究所流行病学研究的标本中质控合格的94例NSCLC组织标本制备表达谱芯片,采取customCDF的注释方法及RMA(Robust multiarray analysis)算法计算芯片杂交信号值。方差分析比较EML4-ALK融合组、非融合组和正常组织EML4、ALK两个基因的表达水平;Pearson相关分析比较两者间的相关性。结果customCDF注释方法共注释18123个人类基因。含EML4-ALK融合组11例及非EML4-ALK融合组83例,应用RMA算法计算ALK基因表达信号值并对数均一化后,EML4-ALK融合组肿瘤标本均值+SD为5.27±1.35,非EML4-ALK融合组肿瘤组织为2.99±0.17,正常组织中为2.86±0.16,EML4-ALK融合高于非融合组(P=0.001),高于正常组织(P=0.000),差异有统计学意义,非融合组高于正常组织(P=0.000),差异有统计学意义;EML4基因表达水平在融合组肿瘤组织、非融合组肿瘤组织和正常组织中表达水平分别为6.47±0.29、6.87±0.48和6.42±0.47,融合组与非融合组EML4表达差异有统计学意义(P=0.003),非融合组与正常组EML4表达差异有统计学意义(P=0.000),融合组与正常组EML4表达差异无统计学意义(P=0.922)。Pearson目关分析融合组与非融合组EML4或ALK表达的相关性:EML4表达水平与融合基因状态相关(P=0.009),但R=-0.268,仅有弱相关性,实际效用很低;ALK表达与融合基因状态相关(P=0.000).R=0.844,具有强相关性。结论ALK基因高水平的表达和EML4-ALK融合显著相关。第二章EML4-ALK融合型与野生型NSCLC差异表达基因的筛选及功能注释目的根据NSCLC分子分型,筛选EML4-ALK融合型NSCLC标本和无ALK、K-RAS、EGFR等分子事件的标本(本文称为野生型NSCLC,下同)间差异表达基因,基因本体(gene ontology. GO)勺注释分析,总结出有差异的基因功能集,并从中筛选出与肿瘤发生、进展密切相关的信号通路,作为后续功能验证的基础。试图阐述两个方面问题:一是基因表达模式是如何在EML4-ALK融合型NSCLC中发生变化的;二是差异表达基因参与的代谢途径有哪些以及这些代谢途径在EML4-ALK融合型NSCLC发生过程中的可能作用。材料与方法综合数据挖掘工具BRB-Array Tools(v4.1)、DAVID(Database for Annotation. Visualization, and Integrated Discovery, v6.7、GSEA(Gene Set Enrichment Analysis,v3.7),分别对ALK融合型NSCLC和非ALK融合型NSCLC表达谱芯片数据集进行数据挖掘,参考数据库为GO、KEGG等,并应用文献自主挖掘系统对pubmed上可检索到的文献(仅针对摘要内容)进行了初步的挖掘与筛选,以寻找组间差异表达基因,并对其生物学行为过程、分子生物功能、信号转导通路等领域进行了基因集富集和聚类分析。结果EML4-ALK融合型与野生型NSCLC相比存在83个差异表达基因,其中30个基因出现表达水平的显著上调;53个基因出现显著下调。这些差异表达基因经注释和富集分析,涉及5个生物学过程和4条信号转导通路。结论差异表达基因间具有一定的“相关性”,很少出现单个或是几个基因参与某个生物过程。EML4-ALK融合型肺癌形成并非某个分子的生物学行为,上述这些基因功能和信号转导通路的变化相互交错、互相影响,最终构成了EML4-ALK融合型NSCLC区别其他肺癌的分子基础。第二部分EML4-ALK信号通路关键基因STAT3的初步功能验证第一章STAT3表达产物的蛋白质相互作用网络构建目的将与STAT3基因产物相互作用的蛋白质构建相互作用网络,以此为依托探索其中的核心蛋白STAT3在EML4-ALK融合型肺癌中的作用。以期从蛋白质相互作用水平阐述STAT3勺异常与该型肺癌的联系。材料与方法以EML4-ALK融合型肺癌和野生型肺癌差异表达基因为基础,应用cytoscape(v2.8)软件系统构建蛋白质相互作用网络,在蛋白质数据库SWISS-PORT、HPRD中检索相关蛋白质相互作用并结合文献数据挖掘构建与STAT3基因产物相互作用的网络,对STAT3在肺癌参与的信号通路进行富集分析,并与EML4-ALK出现异常的生物学行为和信号转导网络进行比对。结果以肺癌中与STAT3存在相互作用的蛋白质为基础,构建蛋白质相互作用网络(protein-protein interaction, PPI)。之现113个蛋白与STAT3相互作用,涉及至少23条与肺癌显著相关的生物学过程、分子功能及信号转导通路;将其进行功能聚类后与EML4-ALK融合型肺癌中出现异常表达的基因集求交集(与非ALK融合型非小细胞肺癌比较,ALK融合型肺癌存在83个异常表达基因。见第一部分第二章结果部分),发现STAT3调节的ALK、GHR两个分子在EML4-ALK型肺癌中异常表达;STAT3参与调节的Wnt通路在EML4-ALK融合型肺癌中也表达失调。结论STAT3通过与ALK的直接相互作用,可能参与EML4-ALK融合型肺癌的发生与增殖;该基因调节的Wnt等信号通路在EML4-ALK融合型肺癌中亦存在异常。这些发现揭示了STAT3在EML4-ALK融合型肺癌中的重要作用,有必要对STAT3基因的功能在EML4-ALK融合型肺癌中的作用进行进一步验证。第二章模式细胞中STAT3的表达对其生物学特性的影响目的根据生物信息学分析,STAT3在EML4-ALK融合型肺癌中发挥了重要的信号转导功能。本研究应用表达载体介导的RNAi技术及分子克隆技术,构建STAT3干扰或过表达载体并通过在模式细胞中控制该基因表达,探索EML4-ALK融合型肺癌中沉默或上调STAT3信号通路后肿瘤细胞生物学行为的改变。方法细胞培养:复苏表达EML4-ALK融合基因的人肺腺癌H2228及EGFR/K-RAS野生型肺腺癌细胞株H1299,并用含10%胎牛血清的RPMI1640传代培养。确定shRNA-STAT3序列:根据Genebank中检索到人STAT3全长开发读码框(open reading frame, ORF),调取3条不同的RNAi Consortium数据库中经商业验证的shRNA-STAT3序列,并进行BLAST验证比对。重组载体pSilencer4.1_CMV_STAT3的构建与鉴定:以这三条验证有效的siRNA干扰序列为基础,遵从Ambion公司提供的pSilencer4.1_CMV载体构建说明,将其设计为特异性的shRNA-STAT3单链模板。将合成的3对单链寡核苷酸经HPLC纯化、等比例混合退火后,与经BamHI和Hind Ⅲ双酶切线性化的pSilencer4.1_CMV按说明书建议比例以T4DNA连接酶16℃过夜连接;环化成功的质粒转化DH5a;以Amp筛选阳性克隆并挑取之,然后过夜摇菌扩增;小提质粒双向测序鉴定;中提并纯化成功构建的干扰质粒pSilencer4.1_CMV_STAT3,分装备用。克隆STAT3基因:根据Genebank检索到人STAT3基因最长转录本的开发读码框(open reading frame, ORF),设计带有酶切位点的引物,以H2228细胞总cDNA为模板进行扩增重组质粒pcDNA3.1+STAT3的构建及鉴定:将模板扩增PCR产物纯化后与克隆载体pMD-18T连接,转化感受态、筛选阳性克隆并扩增;抽提质粒行双向测序等鉴定。中提并纯化重组质粒,分装保存等步骤获取重组载体pcDNA3.1+STAT3。瞬时转染:应用Roche Fugene6转染系统,将重组质粒和对照质粒转染人肺腺癌细胞株H2228和H1299。基因沉默效果检测:Real Time qPCR及Western Blotting检测各组细胞中STATS及其他肺癌中的关键通路蛋白表达状态。基因沉默后生物学特性改变:流式细胞仪Annexin V/PI双标记法检测细胞的凋亡指数。结果STAT3基因特异性沉默效果检测:用Western Blotting检测siRNA-STAT3-1和shRNA-STAT3-2干扰效果,具体分为5组:shRNA-STAT3-1、shRNA-STAT3-2、 shRNA-scrambled、vector和空白。在模式细胞株H2228中,STAT3蛋白表达下调分别为64±2.3%和52±3.7%,ERK1/2和AKT及相应的磷酸化程度无明显变化,:nTOR出现了表达下调,其磷酸化水平呈显著降低;在模式细胞H1299中,shRNA-STAT3-1、shRNA-STAT3-2分别使其STAT3表达下调65±3.1%和55±4.2%, ERK1/2, AKT,mTOR及对应的磷酸化蛋白无显著变化。scrambled、 vector和Fugene6三个对照组未造成STAT3表达水平在各细胞系的显著变化。生物学特性的变化:干扰48小时后,Annexin V/PI双标记法检测发现H2228组右下象限凋亡早期细胞比例增高;H1299无显著变化。STAT3基因过表达效果检测:用Real Time qPCR检测pcDNA3.1+STAT3转染H2228后的表达水平,具体分为3组:pcDNA3.1+STAT3、vector和空白。在模式细胞株H2228中,STAT3基因表达水平显著上调;应用Western Blotting检测蛋白表达发现pcDNA3.1+STAT3组蛋白表达显著升高,提示STAT3过表达模型构建成功。ERK1/2和AKT及相应的磷酸化程度无明显变化,mTOR出现了表达上调,其磷酸化水平呈显著升高。结论成功构建基于表达载体的STAT3干扰系统;发现不表达EML4-ALK的腺癌细胞在STAT3表达沉默60%以上时未出现明显的生物学性状改变;而表达该融合基因的肺腺癌细胞则出现凋亡率的显著增加。分析与STAT3相互作用的关键信号通路蛋白的变化状态发现,H1299中各通路蛋白未见明显改变;H2228中mTOR的蛋白表达水平轻微下调,磷酸化水平显著降低。成功构建基于表达载体的STAT3过表达系统;分析与STAT3相互作用的关键信号通路蛋白的变化状态发现,模式细胞中mTOR的总蛋白表达水平轻微上调,磷酸化水平显著升高。表明STAT3在EML4-ALK融合型肺癌中可能参与mTOR信号通路的调控,其过度表达会引起mTOR信号通路的过度活化,从而提高肿瘤的增殖与抗凋亡能力,影响肿瘤细胞的发生和增殖等重要生物学功能。