论文部分内容阅读
第一部分基于TCGA数据头颈部肿瘤ceRNA网络的构建及预后相关分子标记物的筛选
背景与目的:头颈部肿瘤全球多发,每年约有600,000新发病例,占全球癌症新发病例的3.8%;死亡率约40–50%,占全球癌症死亡人数的3.6%。随着后基因组时代的到来及分子生物学的发展,人们对于疾病的认识最终将取决于我们对基因及其功能的理解。本研究拟通过对TCGA数据库中头颈部肿瘤转录组数据的分析,获得头颈部肿瘤差异表达miRNA,lncRNA及mRNA,构建ceRNA网络,并筛选具有生存差异的分子标记物。研究方法:下载TCGA数据库中转录组样本及临床数据,用生物信息学方法进行数据的整理、拆分及标准化,获得差异miRNA、mRNA和lncRNA;用mircode数据库对miRNA和lncRNA做比对,Starbase数据库修饰miRNA,用miRDB、miRTarBase、Targetscan数据库预测靶基因,然后用cytoscape软件构建ceRNA网络;最后进行生存分析并绘制生存曲线。研究结果:从TCGA数据库头颈部肿瘤样本中获得了569个miRNA表达文件(肿瘤样本525个,正常样本44个)及546个RNA-seq表达文件(肿瘤样本502个,正常样本44个),提取其差异表达miRNA、lncRNA及mRNA,并绘制了ceRNA网络。参与ceRNA网络的71个差异lncRNA中得到了有统计学差异(P<0.05)的13条生存曲线,分别为ABCA9-AS1、AL161645.1、AL163952.1、AL356056.1、ANO1-AS2、AP002478.1、HCG22、HOTTIP、LINC00052、LINC00460、MIAT、MUC19、ZFY-AS1;8个差异miRNA及16个差异mRNA分别各得到一条有统计学差异(P<0.05)的生存曲线,分别为hsa-mir-206及STC2。研究结论:生物信息学方法分析TCGA数据后成功构建了头颈部肿瘤相关的lncRNA-miRNA-mRNA网络;获得有生存差异的分子标记物,包括13个lncRNA(ABCA9-AS1、AL161645.1、AL163952.1、AL356056.1、ANO1-AS2、AP002478.1、HCG22、HOTTIP、LINC00052、LINC00460、MIAT、MUC19、ZFY-AS1),hsa-mir-206及STC2,为后期头颈部肿瘤基础研究分子的选择及深入研究头颈部肿瘤的发病机制提供了一定的理论基础。
第二部分CNFN作为头颈部肿瘤预后相关分子的共表达网络分析
背景与目的:头颈部肿瘤(HNC)全球多发,是异质性很高的一组疾病,其预后与分期相关。根据原发肿瘤(T),淋巴结转移(N)和远处转移(M)情况综合判断的TNM分期是目前美国癌症联合委员会(AJCC)推荐的头颈部肿瘤的分期方法。其中淋巴结(N)转移与肿瘤侵袭性强和预后差密切相关。本研究拟通过大数据分析利用加权基因共表达网络分析(WGCNA)的方法鉴定有意义的基因模块及与N分期有关的分子标志物并探索头颈部肿瘤发生发展的分子机制。研究方法:本研究用GEO数据库中头颈部肿瘤表达谱数据,逐步构建WGCNA网络,寻找与临床特征密切相关的基因模块;然后用验证集来验证我们的结果,并进一步鉴定出与临床分期密切相关的分子;进行生存分析判断该分子在头颈部肿瘤中判断预后的意义;最后进行基因功能富集分析探索其下游可能的机制。研究结果:本研究经过数据检索及筛选后对数据集GSE65858进行构建WGCNA,同时用从TCGA下载的头颈部肿瘤及数据集GSE39366数据来验证结果。经过数据预处理后,共筛选出4295个基因用于WGCNA网络的构建,鉴定出与N分期相关的蓝色和黑色模块。进一步分析得到蓝色模块中16个基因(KRTDAP,SBSN,CNFN,SPRR1B,DSG1,C10orf99,KRT16P3,GJB2, DMKN,LYPD3,TMEM79,PLA2G4E,TGM5,KCNK6,IVL,KLK8)与N分期呈负相关,黑色模块中的2个基因(SMC4,MSH6)与N分期呈正相关,将这18个基因作为候选核心基因进行进一步验证。在TCGA和数据集GSE65858中进一步验证后,结果发现CNFN和DSG1与HNC的临床分期密切相关。同时,对CNFN和DSG1进行生存分析后发现在GSE65858和TCGA数据集中CNFN高表达的患者预后更好。因此,CNFN被作为真正的核心基因在基因表达谱分析交互分析(GEPIA )数据库中进一步验证。通过两个数据集GSE65858和GSE39366的单基因集富分析(GSEA)分析发现在两个数据集中富集了三个基因组,“P53途径”,“早期雌激素反应”和“晚期雌激素反应”。研究结论:通过WGCNA分析发现CNFN可能有助于预测淋巴结转移和判断预后,其机制可能与P53信号通路、早期雌激素反应和晚期雌激素反应有关。
背景与目的:头颈部肿瘤全球多发,每年约有600,000新发病例,占全球癌症新发病例的3.8%;死亡率约40–50%,占全球癌症死亡人数的3.6%。随着后基因组时代的到来及分子生物学的发展,人们对于疾病的认识最终将取决于我们对基因及其功能的理解。本研究拟通过对TCGA数据库中头颈部肿瘤转录组数据的分析,获得头颈部肿瘤差异表达miRNA,lncRNA及mRNA,构建ceRNA网络,并筛选具有生存差异的分子标记物。研究方法:下载TCGA数据库中转录组样本及临床数据,用生物信息学方法进行数据的整理、拆分及标准化,获得差异miRNA、mRNA和lncRNA;用mircode数据库对miRNA和lncRNA做比对,Starbase数据库修饰miRNA,用miRDB、miRTarBase、Targetscan数据库预测靶基因,然后用cytoscape软件构建ceRNA网络;最后进行生存分析并绘制生存曲线。研究结果:从TCGA数据库头颈部肿瘤样本中获得了569个miRNA表达文件(肿瘤样本525个,正常样本44个)及546个RNA-seq表达文件(肿瘤样本502个,正常样本44个),提取其差异表达miRNA、lncRNA及mRNA,并绘制了ceRNA网络。参与ceRNA网络的71个差异lncRNA中得到了有统计学差异(P<0.05)的13条生存曲线,分别为ABCA9-AS1、AL161645.1、AL163952.1、AL356056.1、ANO1-AS2、AP002478.1、HCG22、HOTTIP、LINC00052、LINC00460、MIAT、MUC19、ZFY-AS1;8个差异miRNA及16个差异mRNA分别各得到一条有统计学差异(P<0.05)的生存曲线,分别为hsa-mir-206及STC2。研究结论:生物信息学方法分析TCGA数据后成功构建了头颈部肿瘤相关的lncRNA-miRNA-mRNA网络;获得有生存差异的分子标记物,包括13个lncRNA(ABCA9-AS1、AL161645.1、AL163952.1、AL356056.1、ANO1-AS2、AP002478.1、HCG22、HOTTIP、LINC00052、LINC00460、MIAT、MUC19、ZFY-AS1),hsa-mir-206及STC2,为后期头颈部肿瘤基础研究分子的选择及深入研究头颈部肿瘤的发病机制提供了一定的理论基础。
第二部分CNFN作为头颈部肿瘤预后相关分子的共表达网络分析
背景与目的:头颈部肿瘤(HNC)全球多发,是异质性很高的一组疾病,其预后与分期相关。根据原发肿瘤(T),淋巴结转移(N)和远处转移(M)情况综合判断的TNM分期是目前美国癌症联合委员会(AJCC)推荐的头颈部肿瘤的分期方法。其中淋巴结(N)转移与肿瘤侵袭性强和预后差密切相关。本研究拟通过大数据分析利用加权基因共表达网络分析(WGCNA)的方法鉴定有意义的基因模块及与N分期有关的分子标志物并探索头颈部肿瘤发生发展的分子机制。研究方法:本研究用GEO数据库中头颈部肿瘤表达谱数据,逐步构建WGCNA网络,寻找与临床特征密切相关的基因模块;然后用验证集来验证我们的结果,并进一步鉴定出与临床分期密切相关的分子;进行生存分析判断该分子在头颈部肿瘤中判断预后的意义;最后进行基因功能富集分析探索其下游可能的机制。研究结果:本研究经过数据检索及筛选后对数据集GSE65858进行构建WGCNA,同时用从TCGA下载的头颈部肿瘤及数据集GSE39366数据来验证结果。经过数据预处理后,共筛选出4295个基因用于WGCNA网络的构建,鉴定出与N分期相关的蓝色和黑色模块。进一步分析得到蓝色模块中16个基因(KRTDAP,SBSN,CNFN,SPRR1B,DSG1,C10orf99,KRT16P3,GJB2, DMKN,LYPD3,TMEM79,PLA2G4E,TGM5,KCNK6,IVL,KLK8)与N分期呈负相关,黑色模块中的2个基因(SMC4,MSH6)与N分期呈正相关,将这18个基因作为候选核心基因进行进一步验证。在TCGA和数据集GSE65858中进一步验证后,结果发现CNFN和DSG1与HNC的临床分期密切相关。同时,对CNFN和DSG1进行生存分析后发现在GSE65858和TCGA数据集中CNFN高表达的患者预后更好。因此,CNFN被作为真正的核心基因在基因表达谱分析交互分析(GEPIA )数据库中进一步验证。通过两个数据集GSE65858和GSE39366的单基因集富分析(GSEA)分析发现在两个数据集中富集了三个基因组,“P53途径”,“早期雌激素反应”和“晚期雌激素反应”。研究结论:通过WGCNA分析发现CNFN可能有助于预测淋巴结转移和判断预后,其机制可能与P53信号通路、早期雌激素反应和晚期雌激素反应有关。