论文部分内容阅读
目的:前列腺癌(prostate cancer)是世界范围内最常见的恶性肿瘤之一,而在我国的男性前列腺癌发病率及死亡原因虽不及欧美国家,但随着社会、经济的发展,也呈现逐年上升的趋势,时刻威胁着男性健康。研究表明前列腺癌的发生是受到多因素、多基因共同作用的结果,但我们对于其涉及的机制认识甚少。伴随着高通量微阵列杂交技术和测序技术的快速发展,大量的基因数据,生物信息迅速膨胀。而NCBI的GEO数据库是世界上最大的储存高通量分子数据的公共数据库。本研究将对GEO数据库现有的基因数据进行深度发掘分析,以期寻找前列腺癌发生的关键基因及新的治疗靶点。材料方法:根据标准流程对GEO中芯片数据进行收集处理、整合,对芯片数据进行归一化校正,用已编制好的R语言程序进行分析,结果以热图(pheatmap)、火山图(Volcano Plot),联合蛋白-蛋白相互作用网络图(Protein protein interaction network,PPI)等表示并联合GO富集及KEGG信号通路分析。差异基因的判断标准:1、表达量差异在2倍以上或者0.5倍以下,2、P<0.05。结果:本次检测样本中共存在328个表达差异基因,其中表达上调的基因有233个,表达下调的基因有95个。通过热图及火山图分析进一步缩小候选基因的范围,并通过GO富集及KEGG通路分析、STRING在线工具对差异基因及通路、其编码的蛋白分析,结果发现差异蛋白及编码其的基因主要集中在RND3、CAV2、CAV1、CALM1、FLNA等22个基因上。再对这些关键基因进行文献挖掘发现,FLNA基因可能与前列腺癌的发生相关。结论:前列腺癌的发生发展、转移转化的过程脱离不了细胞增殖周期的相关基因异常活化、细胞黏附及移行功能相关基因的表达异常等因素。我们通过GEO数据库进行芯片数据检索并系统的分析正常前列腺组织与前列腺癌组织之间的差异基因发现,FLNA、DLX2等基因与前列腺癌的发生关系密切,为深入研究前列腺癌的发病机制提供新的潜在基因位点。而GEO数据库分析作为一种具有样本量大、费用小、分析较为简单的芯片筛选,通过各种不同的数据统计分析手段,可以为更多的人进行大规模的癌基因组学研究以及基于基因组学的后续研究提供借鉴及基础。