论文部分内容阅读
前列腺癌(prostatecancer,PC)为全世界男性最常见的癌症之一,在美国男性所有诊断出来的肿瘤当中PC占了1/3,病死率排第二,仅次于肺癌,近年来PC在中国的发病率也呈不断上升趋势。近年来,随着分子生物学的迅速发展,人们对肿瘤发生发展过程中的细胞和分子水平的变化有了进一步的认识。癌的发生、发展是多基因改变的结果,在这过程中有多种原癌基因被激活以及抑癌基因失活,癌的发生、发展就是原癌基因、抑癌基因以及生长因子调控失调的结果,前列腺癌的发生也不例外。但是前列腺癌的发生发展过程十分复杂,呈现多步骤、多基因复合的特点,目前人们对其涉及的机制还知之甚少。现已发现,一开始前列腺癌细胞的生长有依赖雄激素的生物学特性,多数前列腺癌患者在首次接受雄激素剥夺疗法后都有显著疗效,但最后超过一半的患者会复发并由雄激素依赖型前列腺癌发展成高度恶化且广泛转移的雄激素非依赖型前列腺癌,使常规的雄激素剥夺治疗失去效果,而前列腺癌细胞激素依赖型发生变化,是肿瘤细胞发生转移和对抗内雄激素剥夺治疗,从而导致临床患者病情恶化并最终导致死亡的主要原因。前列腺癌形成的基因改变有不少报道,但对雄激素非依赖型前列腺癌的形成机制还不清楚且报道不多,基因芯片技术对PC在雄激素剥夺治疗前后的基因表达改变分析也许对了解雄激素非依赖型前列腺癌的形成过程可以提供一些线索。本研究利用基因芯片数据分析软件GeneSifter对来自基因表达数据库GeneExpressionOmnibus(GEO)的12个雄激素依赖型前列腺癌和雄激素非依赖型前列腺癌基因表达谱芯片数据作进一步生物信息学分析,以了解PC在雄激素剥夺治疗后的基因表达变化,并进一步探讨雄激素非依赖型前列腺癌形成的分子机理。
本文属于基因芯片生物信息学的内容,探索利用基因表达数据库GEO所贮存的基因芯片表达数据并结合一些生物学知识对雄激素非依赖型前列腺癌形成机理作进一步推测分析,以期为阐明雄激素非依赖型前列腺癌形成的分子机制提供一些基因表达方面的线索,并为进一步的相关实验研究提供参考。本研究按顺序分三部分:
第一部分:对基因芯片与数据分析作了综述,先对基因芯片的基本原理、单通道和双通道实验、基因芯片的种类和应用作了叙述;然后对基因芯片数据分析、数据的处理、实验设计与平台的选择、差异基因表达、聚类分析和生物学意义分析作了叙述;
第二部分:详细介绍了基因表达数据库GEO的构成、查询和一些分析工具的使用。基因芯片的广泛应用,产生了海量的数据,为基因研究提供大量高通量数据资料。为有效地组织、存取、管理如此大量的基因数据信息,迫切需要一个统一管理的公共数据库、建立一种通用的数据标准格式,使数据能更好地与其它信息资源比较分析。几个实验室和机构开始试图组建网上资源来散布这些高通量数据集,隶属于美国国立卫生研究院的NCBI(NationalCenterforBiotechnologyInformation),开始了一个基因表达汇编计划,即:基因表达综合库(GeneExpressionOmnibus,GEO),以便更好的支持公共使用和散布基因表达数据。GEO数据库创建于2000年,是当今最大、最全面的公共基因表达数据资源,至今已存储了214,268个样本,8300个记录,4500个平台。GEO数据库覆盖广泛的生物学内容,包括疾病、代谢、药理学、药学、免疫学和生态学等。数据来自世界各地实验室研究者的提交,有些杂志要求文章发表时将数据提交到一些公共数据库,其目的是可以让一些独立的研究机构来重新评价和分析这些数据的结果。GEO数据库及其工具,也可以验证实验室的研究发现,或提供支持性意见,或设计研究计划及其获得假说的否定证据等。GEO数据的再分析和重新解释还可以为其它领域提供一些有价值的线索。随着GEO数据库在大小和多样性方面的不断增长,这样的研究发现机遇也将不断提高。
第三部分:应用基因芯片数据分析工具GeneSifter对前列腺癌基因芯片数据进行了分析,发现一些差异表达的基因,并对这些差异表达基因进行基因本体和KEGG通路分析。前列腺癌抗雄激素治疗后,前列腺癌由激素依赖型向激素非依赖型的转化,这是困扰多年的问题。前列腺癌的发生发展过程包含多种分子的改变,这些改变可以通过前列腺癌细胞基因表达的变化来反映。随着现代分子生物学的发展,采用基因芯片技术分析肿瘤细胞在不同发展阶段的基因调节,根据基因表达方式对肿瘤患者进行分类并实施个体化治疗,是前列腺癌研究的方向。国际上诸多学者通过对前列腺癌基因表达谱的分析,已经发现了一些新的前列腺癌异常表达基因,为前列腺癌分子标志物的最终判定及选择相应的靶序列进行基因治疗奠定了基础。本研究所用到的芯片数据平台是GPL96,也称人类基因组HG-U133A芯片集,是艾菲公司(Affymetrix)的产品,它包含45000个探针集代表超过39000个转录本来源于大概33000个充分证实过的人类基因,至今在GEO数据库已有15932个样本使用这个平台。基因表达谱芯片数据来自GEO公共数据库由BESTCJ等提交的GDS1390数据集GSE2443系列20个样品芯片数据中选取12个GSM,其编号分别是:GSM45850,GSM45851,GSM45852,GSM45853,GSM45854,GSM45855,GSM45860,GSM45861,GSM45862,GSM45863,GSM45864,GSM45865。前6个数据的标本是雄激素依赖型前列腺癌患者于雄激素剥夺治疗前行前列腺切除术取得并经过病理学鉴定;后面6个数据的标本是雄激素非依赖型前列腺癌患者原位肿瘤活检组织取得,所有标本经处理后采用激光捕获显微切割(LCM)方法取得的细胞经RNA提取、扩增、逆转录和荧光标记等步骤,最后与AffymetrixHumanGenomeU133A芯片杂交,经AffymetrixGeneChipScanner3000扫描仪扫描得到原始数据上传到GEO数据库。从GeneSifter对雄激素依赖型前列腺癌和雄激素非依赖型前列腺癌两组表达谱数据差异分析结果看,表达差异基因筛选得到348个基因中有108个基因表达上调,240个基因表达下调,其中有一些基因以前有文献报道过与肿瘤有关,如Bcl-2、Tetraspanin1、GALNT12,其中表达最具显著意义的是GREB1protein基因,下调表达达到15.48倍,是表达倍数最高的基因,GREB1(generegulatedbyestrogeninbreastcancerl)是雌激素应答基因,在乳腺癌研究中被认为在肿瘤对激素反应中有重要的作用,此次发现在雄激素非依赖型前列腺癌中显著低表达,提示其对前列腺癌在激素剥夺治疗后可能也有重要的作用。通过GeneSifter自带的GO生物学过程分析和KEGG通路分析,得到比较有意思的结果是在细胞黏附以及细胞通讯相关的基因表达有显著的变化,提示细胞黏附过程可能与前列腺癌相关。相邻细胞间的连接决定细胞和组织的形态、调控细胞的运动、生长、分化和存活等。细胞间黏附连接结构(adherenjunction)的形成是通过相邻细胞表面的钙依赖型钙黏着素受体的细胞外区域的相互作用实现的,细胞的恶变通常表现为组织结构中细胞骨架的根本改变,一方面通过下调钙黏素或连环蛋白(catenin)家族成员的表达实现,另一方面可以通过激活一些可阻断细胞间黏附连接结构聚集的信号传导途径实现。已有研究发现,上皮型钙黏素(E-cad)表达的缺失可使腺瘤向腺癌转化。另有研究也表明,细胞黏附蛋白的共同异常表达对前列腺癌的预后诊断有重要意义。
通过对前列腺癌基因芯片数据的再挖掘,虽然筛选出的差异基因及其相关生物学解释还需进一步分析及结合其他的实验验证,但可为雄激素非依赖型前列腺癌的基因诊断以及药物作用靶点方面研究提供一些信息。