论文部分内容阅读
癌的发生和发展过程涉及大量基因的mRNA和miRNA表达、甲基化、拷贝数等异常改变。高通量技术为我们提供了全局的视角来分析癌相关mRNA和miRNA表达、甲基化和拷贝数等分子改变,使得我们可以更系统地分析这些分子改变在癌症的发生和发展过程中所发挥的作用。目前,在分析各种高通量组学数据时标准化算法往往假设疾病中差异基因的比例很小及差异上、下调的基因数目大致相等,然而复杂疾病中很可能发生广泛而相关的分子改变,这种广泛采用的标准化假设很可能是不可靠的,可能会对筛选差异表达基因等下游分析有重大的影响。因此,需要全面揭示癌基因组中各种分子改变的真实分布,才可以有效的分析高通量数据标准化方法的合理性,进而挖掘高通量数据的真实生物学信号。 本课题将分析在GEO数据库中癌相关mRNA和miRNA表达、甲基化和拷贝数等高通量组学数据,分析在癌与正常样本中这些分子改变的信号分布差异,解析癌相关高通量组学数据系统性改变的特征模式。本课题共无偏的收集了52套配对癌相关基因高通量mRNA和miRNA表达、甲基化、拷贝数变异数据,研究结果显示:在转录水平中,mRNA和miRNA的表达在相当多的癌症中呈现广泛的表达上调;mRNA和miRNA表达的协同上调可能是癌症细胞的基本特征;在基因组水平中,甲基化和拷贝数数据在癌症和正常样本中的整体表达水平相似;针对不同的实验条件和实验平台需要重新思考如何正确使用传统的标准化假设.