肿瘤基因表达谱分类方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:guizhong1121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤分类研究是以DNA微阵列技术为基础,对不同肿瘤样本的基因进行测量,力求找出具有表达差异的组织基因,以及差异表达与病理表现之间的联系。虽然模式识别领域的分类算法众多,但在分类过程中许多问题有待进一步解决。由于基因表达谱数据具有高维度、低样本的特点,传统分类方法面对这样的数据,很难取得较好的分类结果,且运算复杂度高效率低。本文提出了三种肿瘤数据的分类算法,主要研究内容如下:1、将直方图理论应用于肿瘤基因表达谱数据的分类上。首先计算每个基因的信息熵,根据熵值剔除冗余基因,然后对基因表达谱数据的直方图进行统计,选取峰谷差和峰谷比最大的基因作为特征基因,最后分别用支持向量机和K近邻分类器进行分类实验。2、将非负矩阵分解和Normal Matrix谱分解理论应用于肿瘤基因表达谱数据的分类上。首先利用fdr_test记分准则粗略除去噪声基因以实现基因表达谱数据的初步降维,进而运用非负矩阵分解萃取基因间的综合属性,通过综合属性构造样本间的Normal Matrix并对其进行奇异值分解获取表征样本类别属性的谱分量,进而实现肿瘤类型的分类识别。3、提出一种基于PCA和最小生成树的肿瘤基因表达谱数据的分类算法。首先通过PCA方法完成基因表达谱数据的降维,然后将肿瘤样本映射到高维空间的点,构造其邻接矩阵,根据邻接矩阵构造肿瘤样本的无向完全图,生成图的最小树,并删除树中最长距离的边,将树分成两颗子树,一个子树对应的是正常样本,另外一个子树对应的是肿瘤样本。
其他文献
《伤寒论》是基础和临床之间的桥梁课程,对于中医学生确立中医临床思维至关重要。以中医临床思维特点为基础,开展《伤寒论》的教学改革,从师资培养、教学内容、教学方法、教
我国的企业所得税制度经历了一个创新,从单一到复杂又回归单一的历程。然而即使在吸收与借鉴外国优秀经验的同时,我国企业所得税法中的特别纳税调整还是不可避免的具有其不完
<正>"技术是一种手段,能够让我们不必直接感受这个世界。"这是一本Excel VBA教材引用过的名人名言,意在强调VBA可以省去很多Excel的手工操作和重复劳动,从而大幅提高建模效率
本篇研究了井中电偶极激发地面接收的井地电法的快速反演成像问题.我们采用了Born近似方法和重加权正则化共轭梯度法(RRCG)算法.数值计算的结果表明Born近似是一种有效的井地电法
随着而我国电力行业的快速发展中,我国各行各业的生产活动和人们的日常生活,对于电力的需求量正在不断上升,这也对我国电力系统运行的稳定性提出了更高的要求。文章结合220kV
GPS精密单点定位中,周跳直接影响到整周模糊度解算及GPS测量成果的精度,周跳的探测与修复是GPS相位数据处理中最重要部分之一。GPS数据预处理中,已有周跳探测方法很容易发现
在中国影视作品的发展过程中,我们应该保护历史文化的传统本质及脉络,保护古建筑的历史信息,修复其受损、破旧、危塌的部分,做到整旧如旧、修旧如初,环境如初。我们应该把尊
钢结构因其坚固耐用、经济可靠、施工速度快、抗震性能强等优点被广泛用于工程建筑中。如何发挥建筑钢结构经济优势,有效控制工程造价,一直以来都是建筑工程建设应考虑的重点
<正>全胃肠外营养(TPN)是指通过静脉给病人输注各种人体所需的营养物质。近年来,TPN不仅作为一些不能进食、不想进食、不允许进食、进食不足病人的营养支持,也是作为对胃肠道
子宫内膜癌为女性生殖道最常见的恶性肿瘤之一,占女性生殖道恶性肿瘤的20%-30%。发达国家中子宫内膜癌发病率居女性生殖道恶性肿瘤首位,死亡率居第二位。临床上,早期(Ⅰ-Ⅱ期