论文部分内容阅读
基因表达谱的肿瘤类型的准确判断对当前生物信息学的研究有重大意义.基因表达谱存在样本少、维数高、冗余基因和噪音多等特点,对癌症特征基因的提取方法的研究具有重要的意义.以结肠癌肿瘤基因表达谱数据作为研究对象,提出了结合使用基因选择和数据抽取的有效方法,剔除无关基因选出候选特征集,结合PCA(主元分析)获取低维投影空间中的模式特征,根据各个基因贡献率大小排序选取贡献率大的基因作为特征基因,进而利用支持向量机进行分类检测.