基于基因表达谱的肿瘤分类信息基因选取研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:alexhome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于基因表达谱的肿瘤分类信息基因选取问题的研究是发现肿瘤特异表达基因、研究肿瘤基因表达模式的重要手段。借助基因表达谱进行肿瘤诊断是当今生物信息学领域中的一个重要研究方向,有望成为临床医学上一种快速而有效的肿瘤分子诊断方法。本文基于肿瘤基因表达谱数据集,从研究肿瘤与正常组织分类入手,对肿瘤分类、信息基因选取问题进行分析和研究。由于基因表达谱数据存在维数过高、样本量很小以及噪音很大等特点,使得肿瘤信息基因选择成为一件有挑战性的工作。根据肿瘤基因表达谱样本集的特点,提出一种结合支持向量机应用平均影响值(MIV,Mean Impact Value)来寻找信息基因的算法,其优点是能够搜索到基因数量尽可能少而分类能力尽可能强的多个信息基因子集。实验采用了二分类肿瘤数据集以验证新算法的可行性和有效性,对于结肠癌样本集,只需3个基因就能获得100%留一交叉验证分类正确率。与基它肿瘤分类方法相比,实验结果在信息基因数量及其分类性能方面具有明显的优越性。为避免样本集的不同划分对分类性能的影响,进一步采用全折交叉验证方法来评估各信息基因子集的分类性能以优选出更优胜的信息基因子集。
其他文献
在Joel W.Robbin和Dietmar A.Salamon的文章“Asymptotic behaviour of holo-morphic strips[Ann.I.H.Poincar(e)-AN18,5(2001)573-612]”中主要结果定理A与定理B的证明中,我
该文综合运用系统科学、社会学、经济学、生态学等学科的理论与方法对村级生态经济系统的结构特征及评价指标体系进行了探讨,在此基础上,建立了静态及模糊动态投入产出模型对
本文由三部分组成,研究两类具有扩散项的生物模型的行波解存在问题。  第一章是引言部分,引进了一些基本概念,介绍行波解的研究背景和生物意义以及本文的主要工作。  第二章
发行国债关乎国计民生,国债发行策略的选择以及相关的风险管理对国民经济意义重大。一般而言,国债的管理采用CaR(Cost-at-Risk)模型,而利率水平作为最重要的变量之一,直接决
近年来,随着调和分析等分析工具的使用,人们对SchrS(o)dinger方程及相关非线性问题解的性质有了更深刻的认识。在本论文中,我们将借助于调和分析的方法和技巧,主要对非线性Sc
随着地质找矿向深部找矿方向发展,传统的金属勘探已不能完全满足深部找矿的要求,重、磁勘探方法垂向分辨率很低,且磁场强度随距离的平方成反比衰减,在勘探深部金属矿体方面存在严
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
中学牛津英语每一个单元的安排体例都相同,在Comic strip,Reading,Grammar之后便是Integrated skills。大家都知道,Integrated skills通过对学生进行听、说、读、写的训练,既
有限域是数论中基础而重要的内容之一,特别是有限域上的方程.当下,越来越多的学者对有限域上的方程进行深入研究,特别是对方程在有限域中解数问题的研究.目前,我们可以得到有限
我们都知道,Camassa-Holm, Degasperis-Procesi和Novikov方程是有孤子解的可积方程,同时具有很多良好的性质。本文中,主要研究了一类具有立方非线性项的广义的Novikov方程,其可以