【摘 要】
:
后基因时代,随着基因芯片技术的广泛应用,基因芯片实验数据爆炸式地增长。早期主要以聚类算法探索完全未知的基因表达模式。随着基因分类、基因表达模式的逐步明朗,许多更有效的
论文部分内容阅读
后基因时代,随着基因芯片技术的广泛应用,基因芯片实验数据爆炸式地增长。早期主要以聚类算法探索完全未知的基因表达模式。随着基因分类、基因表达模式的逐步明朗,许多更有效的有监督学习算法得到了广泛应用,准确、高效地预测未知基因的功能。支持向量机由于自身诸多优良的特性,使其在基因表达谱数据分析方面颇具吸引力。但是,极其有限的生物实验结果相对于巨大的基因芯片数据来说,所提供的已知信息非常贫乏却很宝贵。如何针对基因表达谱数据的这一特点,进行有效地SVMs分析,鲜有文献报道。本文正是针对这一特点,从拟南芥根部基因表达数据分析这一典型实际例子出发,对基因表达谱数据分析进行深入的研究。
本文主要研究工作如下:1.针对类别数未知,但有极少量已知类别训练点的拟南芥根部基因功能分类的问题,提出了一种基于距离度量学习的多分类支持向量机算法。
2.提出一种推理型多分类支持向量机,并将其转化成一个无约束最优化问题来求解。并将其应用于拟南芥根部基因表达数据分析中,为基因表达数据分析提供了一种新途径。
3.讨论了一种半监督支持向量机模型,该模型将半监督分类的组合优化问题转化成半定规划问题来求解。运用半定规划软件包,完成了算法的具体实现。为基因表达数据分析提供了又一种新方法。
总之,本文针对基因表达谱数据分析问题的先验知识极其贫乏的特性,研究并提供了三种不同的分析方法,数据试验验证了它们的有效性。
其他文献
本文对近年来发展起来的高维数据的多尺度表示工具:脊波、曲波的构造方法和性质进行了总结。脊波分析可以理解为radon域上的小波分析,而radon变换把空域的直线奇异映射为rado
举世瞩目的中国2010年上海世博会已拉开帷幕,整个世博会将历时六个月,境内外参观者众多,这对世博会卫生保障工作提出了很高的要求。因此组织有效的公共卫生保障工作已成为确
自从20世纪20年代,P-P模型:捕食者-猎物模型被Volterra提出后,它就成功的解释生物界的一些现象,例如:物种个体迁移、竞争现象、捕食现象、利他主义对生态系统的影响等。对P-P模型
随着我国社会主义市场经济的不断发展,我国企业管理水平也在不断提高。面对日趋激烈的市场竞争,如何才能够占据一定的市场份额,已成为当前企业发展过程中亟待解决的重要问题
非凸优化问题是一类重要的优化问题,它能过广泛应用于分子生物学、环境工程、信息技术和工业制造等领域.一般情况下这类问题存在大量的非全局最优解的局部最优解,求解起来比较
随着新课改的逐步深入,带来的是教育观念和教育方式的转变,学生的学习方式呈现多元化,传统的讲授式教育不能满足学生可持续发展的要求,“多元学习,激活思维”成为课堂的主旋
本论文利用时间序列建立了一个趋势回归(最小二乘法)模型、虚拟参数的季节模型、以及时间序列分析的统计预测模型。该模型能够很好地分离出时间序列中的趋势成分,且能够很好地
本文主要研究脉冲泛函微分系统{x(t)=f(t,xt),t≥t0,t≠tk,△x(t)=Ik(x(t)),t=tk,k=1,2…,xt0=(ψ)及脉冲混合微分系统{x=f(t,x,λk(xk)),t∈(tk,tk+1),x(tk+)=xk+,xk+=xk+Ik
本文分成两部分,在第一部分,我们利用空间形式Rn+p(c)中等距浸入的紧致无边子流形Mn的广义位置向量场,通过建立两个关于广义位置向量场的切部,法部和Mn上的Laplace算子第一非零特
高中语文教学在高中阶段的教育工作中占据着重要的位置,对学生基本语文素养的培养和综合能力的强化都产生着一定的影响,因此新时期要想促进学生全面发展,就应该进一步加强对