基因功能预测问题中的样本不平衡处理

来源 :中国生物医学工程学报 | 被引量 : 0次 | 上传用户:ribenandchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
应用机器学习进行分类是基因功能预测的一种重要手段。但是许多预测集中的阳性样本过少,会降低功能预测的效果。针对此问题,本研究对结合支持向量机(SVM)算法的几种常用非平衡数据分类方法进行实验比较,包括投票整合分类器和移动分类面等。在此基础上提出通过加权修正投票的整合策略,以提高预测效果。实验结果显示,结合多数类样本限数取样及整合思想的投票整合法预测效果优于移动分类面法,而在投票整合法基础上的加权修正整合方法在所有方法中获得更好更稳定的结果。
其他文献
在正电子发射成像(肿)中,很多方法被用来抑制重建图像中的噪声效果,其中。在所有方法中,贝叶斯重建或者最大化后验估计的方法被证明具有在重建图像质量方面相对于其他方法的优越性
为了提高医学图像配准的运算速度和增大配准的稳定区域,提出用严格凹函数取代互信息中的香农熵函数的方法,形成了互严格凹函数测度(NMi,i=1,2,…,6)。互信息只是互严格凹函数测度的一
本研究针对复杂散焦的尿沉渣图像的精细分割,提出了首先使用小波变换和形态学处理消除散焦影响并进行图像的粗分割,然后根据粗分割得到的子图像的情况采用边缘检测或者自适应
研究所合成的硬段侧链含有双季铵盐的系列聚氨酯的表面性能和抗菌性能。通过水接触角、X-光电子能谱(XPS)研究了双季铵盐聚氨酯的表面性质,通过平板计数法研究了材料的抗菌性能
诱发电位对于诊断神经系统损伤和病变具有重要的意义。传统的EP信号提取与分离方法中,通常认为EP信号中混入的EEG等噪声是高斯分布的。近年来一些研究表明了EEG信号具有一定
测试并研究了具有三种不同肤色的白癜风皮肤的反射光谱,在皮肤组织病理检验的基础上,建立了三色白癜风皮肤的光学模型,讨论了该皮肤的黑色素含量与分布,并进行Monle Carlo模拟计
在CT扫描过程中,由于电离辐射作用会导致病人产生癌症或者基因损伤,所以发展低剂量的成像算法正成为热点研究。作为局部成像算法之一的Lambda成像技术,具有减少剂量与快速成像的优点,但由于奇异值的必然存在,从而降低了成像质量。基于Wang Ge局部成像算法框架,提出利用高斯核函数及卷积性质来构建新的Lambda精确成像技术,并对高斯函数的参数选择进行分析。实验结果表明,应用新算法可确保得到高质量的重
磷酸化是真核细胞蛋白质的一种重要的翻译后修饰作用。由于对蛋白质激酶底物的实验测定方法通常非常费时,而且会受多种实验条件的限制。因此通过机器学习的方法,利用蛋白质的
在冠心病的临床诊断中,血管的遮盖和投影缩短会引起血管狭窄等的定量分析错误,而血管遮盖与投影缩短与造影角度的选择有关。传统的解决方法是由医生根据临床经验提供同时满足最小投影缩短和最小遮盖的造影角度,这种方法具有很大的主观性。本研究在冠脉树三维重建的基础上,研究了感兴趣血管段最佳视角的计算方法,该方法首先获得满足感兴趣血管段最小投影缩短的造影角度范围,然后在该范围中选取满足最小血管遮盖的造影角度。临床