代谢组学数据正态性对疾病分类准确性的影响

来源 :山东大学学报(医学版) | 被引量 : 0次 | 上传用户:www752169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的探讨在代谢组学数据中服从正态分布的变量个数逐步增加时统计分类方法分类准确率的变化趋势。方法首先模拟产生11组代谢数据,且数据中服从正态分布的变量逐渐增加,然后用传统的非机器学习统计方法[Bayes判别、Fisher判别、偏最小二乘判别分析(PLS-DA)]和机器学习方法[随机森林(RF)、支持向量机(SVM)]进行统计分析,比较分类准确率的变化;最后用两个实例分析对模拟结果的合理性进行评价。结果代谢组学数据正态性对Bayes判别、Fisher判别、PLS-DA的分析结果影响较大,随着数据中服从正态分布的变量个数增加,分类准确率增大,而对RF和SVM基本没有影响。结论传统的非机器学习方法在统计分析过程中对数据正态性有一定的要求,而机器学习类的方法对数据正态性基本没有要求,且分类准确率一直保持较高的稳定状态。 OBJECTIVE: To investigate the trend of the classification accuracy of statistical classification methods when the number of obeying normal distribution variables gradually increases in the metabonomics data. Methods Firstly, 11 groups of metabolic data were simulated and the data obeying the normal distribution gradually increased. Then, the traditional non-machine learning statistical methods (Bayes, Fisher and PLS-DA) Machine learning methods [random forest (RF), support vector machine (SVM)] were used for statistical analysis to compare the classification accuracy rate changes. Finally, two examples were used to evaluate the rationality of the simulation results. Results The normality of metabolomics data had a great influence on the results of Bayes discriminant analysis, Fisher’s discriminant analysis and PLS-DA analysis. With the increase of the number of obeying normal distribution variables in the data, the classification accuracy increased, but the RF and SVM Basically no effect. Conclusion The traditional non-machine learning methods have certain requirements on the data normality in the process of statistical analysis. However, the method of machine learning class does not require the data normality basically, and the classification accuracy rate keeps a high steady state all the time.
其他文献
小堆在我国沿海地区及海洋开发中需求广阔小型核能反应堆是一种可应用于不同需求和条件的新型核能系统,代表着核能应用新的发展方向。小堆的单模块发电功率一般在10万千瓦以
例 1,男 ,14岁。因患春季卡他性结膜炎 ,在外院诊治 3年 ,患病期间反复点用点必舒眼液 ,每日 4次 ,每年需用 7~ 8个月。患病初期视力及眼底均正常。 1998年 1月视力逐渐下降并
数学学习的能力需要良好的数学思维,而数学思维又与语言表达能力及动手能力密切相关,数学课堂是培养这两种能力的一个最佳的平台.利用好数学课堂,让学生成为学习的主人,提高他们的言行能力,能够锻炼他们的数学思维,增强学生学好数学的自信心,有效地促进他们的数学学习.  一、让学生发现自己可以说可以做  数学课堂是一个探究的课堂,因此应该是合作探讨的一个活动过程.如果教师在讲授新知识过程中采取灌输式教学方法,
本文针对城市给排水管网规划及优化进行研究,分析了给水管网规划设计的任务及原则,就城市供水管网和城市道路排水管网的优化设计进行了分析.近年来,我国的给排水设计人员在城
改革开放以来,我国经济取得了举世瞩目的成就,农村经济也发生了翻天覆地的变化,社会工业化的发展,为发展农村经济提供有力了支撑,为农村集体经济的发展提供了现实的可能性。由于我
期刊
《战国策?齐策》里面有一个冯谖收债的故事,说的是战国时期的孟尝君有一个高级门客冯谖,他出谋划策,最终让孟尝君成就了一番事业。可是初期,冯谖并不受赏识,因为孟尝君派他到薛地
城市给排水设计和规划中常见的问题包括给水系统问题、雨水系统问题、污水系统问题以及排水系统问题,本文在对这四方面的问题进行简要分析的基础上,又针对性地提出相应的解决
期刊
目的 对比研究经桡动脉路径行冠状动脉介入诊疗,经桡动脉应用硝酸甘油、地尔硫(艹卓)及联合地尔硫(艹卓)和硝酸甘油防治桡动脉痉挛的有效性及安全性.方法 220例经绕动脉路径