代谢组学数据正态性对疾病分类准确性的影响

来源 :山东大学学报(医学版) | 被引量 : 0次 | 上传用户：www752169

【摘要】

：

目的探讨在代谢组学数据中服从正态分布的变量个数逐步增加时统计分类方法分类准确率的变化趋势。方法首先模拟产生11组代谢数据,且数据中服从正态分布的变量逐渐增加,然后用

【作者】

：

公晓云申小涛徐静张涛朱正江薛付忠

【机构】

：

山东大学公共卫生学院生物统计学系,中国科学院上海有机化学研究所生物与化学交叉研究中心,

【出处】

：

山东大学学报(医学版)

【发表日期】

：

2016年04期

【关键词】

：

Data Normality Classification Accuracy Bayes Discrimination Fisher Discriminatio

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目的探讨在代谢组学数据中服从正态分布的变量个数逐步增加时统计分类方法分类准确率的变化趋势。方法首先模拟产生11组代谢数据,且数据中服从正态分布的变量逐渐增加,然后用传统的非机器学习统计方法[Bayes判别、Fisher判别、偏最小二乘判别分析(PLS-DA)]和机器学习方法[随机森林(RF)、支持向量机(SVM)]进行统计分析,比较分类准确率的变化;最后用两个实例分析对模拟结果的合理性进行评价。结果代谢组学数据正态性对Bayes判别、Fisher判别、PLS-DA的分析结果影响较大,随着数据中服从正态分布的变量个数增加,分类准确率增大,而对RF和SVM基本没有影响。结论传统的非机器学习方法在统计分析过程中对数据正态性有一定的要求,而机器学习类的方法对数据正态性基本没有要求,且分类准确率一直保持较高的稳定状态。 OBJECTIVE: To investigate the trend of the classification accuracy of statistical classification methods when the number of obeying normal distribution variables gradually increases in the metabonomics data. Methods Firstly, 11 groups of metabolic data were simulated and the data obeying the normal distribution gradually increased. Then, the traditional non-machine learning statistical methods (Bayes, Fisher and PLS-DA) Machine learning methods [random forest (RF), support vector machine (SVM)] were used for statistical analysis to compare the classification accuracy rate changes. Finally, two examples were used to evaluate the rationality of the simulation results. Results The normality of metabolomics data had a great influence on the results of Bayes discriminant analysis, Fisher’s discriminant analysis and PLS-DA analysis. With the increase of the number of obeying normal distribution variables in the data, the classification accuracy increased, but the RF and SVM Basically no effect. Conclusion The traditional non-machine learning methods have certain requirements on the data normality in the process of statistical analysis. However, the method of machine learning class does not require the data normality basically, and the classification accuracy rate keeps a high steady state all the time.

其他文献

在海洋经济中推广小型堆

小堆在我国沿海地区及海洋开发中需求广阔小型核能反应堆是一种可应用于不同需求和条件的新型核能系统,代表着核能应用新的发展方向。小堆的单模块发电功率一般在10万千瓦以

期刊

海洋经济核能反应堆用户需求核能应用沿海地区两种形式核能系统海洋开发发电功率单模块小型

青少年皮质类固醇青光眼2例

例 1,男 ,14岁。因患春季卡他性结膜炎 ,在外院诊治 3年 ,患病期间反复点用点必舒眼液 ,每日 4次 ,每年需用 7～ 8个月。患病初期视力及眼底均正常。 1998年 1月视力逐渐下降并

期刊

青少年皮质类固醇性青光眼眼压升高视力下降结膜充血卡他性结膜炎眼底小梁切除术黄斑中心凹视乳头左眼右眼对光反应砖红色角膜缘边界直径

数学教学中学生言行能力的培养

数学学习的能力需要良好的数学思维，而数学思维又与语言表达能力及动手能力密切相关，数学课堂是培养这两种能力的一个最佳的平台.利用好数学课堂，让学生成为学习的主人，提高他们的言行能力，能够锻炼他们的数学思维，增强学生学好数学的自信心，有效地促进他们的数学学习.　　一、让学生发现自己可以说可以做　　数学课堂是一个探究的课堂，因此应该是合作探讨的一个活动过程.如果教师在讲授新知识过程中采取灌输式教学方法，

期刊

数学教学中学生数学思维动手能力数学学习数学课堂学习的主人表达能力自信心增强语言平台培养锻炼

城市给排水管网规划及优化探析

本文针对城市给排水管网规划及优化进行研究,分析了给水管网规划设计的任务及原则,就城市供水管网和城市道路排水管网的优化设计进行了分析.近年来,我国的给排水设计人员在城

期刊

城市给排水管网规划优化设计

新时期发展农村集体经济问题的思考

改革开放以来，我国经济取得了举世瞩目的成就，农村经济也发生了翻天覆地的变化，社会工业化的发展，为发展农村经济提供有力了支撑，为农村集体经济的发展提供了现实的可能性。由于我

期刊

新时期农村集体经济

男性不育应及早治疗

期刊

男性不育

F“冯谖收债”对中国会计的影响

《战国策?齐策》里面有一个冯谖收债的故事，说的是战国时期的孟尝君有一个高级门客冯谖，他出谋划策，最终让孟尝君成就了一番事业。可是初期，冯谖并不受赏识，因为孟尝君派他到薛地

期刊

中国会计史孟尝君战国时期债务凭证战国策债务人烧毁门客故事成就

市政给排水设计中常见的问题与对策探究

城市给排水设计和规划中常见的问题包括给水系统问题、雨水系统问题、污水系统问题以及排水系统问题,本文在对这四方面的问题进行简要分析的基础上,又针对性地提出相应的解决

期刊

市政给排水设计问题

21世纪人类的第三大疾病问题不孕症

期刊

疾病

经桡动脉介入诊疗联合地尔硫(艹卓)和硝酸甘油防治桡动脉痉挛有效性和安全性临床观察

目的对比研究经桡动脉路径行冠状动脉介入诊疗,经桡动脉应用硝酸甘油、地尔硫(艹卓)及联合地尔硫(艹卓)和硝酸甘油防治桡动脉痉挛的有效性及安全性.方法 220例经绕动脉路径

期刊

桡动脉痉挛地尔硫(艹卓)硝酸甘油冠状动脉介入

代谢组学数据正态性对疾病分类准确性的影响

其他学术论文