不同机器学习算法在乌鲁木齐市NAFLD风险预测模型中的应用

来源 :现代预防医学 | 被引量 : 0次 | 上传用户:barbaraxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的 基于机器学习(machine learning,ML)的不同算法构建新疆维吾尔自治区乌鲁木齐市非酒精性脂肪性肝病(nonalcoholic fatty liver disease,NAFLD)决策树、随机森林及支持向量机风险预测模型,与经典logistic回归预测模型进行对比分析,以筛选出NAFLD最佳风险预测模型.方法 选取2018年1月-2019年12月就诊并明确诊断为NAFLD的患者429例为病例组,同时选择同期体检的健康志愿者561例作为对照组,探讨NAFLD患者健康状况、生活方式及行为等环境影响因素,基于影响因素构建NAFLD经典logsitic回归预测模型,并运用R软件构建决策树、随机森林及支持向量机风险预测模型,绘制四种模型受试者工作特征曲线(receiver operating characteristic curve,ROC),计算曲线下面积(area under curve,AUC),运用“十折交叉验证法”(10-fold cross-validation)对各模型准确率、灵敏度、特异度等指标进行对比分析.结果 共纳入体质指数(P<0.001;OR=14.479;95%CI:4.000~ 52.407)、腰臀比(P=0.001;OR=3.692;95%CI:1.713~7.956)、被动吸烟(P=0.004;OR=3.074;95%CI:1.426~6.623)、主食品种(P=0.001;OR=4.938;95%CI:2.004~12.164)、高血压(P=0.008;OR=3.601;95%CI:1.407~9.219)、糖尿病(P=0.018;OR=4.719;95%CI:1.301~17.124)、血脂异常(P<0.001;OR=8.538;95%CI:3.582~20.350)、食用红肉类频率(P<0.001;OR=5.923;95%CI:2.487~ 14.106)、压力(P=0.019;OR=2.466;95%CI:1.158~5.252)、食用水果频率(P=0.034;OR=0.498;95%CI:0.261~ 0.949)、文化程度(P=0.011;OR=0.444;95%CI:0.238 ~ 0.828)11个预测因素构建经典logistic回归预测模型、决策树、随机森林及支持向量机风险预测模型.四种模型均具良好NAFLD风险预测能力,各模型准确率均大于0.80,灵敏度均大于0.85,Kappa值均大于0.65,阳性预测值、阴性预测值均大于或等于0.80;其中支持向量机具有最高的准确率(0.852)、特异度(0.855)、阳性预测值(0.877)及仅次于logsitic回归预测模型的AUC值(0.9086).结论 综合分析可知,基于支持向量机算法的预测模型更具有优势,可以有效地预测NAFLD患病风险,更有助于NAFLD的预防、早期治疗和管理.
其他文献
目的 研究发现微塑料(粒径小于5 μm的塑料颗粒)在低等生物和哺乳动物中均可诱导生殖毒性和胚胎发育毒性.本文对微塑料在生殖和胚胎中的毒性效应和作用机制进行综述,可为预防和控制微塑料所致生殖毒性提供理论基础和科学依据.方法 以微塑料、暴露途径、毒性机制、生殖毒性、胚胎毒性为关键词在中国知网、PubMed等数据库检索相关文献,并对国内外相关文献进行归纳与总结.结果 综述微塑料暴露途径及其转运和代谢分布、全面系统地概述微塑料生殖和胚胎发育毒性效应及毒性机制.结论 研究发现微塑料在低等生物和哺乳动物中均可诱导生殖
目的 探讨睡眠卫生在人格特征与睡眠质量间的中介作用.方法 选取ACEs青少年289名,采用问卷调查其一般情况、人格特征、睡眠卫生和睡眠质量状况,运用结构方程模型进行中介效应分析.结果 ACEs青少年睡眠障碍的检出率为34.6%;存在睡眠障碍的ACEs青少年内外倾、睡眠卫生得分明显更低,神经质、精神质得分明显更高.神经质、精神质得分与睡眠卫生(MC-ASHS)总分及各维度得分呈负相关关系(r=-0.52~-0.33,P<0.01),与睡眠质量(PSQI)总分呈正相关关系(r=0.54,P<0.05);MC-
目的 分析2016-2020年四川省农村妇女宫颈癌检查项目检出情况,为省、市、县级宫颈癌实施方案制定和质量控制提供参考.方法 全省183个县(市、区)按照省卫生健康委要求和各地实施方案开展宫颈癌筛查,并通过妇幼重大公共卫生服务项目信息直报系统完成项目信息收集、录入、审核和报送,并对检出结果进行统计分析;采用SPSS 19.0软件进行频数分析及xc2检验.结果 2016-2020年,宫颈癌检查项目结案人数的4896458人中,检出宫颈癌前病变6146人,检出率为125.52/10万,检出宫颈癌743人,检出
目的 了解珠海市2008-2019年生殖道沙眼衣原体感染流行特点和发病趋势,为珠海市开展生殖道沙眼衣原体感染防控提供科学依据.方法 通过中国疾病预防控制信息系统收集珠海市2008-2019年各医疗机构网络直报生殖道沙眼衣原体感染病例数据,采用Excel软件对数据进行整理,利用Joinpoint软件分析发病率变化趋势.结果 2008-2019年,珠海市累计报告生殖道沙眼衣原体感染17466例,报告发病率由2008年的57.75/10万,增长到2019年的121.99/10万,其发病率以平均每年7.34%(P
目的 调查琼南地区先天性甲状腺功能减低症(congenital hypothyroidism,CH)发病率,影响CH发病的危险因素.方法 收集2016-2020年琼南地区新生儿疾病筛查结果,调查琼南地区CH发病率及分布情况.应用病例对照研究分析影响CH发病的相关因素.结果 琼南地区2016-2020年新生儿疾病筛查人数为128285例,确诊为CH患儿50例,5年CH总体发病率为38.98/10万.2016-2020年CH发病率呈上升趋势.冬季CH发病率最高,发病率为47.16/10万.早产儿CH发病率最高
目的 了解农村家长对幼儿性教育开展的需求现况并探究其影响因素,为今后在农村地区开展和推动幼儿性教育工作提供科学依据.方法 于2018年3月至5月期间,采用多阶段分层抽样的方法随机抽取四川省3个市/州下辖乡镇的幼儿园53所,采用自行设计的调查表,对抽到乡镇幼儿园的2801位幼儿家长进行匿名式问卷调查.结果 80.86%的家长表示有对幼儿开展性教育的需求.多因素logistic回归分析结果显示,地区经济中等(OR =0.55,95% CI=0.44~0.70)和较差(OR =0.69,95% CI =0.48
目的 分析我国职工医疗互助保险的发展现状及问题,为多层次医疗保障体系中职工医疗互助保险的完善提供借鉴.方法 采取24个省级行政区(除港澳台和7个未检索到省级层面相关文件的省份)发布的省级职工医疗互助保险政策为研究样本,从统筹层次、经办形式、缴费标准、保障人群以及补偿待遇五个方面进行分析.结果 省级职工医疗互助保险均由省级总工会主管,经办形式以工会自主经办为主,部分地区(37.5%)委托第三方经办.年缴费标准主要集中在51~100元/年,占到样本总量的31.8%.部分地区(54.2%)的职工医疗互助保险中,
目的 分析2009-2019年沈阳市白血病的发病趋势,为白血病防控工作提供建议.方法 利用沈阳市肿瘤登记系统2009-2019年的白血病发病数据,计算构成比、发病率及年龄别发病率,采用2000年中国标准人口构成进行标化.采用Joinpoint回归模型估计白血病不同发病特征的年度变化百分比(APC).结果 2009-2019年沈阳市白血病发病率为4.53/10万,中标率为3.65/10万,发病率从2009年的4.60/10万上升至2019年的5.22/10万,APC为2.52%.男性发病率高于女性,男女发病
目的 了解和掌握黔东南州农村地区生活饮用水水碘含量,监测分析8~ 10岁儿童碘营养状况,为采取针对性防治措施和科学调整干预策略提供依据.方法 2017年对黔东南州农村地区203个乡镇992个村的2325个生活饮用水监测点采集水样测定水碘含量;2017-2020年每年随机抽取黔东南州农村地区80个乡镇80所小学的3200名8~ 10岁非寄宿儿童,检测尿碘、家中盐碘含量,并进行甲状腺容积B超检测.结果 本次共检测水样2325份,水碘中位数为2.20 μg/L,范围0.1~ 9.9 μg/L,不同地区水碘水平差
目的 了解供给侧改革背景下重庆市社会办医投资活力被激发后,居民民营医院就医意愿并探究其影响因素,为促进民营医院资源利用提供参考依据.方法 以配额抽样方法在重庆市主城7个社区中方便抽取1970名居民进行问卷调查.采用描述性分析、x2检验和二元logistic回归方法分析居民民营医院就医意愿及其影响因素.结果 77.9%的居民不愿去民营医院就医,主要原因是“不信任民营医院”(64.6%)、“自身就医习惯”(41.0%)、民营医院“费用高”(36.9%)、“技术水平低”(28.9%)等.对不同年龄、婚姻状况、职