论文部分内容阅读
我国是人口老龄化国家,阿尔兹海默症(AD)因疗效差已成为继心血管疾病、癌症、脑卒中后对老年人伤害的“第四大危害”。但AD患者护理费用为上述三种疾病之和,给患者及家庭造成重大困扰。MCI作为AD的前驱阶段,可及时鉴别并有效干预,以降低AD发病率。
现有鉴别MCI的研究有两方面局限性:1.选用的数据方面,神经心理测验不能有效测查患者日常生活情况,敏感性和特异性也十分有限;MRI、生物标志物数据获取难度大,且需配备专业人员和器材,耗费大量人力物力。2.选用的方法,传统分析方法无法深入挖掘数据间关系,受自身性能影响,无法有效处理不平衡样本、对缺失敏感等问题。
机器学习算法已在多种疾病的早期识别方面取得良好的应用,如果机器学习算法可以利用老年人的神经心理和日常生活习惯测查数据,敏感有效的识别MCI,这样就可以不受限于专业器材、人力物力等限制,从而方便MCI早期筛查和干预,有显著的经济和社会价值。对此,本论文进行了两个方面的研究,通过CiteSpace分析,总结可以相对有效分类MCI的机器学习算法;利用这些算法,考察通过分析生活习惯数据从而在社区老年人中筛查MCI的可行性。具体研究方法和结果如下:
研究一:采用CiteSpace5.5作为辅助工具,对现有符合本文纳入标准的538篇文献,得到在识别MCI方面准确率较高的三个模型,分别是支持向量机(SVM)、随机森林(RF)、人工神经网络(NN)。Citespace关键词图谱显示,基于机器学习鉴别MCI的研究内容聚焦于fMRI和生物标志物。
研究二:基于研究一得出结果,使用RF、NN两种模型对2011年收集的1033份调查问卷(MCI老人91人,NC老人942人)进行分析,RF模型acc为0.92,SVM模型acc为0.84,NN模型acc为0.90。但SVM模型auc为0.5,表明在分类中无预测能力,因此在后续研究中去除该算法。绘制ROC曲线,比较RF模型分类结果与Logistics回归分类结果,两者差异显著(p<0.01)。为单独检验生活方式数据预测MCI准确性,将2019年收集的2151份问卷(MCI老人374人,NC老人1777人)中生活方式部分共41个题项提取出来进行差异检验,其中25项呈显著差异。生活方式数据对MCI具备一定预测能力。将2019年生活习惯数据纳入RF、NN两种模型进行分析,RF模型acc为0.78,NN模型acc为0.83,其中NN模型效果优于RF模型,可见两种模型对MCI具备一定分类能力。
综上,本论文通过Citespace筛选出在MCI识别方面有效的机器学习算法,并证实了利用这些算法通过分析社区老人的生活习惯数据来筛查MCI的可行性,为在社区大规模老人群体中经济性的早期筛查MCI提供了一个解决途径。
现有鉴别MCI的研究有两方面局限性:1.选用的数据方面,神经心理测验不能有效测查患者日常生活情况,敏感性和特异性也十分有限;MRI、生物标志物数据获取难度大,且需配备专业人员和器材,耗费大量人力物力。2.选用的方法,传统分析方法无法深入挖掘数据间关系,受自身性能影响,无法有效处理不平衡样本、对缺失敏感等问题。
机器学习算法已在多种疾病的早期识别方面取得良好的应用,如果机器学习算法可以利用老年人的神经心理和日常生活习惯测查数据,敏感有效的识别MCI,这样就可以不受限于专业器材、人力物力等限制,从而方便MCI早期筛查和干预,有显著的经济和社会价值。对此,本论文进行了两个方面的研究,通过CiteSpace分析,总结可以相对有效分类MCI的机器学习算法;利用这些算法,考察通过分析生活习惯数据从而在社区老年人中筛查MCI的可行性。具体研究方法和结果如下:
研究一:采用CiteSpace5.5作为辅助工具,对现有符合本文纳入标准的538篇文献,得到在识别MCI方面准确率较高的三个模型,分别是支持向量机(SVM)、随机森林(RF)、人工神经网络(NN)。Citespace关键词图谱显示,基于机器学习鉴别MCI的研究内容聚焦于fMRI和生物标志物。
研究二:基于研究一得出结果,使用RF、NN两种模型对2011年收集的1033份调查问卷(MCI老人91人,NC老人942人)进行分析,RF模型acc为0.92,SVM模型acc为0.84,NN模型acc为0.90。但SVM模型auc为0.5,表明在分类中无预测能力,因此在后续研究中去除该算法。绘制ROC曲线,比较RF模型分类结果与Logistics回归分类结果,两者差异显著(p<0.01)。为单独检验生活方式数据预测MCI准确性,将2019年收集的2151份问卷(MCI老人374人,NC老人1777人)中生活方式部分共41个题项提取出来进行差异检验,其中25项呈显著差异。生活方式数据对MCI具备一定预测能力。将2019年生活习惯数据纳入RF、NN两种模型进行分析,RF模型acc为0.78,NN模型acc为0.83,其中NN模型效果优于RF模型,可见两种模型对MCI具备一定分类能力。
综上,本论文通过Citespace筛选出在MCI识别方面有效的机器学习算法,并证实了利用这些算法通过分析社区老人的生活习惯数据来筛查MCI的可行性,为在社区大规模老人群体中经济性的早期筛查MCI提供了一个解决途径。