论文部分内容阅读
随着人们生活水平的不断提高身体健康状况越来越受到关注,体检成为人们关注自身健康状况的重要途径。面对杂乱无章的体检数据,本文利用机器学习方法对医疗体检数据进行信息化处理,利用处理后的数据进行模型的训练,最终得出疾病的分类结果。本文对医疗健康数据集上的分类方法进行了简要的分析。首先介绍了机器学习的概念,从监督学习,半监督学习,非监督学习,强化学习和遗传算法五个方面介绍了机器学习算法的分类;其次介绍人工神经网络与生物神经科学、健康档案与电子病历之间的关系;最后对机器学习中分类算法进行了简要的分析。本文主要研究工作分为以下两个方面:第一,机器学习分类算法在公共医疗数据集上的性能比较。文中介绍所使用的实验环境和实验工具,从介绍的分类算法中,选取支持向量机、决策树、深度神经网络和卷积神经网络分类器,在UCI机器学习资源库Statlog,Audiology,Adult和Heart Disease公共医疗数据库进行分类实验,并进行综合比较分析。结果显示,四种分类器中卷积神经网络分类器在公共医疗数据集分类中相比于其它三个分类器取得较好的分类效果。第二,针对卷积神经网络分类器性能在体检医疗数据集上进行分类研究。本文分析医疗数据集的特点,针对医疗数据的特点做必要的数据清洗工作。我们对搭建卷积神经网络模型过程进行详细的介绍,主要包括激活函数的选取和神经网络中权重的初始化。将清洗好的数据在搭建好的卷积神经网络上进行训练,经过多次试验,本文选取的卷积神经网络分类器应用到医疗体检数据集上其分类的准确率达到97.5%。综上所述,本文在医疗体检数据的研究中,所使用的卷积神经网络在大数据量多类别的疾病分类中取得不错的分类效果。随着医院信息化程度的不断推进,医疗数据将逐步得到规范;人们对机器学习认识的不断深入,相信更加精确的分类器将会出现。