论文部分内容阅读
随着医院信息化的发展以及医院信息系统和电子病历的应用,医院数据库的数据容量不断膨胀。这些宝贵的医学数据对于疾病的诊断、治疗和医学研究都是非常有价值的。然而,目前大多数医院对数据库的处理仅限于数据的录入、修改、查询和删除等平凡过程,属于医学数据库的低端操作,缺乏数据的集成和分析,更谈不上辅助医学决策和自动获取知识。另一方面,面对海量数据,传统的数据分析工具只能进行一些表层的处理,而无法获得数据之间的内在关联和隐藏信息,从而陷入“数据丰富,知识贫乏”的困境。为了摆脱这种困境,一种能够智能地、自动地把数据转换成有用信息和知识的技术应运而生。它就是数据挖掘(Data Mining)技术。数据挖掘是指从数据库中识别出有效的、新颖的、潜在有用的、并且最终可理解的模式和知识的非平凡过程。本文首先在深入研究数据挖掘理论的基础上,根据临床实际应用需求的调研,对需要用到的两种数据挖掘技术——朴素贝叶斯方法和BP神经网络——进行了改进。对传统的朴素贝叶斯方法进行的改进包括:基于逻辑回归Wald值的属性加权和基于核密度估计法计算类条件概率,而对BP神经网络进行的改进则有:添加动量项和自适应调整学习速率。然后分别采用ICU数据集和输血数据集对它们在临床医学中的应用进行了测试验证。针对ICU数据集,本文建立了预测ICU患者死亡概率的朴素贝叶斯模型。通过与Logistic回归模型的对比,表明朴素贝叶斯模型在分辨度方面存在明显优势。而对于输血数据集,我们利用改进的BP神经网络预测红细胞输注患者输血后的生命体征和Hb指标数值,建立一个多指标综合评分模型对患者的输血效果进行评估和预判断。经测试样本集的验证,结果表明基于BP神经网络数值预测的多指标综合评分模型具有较好的分辨能力,预测准确率为89.7%,能够实现输血效果的准确预判断。