论文部分内容阅读
本论文是在南通职业大学校级课题的支持下,对基于关联规则和人工神经网络的数据挖掘技术在江苏肿瘤研究所各类病人数情况预报中的应用研究与实现。研究该所专家知识和经验,选取关联规则对影响因子进行定性分析,再运用人工神经网络技术对各类病人数情况进行定量预报,最终构造一个对各类病人数情况进行预报试验平台Hospital Institute Data Mining(HIDM)。论文的主要内容总结如下几个方面:介绍了关联规则分析和人工神经网络技术在HIDM中的应用。在关联规则分析研究方面,对数据进行清洗和选择后,运用Apriori算法挖掘影响因子和量之间的关系,这些关系用来指导人工神经网络数据准备;在人工神经网络技术方面,着重研究了人工神经网络在数据挖掘中的数据准备问题、网络参数的选取问题等等。针对原有的BP神经网络算法效率较低、容易陷入局部极小等现状,提出了一种改进的BP算法,改进的BP算法着重改进了权值的调整频率及效率,本文在理论上进行推证,并利用数学逻辑中的“异或”问题进行实验,实验结果证明了改进的BP算法缩短了学习时间、提高了学习效率,并在一定程度上避免了学习中的局部极小问题。在上述理论方法研究的基础上,研究探讨了HIDM试验平台介绍各模块的功能以及各模块的具体实现。在HIDM中运用改进的BP算法实现对医院研究所各类病人数情况数据进行预测,并对结果进行分析。结果表明,该软件基本上能完成预期功能。