论文部分内容阅读
在当今信息社会,数据无处不在。而随着计算机及数据库系统应用的不断普及,网络技术、数据采集技术和存储技术的不断提高,各种数据量也随之不断增长,以致整个世界的信息量以惊人的速度急剧膨胀。面对海量的数据信息,人们陷入了“数据越来越丰富,知识却相对越贫乏即的困境。
数据挖掘正是为解决此问题应运而生的新兴技术,它是从数据集中识别出有效的、新颖的、潜在可用的、以及最终可理解的模式的非平凡过程,目前包括数据总结、聚类、分类与预测、关联分析等任务。其中,关联规则挖掘作为数据挖掘的一种核心任务,得到了广泛研究与重要应用。
本文主要对关联规则挖掘算法和应用问题进行了研究。完成的主要工作如下:
首先,深入分析了基于图的关联规则挖掘算法,提出了一种改进算法,改进主要体现在两个方面,一是按支持度降序对频繁1项重新编号再构建关联图;二是利用Apriori性质删减用来生成候选项集的冗余扩展项结点。实验结果表明改进算法是有效的。
其次,基于多策略数据挖掘软件MSMiner的工作包括:对该软件作了大量的重构优化修正,设计了一种策略简化了数据挖掘算法DLL的开发接口,优化实现了数据挖掘子系统中的关联规则挖掘算法模块,RBF神经网络算法、Elman神经网络算法模块等部分,并提出了MSMiner的进一步改进方向。
最后,参与设计与实现了一个基于B/S架构的数据挖掘原型系统,实现了其中的关联规则模块,得到了初步应用。