【摘 要】
:
数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,它引起了科学界和产业界的广泛关注。关联规则挖掘是数据挖掘的一个重要研究分支,主要用于发现数据集中项之间的
【机 构】
:
合肥工业大学计算机与信息学院,安徽合肥 230009
【出 处】
:
全国第19届计算机技术与应用学术会议(CACIS·2008)
论文部分内容阅读
数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,它引起了科学界和产业界的广泛关注。关联规则挖掘是数据挖掘的一个重要研究分支,主要用于发现数据集中项之间的相关联系。信息技术的快速发展使得众多行业和部门的数据量激增,而这些数据大多都是关系型数据库,积极研究在关系数据库中挖掘关联规则的有效技术具有极为广阔的发展前景。基于FP-tree的关联规则挖掘算法FP-Growth是当前挖掘频繁项目集算法中应用最广,并且不需要候选集的一种挖掘关联规则的算法。但是,FP-Growth算法在挖掘大型关系数据库时占用内存大和运行速度慢甚至根本无法构造基于内存的FP-tree。针对这些不足,本文提出了一种新的关联规则挖掘算法,即DMFP算法,以解决大型数据库挖掘的需要。本文所做的研究工作如下:(1)对数据挖掘和关联规则挖掘技术发展现状进行了探讨。(2)对关联规则挖掘理论展开研究,讨论了一些传统的关联规则挖掘算法及存在的问题。(3)在对FP-Growth算法深入研究的基础上,提出一种改进的适合大型数据库挖掘的关联规则挖掘算法DMFP算法,并进行了实验验证和性能分析。该算法减少了FP-tree所占用的内存,实验表明该算法比FP-Growth算法具有更好的性能。(4)结合实际,将DMFP算法应用于一个个人情况调查表中,结果表明该算法是可行性的。
其他文献
研究了LM神经网络用于状态预测的方法及性能,提出将该方法应用于机载机电BIT的状态预测。以影响和反映发动机运行状态的滑油压力为典型试验数据,采用LM神经网络对其进行了仿真
通过对熟练驾驶员驾车过程的分析,提出了能反映驾驶员意图的模糊控制策略。模糊控制对汽车的平稳起步可以取得较好的控制效果,但模糊控制器中的模糊推理规则和隶属函数的选取往
基于本体的关联规则挖掘,是利用构建好的领域本体,结合数据挖掘算法,产生出具有语义的更符合用户需求的关联规则。本文首先系统地介绍了基于本体的关联规则挖掘的过程,然后给出了
任务调度是网格计算中核心问题之一.但目前网格的调度算法过于简单,不能满足用户对多维QoS的需求.本文提出了一种网格环境下的任务调度模型,该模型考虑了多维QoS要求,并使用效益函
本文在分析PMSM数学模型及其矢量控制原理的基础上,针对PMSM伺服系统模型非线性、多变量、强耦合等特点及传统PI控制器的缺陷,采用BP神经网络整定PI参数的自适应PI控制方法,借助
本文分析了粗糙集属性约简基因算法中加权适应度函数构造存在参数设定困难的问题,提出了一种新的适应度函数及其参数的设定方法,并设计了搜索最短约简的遗传算子。实验表明,该适
悲观模式理论通常基于串编码方式讨论了遗传算子对模式存活的影响,而没有考虑模式新建这种积极的因素。本文通过定义染色体与模式的相似度,采用更具广义性的均匀交叉和均匀变异
文章研究计算能力受限条件下的联盟生成问题,提出一种基于Agent能力距离匹配的快速联盟求解算法。算法用尽量少的Agent来完成任务,以减少Agent之间的通信成本,另外选择与任务距
遗传算法是一种基于自然选择和遗传的随机搜索算法,已经被成功用于解决各种不同学科的复杂问题。然而随着问题规模的扩大,传统遗传算法难以在允许的时间范围内得到满意解。利用
建设工程款拖欠问题涉及多种因素,论文将决策树方法引入来对其进行分析。首先介绍了决策树的基本原理及其经典算法ID3,然后通过对影响建设工程款拖欠的诸多因素进行分析,并根据I