基于单向FP-树的最大频繁项集挖掘

来源 :河南大学 | 被引量 : 0次 | 上传用户:smn1970
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门新兴的交叉学科,涉及到数据库技术、机器学习、统计学、模式识别、神经网络、人工智能、数据可视化等多个领域。目前它已成为数据库研究中最活跃、最令人兴奋的领域之一。 关联规则是数据挖掘研究中一个重要的研究课题,其主要的研究目的是从大型数据库中发现属性间存在的隐藏的、有趣的关系。频繁项集挖掘是关联规则挖掘的第一步,也是影响总体性能最关键的一步。因此,本文的研究重点放在了频繁项集挖掘上,研究内容主要包括以下几个部分: 1.深入研究了两个频繁项集挖掘算法。一个是经典FP-growth算法,它是基于FP-树的无候选项集产生算法,开辟了有效挖掘频繁模式的新途径。另一个是范明提出的基于单向FP-树的频繁项集挖掘算法,该算法在挖掘过程中不生成条件模式树。本文对比分析了FP-树和单向FP-树两种树结构,总结了FP-growth算法存在的问题,以及单向FP-树及其算法的优势。 2.在第一部分研究的基础上,参考最大频繁项集挖掘算法FP-Max,设计了基于单向FP-树的最大频繁项集挖掘算法Unid_FP-Max。该算法是一个深度优先算法。从算法分析和实验比较显示:对于密集型数据,Unid FP-Max算法在时间和空间开销上均小于FP-Max算法。 3.参考频繁闭项集挖掘算法CLOSET,设计了基于单向FP-树的频繁闭项集挖掘算法Unid FP-FCI。该算法是一个深度优先算法。经初步分析可知:Unid FP-FCI算法的效率会优于CLOSET算法。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
人文素质就是指通过人文科学、人文教育,在教育对象身上所体现出来的精、气、神。在高中政治教学中加强人文素质的培养,一要养气,要在大家的心灵深处融入社会主义核心价值体
高校教学管理的特殊性在于,要保证教学管理工作能够正常进行,以达到国家所规定的教育目标。高校是集教学、科学研究于一体,同时还要发挥起社会功能。高校在其发展进程中,会对教学
电力企业与电网基建工程相比,其建设规模较小,投资也相对较少,而且它还是国家电网公司限制类投资,但并非小型基建没有优势,小型基建工程建设好了就可以使企业的办公环境得到
Perron补在统计和计算数学等许多领域发挥着重要作用,Meyor提出了非负不可约矩阵的Perron补的封闭性,并利用这一封闭性质设计了计算特征向量的算法,其后,许多学者对Perron补的封
北京飞机维修公司党委积极创建学习型企业,连续三年开展了干部读书活动,对提高干部的政治理论水平和管理能力起到了积极的促进作用。党委从2002年开始,每年都要对干部学习做
随着我国高等教育步入大众化时代,学生事务管理工作中的管理理念、管理模式等需适应时代发展的需要而改变。本文探析了全面质量管理理念中的“过程控制”和“质量改进”在高校
本文将讨论Stokes问题在矩形网格下Q2-Q0混合有限元法. Q2-Q0混合有限元求解Stokes问题已有一些研究,速度场的收敛阶为 h2,压力场的收敛阶为h.对于速度场,采用“点-线-面”[4
中国建筑业迅猛发展过程中需要大量的相关人才,然而目前施工企业普遍面临着人才流失的问题。造成这一问题的原因是多方面的,本文对这些问题的原因进行分析,并提出了相应的控
研究一类带有边值问题的偏微分方程广义解的多重性,是微分方程理论研究领域的核心,也是这一领域研究内容的重点课题之一. 利用拓扑度理论和变分方法、临界点原理等工具研究偏