【摘 要】
:
关联规则是数据挖掘技术当中一个非常重要的研究方向,他被广泛应用在现实生活中的各行各业。这个规则不仅可以给人们提供行业内数据规律认可,而且能够总结出海量数据之后的隐
论文部分内容阅读
关联规则是数据挖掘技术当中一个非常重要的研究方向,他被广泛应用在现实生活中的各行各业。这个规则不仅可以给人们提供行业内数据规律认可,而且能够总结出海量数据之后的隐含规律,为用户和企业提供准确和可靠的数据支持平台。当前数据库技术日益成熟,数据存储量的规模空前的增加,这让原有的关联规则不能再适应现在数据模式。所以,更高效的数据挖掘中关联规则就显得非常重要。论文主要研究内容如下:首先,阐述了数据挖掘这一成熟的技术的诞生以及他的相关发展状况。着重介绍了目前相关技术的研究现状,进而对这些技术中的热点问题进行了探讨和分析。其次,结合Apriori算法的现有科研情况对其进行详细而全面的分析,不仅介绍了该算法的定义和具体实现思路,而且给出了Apriori算法的优点和不足之处。然后,对于Apriori算法的缺陷和不足,即效率低、挖掘规则简单的问题,本文给出一个在Apriori算法基础上改进后的并行关联规则(EPMAR)挖掘算法,EPMAR挖掘算法弥补了Apriori算法上述不足,能很好针对海量数据生成关联规则,同时该算法的性能相比原来算法有明显的提高。最后,在论文的最后一章,比较了并行关联规则(EPMAR)挖掘算法和CD算法的性能按照此算法关联规则对相关数据进行挖掘,最后用实验数据说明了这种算法的效果。
其他文献
结合我国统一坚强的智能电网建设需求,为应对电力信息化建设可能出现的海量数据,寻找行之有效的并行且弹性的数据处理技术是解决该问题的关键所在。MapReduce是由Google提出的基于大规模集群的分布式计算框架。Hadoop是Apache开源基金会开发的分布式系统的基础架构,包含MapReduce和HDFS。其良好的扩展性能和简单易用的操作特点,使之成为云计算的主流平台。本文进行基于MapReduc
嵌入式系统的三个基本特征:资源紧凑有限、时间约束严格、成本极度敏感,并且嵌入式软件本身由于需要处理大量中断,许多嵌入式软件性能指标(系统吞吐量、任务处理能力、堆栈深
近年来,随着我国经济的迅猛发展,企业信息化进程不断推进,作为我国经济建设基石的中小企业的信息化建设越来越引起业界的重视。然而,由于中小企业普遍存在着经济实力弱、个性
人脸识别就是利用计算机技术,通过对人脸图像的分析,提取我们所需要的一些特征信息,用来做身份识别或者目标追踪。它主要有三个步骤:人脸检测、特征提取和人脸识别。人脸识别
目前,关于计算机网络系统特性的研究已经成为一个热点,其中对于竞争特性的研究尤其引人关注。关于星形网的运行机理早已介绍。竞争—冲突淘汰(C-CC)存取方式,作为星型局域网
Skyline查询处理是数据库技术领域的一个研究重点和热点,它在多目标决策、数据挖掘和可视化、用户偏好查询等方面有着广阔的应用。Skyline查询输出数据集中不被其它任意数据
在数据库中用已有的算法对那些有噪声的、不完整的海量数据进行分析、提取,从而可以得到潜在的、隐含在海量数据当中的、对数据操作有用的信息和知识过程就被称之为数据挖掘
随着Web2.0应用和SemanticWeb研究的成熟,语义电子病历信息的查询在医学科学和信息科学领域里发展成为热点问题。在研究中,学者们抽象出各种病历信息并将其存储为语义网的RDF三
随着Zigbee无线传感器网络的广泛应用,如何通过互联网对远程监控区域进行实时监测、控制和管理逐渐成为该领域的重要研究课题。论文深入学习、研究了Zigbee技术,在此基础上设计
凭借纵向分割的灵活特性,列存储已被证明比行存储更适合查询密集的分析型应用。作为分析型应用之一的OLAP,其基本操作可以被映射为一组比较复杂且运行时间长的查询语句。研究表