基于MapReduce框架的FP-Tree算法研究与优化

来源 :数码设计 | 被引量 : 0次 | 上传用户:zhangf123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FP-Tree算法是关联规则经典算法之一,它避免重复扫描数据库,比Apriori快一个数量级。FP-Tree算法在数据量较小时可以取得很好的效果,但是当数据库规模非常大时,在内存中构建FP-Tree是不切实际的。本文提出一种基于MapReduce的FP-Tree算法,通过并行化算法扩大算法可处理的数据集规模,并提高构建和挖掘FP-Tree的速度,实验表明优化后的算法性能有所提高。
其他文献
随着云平台部署技术在媒体资讯播控系统上的应用,使得原有内网化的播控系统面临着来自外部和内部的各种安全威胁,如恶意的窃取、泄露、破坏、攻击等,非恶意的遗失、越权、违
<正> 凡是看过希区柯克影片的观众无不感到自己自始至终沉迷在影片中:电影院里,人人屏声敛气,忘记了自己的存在,经历了紧张的期待、不安、猜测、惊恐,直到看到出乎意外的结局
基于模拟退火算法,构建了电源规划投资方案的优化模型。从不同的角度研究单阶段、多阶段电力扩展规划,进而对可再生能源接入电力系统的影响进行分析。
目前,我国大多数塔机生产厂使用的起升机构都是Ⅱ型机构,传动示意图如图1。 Ⅱ型机构大家都很熟悉,传动结构也很简单。如图1所示,Ⅱ型机构的减速器,是两对圆柱齿轮传动。机构中
核医学显像是显示器官及病变组织的解剖结构和代谢、功能相结合的显像。与其他影像学方法不同,它要经历放射性药物的制备、引入体内、影像采集、图像处理、阅片、书写报告等多
主程序的设计,编译文件的闪退。
本文通过对京珠南“晶通石场”规划与设计的介绍,说明了建立一个好的石场需要做大量的工作,包括机械设备该怎样配置等。
现代,在温室效应以及政府要求的背景下。市场中的各个行业都开始以绿色节能作为基准,进行发展。目前,以电视行业之间的竞争最为剧烈。在经济发展的高速推动下,隶属于电视行业