并行挖掘频繁项目集新算法——MREclat

来源 :计算机应用 | 被引量 : 7次 | 上传用户:zooton2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加
其他文献
老子曰:“道生一,一生二,二生三,三生万物.”数学,有了0和1,有了加减,就有了整数集;有了加减乘除,就有了有理数集;有了加减乘除乘方开方,就迈向了实数集.同时,由于运算,数与数之间有了关系.这
对于初学者来说,函数零点存在定理易于理解,但要读出其蕴含的数学思想方法则不易,本文基于函数零点存在定理的视角,进一步帮助大家理解函数与方程的基本思想.
期刊
等差数列与等比数列是最重要也是最基本的数列模型,因而也是高考中重点考查的内容.而等差数列、等比数列的判定与证明,又是历年高考数列问题的一大热点.等差数列、等比数列的判定
针对淘宝分布式系统(TFS)数据容灾效率低且成本高的问题,提出了基于低密度随机纠删码的解决方案。该方案引入了一种新型的高性能纠删码(SRM码),对TFS中存放原数据的多个block块进行编码,生成的冗余信息存放在新的block块中以便进行数据恢复。与三副本容灾策略不同的是,该方案将TFS中存储数据的每个block块视为一个信息单位来进行容灾,当集群中某些block块出现异常或失效时,可使用SRM码
在解决三角函数的问题中,经常会遇到求这种形式的函数:y=acos x+bsinx(*)(其中a,b为常数,且ab≠0)的周期性、对称性、单调性及值域.对于这种由“同角但不同名”的三角函数“合成”的
口袋书是一些不法生产者专门针对学生群体生产的,是2004年重点打击的非法出版物之一.这种书最早出现在2002年,曾经在城市校园中流传,后来在有关部门的打击下一度消失.但是最
小麦密点播,是针对小麦生产上存在的苗少、肥少、穗数不足、单产低的问题而提出来的一项高产综合栽培技术。它的中心内容是:选用良种,小蔸密植,增肥增穗,防病抗倒,一般亩增产25~50千
由于微博文本短、词量少、语法风格随意的特点,因此微博中包含大量因缺少主题词汇而无法分析话题归属的微博,即隐式微博。提出改进的基于LDA的生成模型考虑评论组和转发微博