大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:JoanFang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究,提出一种基于Hadoop平台的大数据关联规则挖掘算法MRPrePost。该算法在PrePost算法基础上改进而来,采用Hadoop平台降低分布式编程的难度且易于管理,通过一种自底向上的深度优化策略改进PrePost算法,降低内存开销,同时采用负载均衡的分组策略,来提高并行算法的性能,最终试验表明,该算法运行速度快,适应大数据关联规则挖掘。
其他文献
目的探讨微创穿刺引流向血肿腔内加用肾上腺素、立止血治疗急进型高血压性脑出血的疗效、手术时机、防止再出血的效果.方法选择符合急进型脑出血的病例,应用微创穿刺血肿引流
通过投加Mn2+改善了大豆废水中紫硫菌产量。结果表明,最佳Mn2+剂量为10 mg/L,菌体产量达到5000 mg/L。
婴儿晚发型维生素K缺乏症在临床儿科较为常见,起病急骤,病情重,预后不良,国内外文献常有报道.但在颅脑CT方面,国内文献报道少见,现将近年来我院收治本病患者中,8例做CT检查报