MapReduce中数据倾斜解决方法的研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:SilentWoolf_1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网和物联网的飞速发展,数据规模呈爆炸性增长态势,人们已经进入大数据时代。MapReduce是一种分布式计算框架,具备海量数据处理的能力,已成为大数据领域研究的热点。但是MapReduce的性能严重依赖于数据的分布,当数据存在倾斜时,MapReduce默认的Hash划分无法保证Reduce阶段节点负载平衡,负载重的节点会影响作业的最终完成时间。为解决这一问题,利用了抽样的方法。在用户作业执行前运行一个MapReduce作业进行并行抽样,抽样获得key的频次分布后结合数据本地性实现负载均衡的数据分
其他文献
提出了一种基于角色映射的服务组合访问控制体系架构,用来解决服务组合过程中的访问控制问题。架构主要由服务组合访问控制中心和若干服务组合访问控制节点组成,服务组合访问控
新媒体的出现对纸媒为代表的传统媒体带来了较大冲击与影响,纸媒由于其自身技术上的限制导致其新闻传播的时效性差且传播效率低,在网络技术的加持下,纸媒除了要紧跟时代发展
随着新媒体时代的到来,新媒体对传统媒体带来了很大的影响,不过新媒体的出现也使传统媒体有了全新的发展机遇.在激烈的市场竞争当中,电视记者一定要发挥自身的能力,并且要积
目的 探究泮托拉唑对消化性溃疡合并出血的临床治疗效果。方法 62例消化性溃疡合并出血患者,将其随机分为观察组和对照组,各31例。两组患者均进行常规治疗,在此基础上对照组
摘要:不同于关注重大报道的时政类新闻,民生新闻的焦点通常会对准你我身边的普通人,记录“普通事”。在新媒体时代的背景之下,民生新闻的报道也日趋琐碎化和同质化,本文主要探讨在此背景之下如何借助于体现民生新闻报道的温度、挖掘民生新闻报道中的深度,来为广大人民群众提供更好的民生新闻报道。  关键词:新媒体时代;民生新闻;温度;深度  民生新闻自诞生之初就获得了很高的关注度。在过去接近30年的发展之中,民生
目的 观察多烯磷脂酰胆碱与茵栀黄口服液联合治疗药物性肝炎的疗效及不良反应。方法 88例药物性肝炎患者作为研究对象,依据随机数字表法分为治疗组与对照组,各44例。治疗组接
3C中提出一种新型三重三角晶格光子晶体,应用平面波展开法(PWM)分析其带隙结构,应用时域有限差分法(FDTD)研究方形点缺陷的尺寸和旋转角度对缺陷模特性的影响。仿真结果表明,该光子
用过量甲苯2,4-二异氰酸酯(TD I)对纳米SiO2表面进行修饰,进而用α-溴异丁基酰溴功能化纳米SiO2将原子转移自由基聚合(ATRP)引发剂引入到SiO2表面合成大分子引发剂;在室温条
针对吉林大学和吉大中软公司合作研发的"网络信息安全创新实验平台"设计与实现问题,探讨了类似设计集成软硬件和实验项目为一体的实验技术,重点介绍了实验平台的总体设计思路、
用户至上、去中心化、精细管理、去中介化是互联网时代的标志性理念,这些理念可以提升高校党建工作的互动性、针对性、时效性。高校党建工作创新要避免用户唯一、无中心化、