基于资源环境和作业开销感知的Hadoop MapReduce作业调度优化研究

被引量 : 0次 | 上传用户:Susan616
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。传统的关系数据库技术和系统既无法存储也难以有效处理巨量增长的大数据。大数据的有效处理已经成为现实世界的迫切需求。在此背景下,采用并行计算技术,在一个大规模的分布式数据存储和并行计算平台上完成大数据并行化处理,己成为当前学术界和工业界的普遍共识。Google公司所发明的MapReduce并行计算技术,因其高易用性和高可扩展性而成为目前最成功的大数据并行处理技术,并己广泛应用于各种涉及到大数据处理的不同应用领域。Hadoop作为MapReduce的开源实现,目前已成为大数据处理的主流技术平台和事实上的工业标准。然而,MapReduc e设计之初主要是为了进行海量数据的线下批处理,针对响应性能要求较高的数据查询分析处理,其响应性能存在较大的不足。因此,针对Hadoop MapReduce并行计算框架的性能优化研究一直是近年来大家关注的热点技术问题。为了提升Hado op系统的性能,本文对HadoopMapReduce系统框架底层进行了深入分析,在此基础上,针对Hadoop系统无法动态调度和使用计算资源以及缺少作业动态优化调度能力的缺陷,进行了Hadoop MapReduce执行框架相关优化技术的研究。本文的优化技术研究内容主要分为以下两个部分:(1)标准Hadoop中,决定作业并发任务数目的计算资源slot是针对整个Hadoop系统静态配置的,作业执行时即使存在计算资源忙闲不均,也无法动态改变资源配置。针对这种情况,本文研究解决了一种基于集群资源环境感知的动态资源分配优化技术方法,用以动态检测和调整节点上计算资源的使用率从而提商MapReduce作业和任务执行的并发度。(2)作业调度是Hadoop系统中的重要组成部分,直接关系到系统的整体性能。然而现有主流的作业调度算法未能根据作业执行时的资源开销特征去进行调度和配置,导致集群中各个节点可能因某种资源枯竭而导致作业配置不均衡的状况。本文研究实现了一种基于作业资源开销特征的调度算法,从而提高多作业环境下系统的执行性能和资源利用率。最后,本文使用测试用例对前述的两个优化方案分别进行了测试,实验结果表明所研究实现的性能优化方案的有效性,具有较为显著的实际性能提升效果。
其他文献
<正>第五节杰曼·穆尼耶1920年2月7日,杰曼·穆尼耶(Germaine Mounier)出生于法国塞纳河畔的纳伊地区。她曾在音乐学院随杰曼·艾林-切内(Germaine Alem-Chéné)、圣蒂亚哥
<正>近日,深圳中心城在五洲宾馆举行盛大的招商推介会,来自大陆与港澳台等地的500家知名品牌厂商聚集在深圳。深圳中心城是深圳市政府2005年重点扶持建设的一号流通项目,项目
郊区化为郊区房地产开发开辟了广阔的市场,而郊区化的发展离不开郊区房地产所创造的物质空间,两者的关系日益密切,郊区化的空间扩展和外迁人口居住需求等影响着郊区房地产的
农村文化演艺市场是文化市场的重要阵地之一。当前,随着我国"三农"形势的逐年好转,农民文化生活亟待丰富,这就为农村演艺市场的开发提供了良好的时机。地方戏《十二月等郎》
<正>(十二)钢琴技术发展简史三百年来钢琴技术的发展简直令人眼花瞭乱、目不暇接。随着钢琴音乐逐渐进入人们的丰富的感情生活,钢琴弹奏技术也得到了蓬勃的发展。一本又一本
目的 探讨紫桂汤对女子原发不孕症的治疗效果。方法 对 38例患者采用自拟紫桂汤加减治疗后参考基础体温曲线指导受孕时间 ,观察治疗效果。结果  38例患者中痊愈 2 6例占 6
<正>去年10月,在厦门举行的"第六届中国国际钢琴比赛"开幕之前,我收到了一位入围选手的来信,说她在半决赛中要弹一位现代作曲家的六首作品,但是其时她仅仅背了其中三首。因此
自巴赫将拇指、小指引入钢琴演奏,手的演奏潜力才得以充分发挥,拇指、小指在演奏中的作用越来越被人们重视。拇指与小指技巧应作为钢琴演奏技巧的基本技能加以训练,并使其服从于
目的了解某院医院感染现状及危险因素,为更好地预防与控制医院感染及进一步完善医院感染管理计划与措施提供科学依据。方法采用横断面调查,床旁与病历调查相结合的方法,对201
SS3B型电力机车的TPZ11和TPZ11型电子柜在使用磁场削弱功能提高牵引电机输出特性时,电机电流会强烈波动,造成机车上下震动,影响机车牵引速度和运行工况。该文分析了使用磁场