基于性能预估的Hadoop参数自动调优系统

被引量 : 0次 | 上传用户:qncy1230s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce是处理大规模数据的有效工具,Hadoop是MapReduce的一个开源实现,由于其良好的容错性和可扩展性得到的广泛研究和使用。然而,为了有效的使用Hadoop集群资源,即使在Hadoop中运行一个简单的程序也需要用户或者管理员调整大量的Hadoop参数。在Hadoop中有190个的参数,这些参数控制着MapReduce作业在Hadoop中的运行行为。用户经常会因为不知道如何设置这些参数而遇到性能问题。基于性能预估的Hadoop参数自动调优系统HCOpt,针对Hadoop的高可配置性,通过动态字节码注入技术追踪MapReduce作业的运行信息,并对这些信息进行统计分析,提取Hadoop应用程序的运行特性;再通过轻量级MapReduce模拟器以及代价模型,结合Hadoop应用程序的运行特征预估该程序在指定参数配置方案下的运行性能;通过一种基于遗传算法的参数调优算法,结合性能预估,在大量的参数配置方案中搜索近似最优的参数配置方案,实现Hadoop参数自动调优功能。HCOpt通过动态字节码注入技术来追踪MapReduce作业运行信息,将系统对应用程序的运行影响以及和Hadoop之间的耦合度降到最低,可以很好的适应各种版本的Hadoop,同时通过对Hadoop参数的调优,在相同的硬件条件下充分利用系统资源提高了Hadoop应用程序的运行性能。通过典型的Hadoop应用程序测试HCOpt的有效性,结果分析表明对I/O密集型和计算密集型应用均有较好的性能提升效果,和系统默认的参数配置方案相比运行时间平均缩短了50%以上,和基于经验原则优化的参数配置方案相比运行时间缩短了29%~54%。
其他文献
介绍了香樟的特征特性及其大树移植技术,以提高其在广德县的移植成活率。
国家形象是软实力的重要组成部分。中国和印度是全球发展最快的新兴经济体。中印两国的相互认知对于亚洲的繁荣与稳定以及边界问题的最终解决具有十分重要的现实意义。本文以
随着虚拟化技术的日趋成熟以及CPU计算能力的增长,虚拟机计算系统可以同时为越来越多的客户虚拟机应用提供服务,因此,用户对虚拟机网络性能提出更高的要求。为了满足应用对于网
本报11月22日讯(记者刘常俭)多年来,部分孤立于田野上的古墓、古塔等,由于得不到重视,缺乏保护,受到不同程度的破坏,今后这一状况有望得到改变。省文物局局长张立方在向会议作关于
报纸
近年来,应用洞穴次生碳酸盐稳定氧、碳同位素进行古气候研究得到了迅速的发展,尤其是利用石笋中1δ8O与δ13C重建不同地区不同时间尺度下的古气候环境,为全球气候的变化提供
实现企业的全方位的管理,整体上推进企业生产和管理的科学化和规范化,就必须要发挥全面质量管理的各项功用。本文立足于企业实行全面质量管理的实际,对全面质量管理的概念进
雷电是发生在自然大气中的瞬间放电过程,能够引起严重的自然灾害,分为云闪和地闪,雷击放电过程中所产生的电磁辐射频率可以从甚低频段(VLF)到超高频段(UHF)。地闪是指发生在云层与地
气候变暖已引起全球的广泛关注,正确的认识当前的气候变化已成为亟待解决的问题.目前的主流观点虽然认为近几十年的升温是由人类活动导致的,但许多学者发现MWP时期的气温与现
通过对比广东15世纪末至19世纪末即LIA期间的气象灾害、战乱、人口发展等几方面的数据,研究了明清时期气候变冷对广东地区社会经济发展的影响,发现这一时期农业生产的衰退、
在主动式跟踪太阳能热发电系统中,要求计算太阳位置以实现跟踪,提高发电效率。对于开环控制的太阳能跟踪系统,太阳位置的计算精度尤为重要。采用水平–俯仰双轴坐标系统,利用