云计算平台作业调度算法优化研究

被引量 : 0次 | 上传用户:wangji239
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网规模的不断增加,用户大量的数据需要进行处理和存储,传统的服务器集群无法满足用户大数据的需求。现在云计算已经成为一个最典型的解决方案,它为用户提供了海量数据处理、海量数据存储、按需获取计算能力等服务。云计算概念一经提出就受到了学术界和工业界的广泛关注,许多公司都推出了自己的云计算平台。其中,大多数云计算平台是使用Hadoop开发的,Hadoop是一个运行在大型集群上进行大数据存储和并行计算的分布式开源框架,它将底层的并行化对开发者透明,应用程序的开发者只需要按照接口要求实现代码就能实现分布式处理。但是,Hadoop是一个比较新的平台,许多地放还不够成熟,需要改进的地方也很多。Hadoop平台的性能与其作业调度算法密切相关,选择合适的调度算法对Hadoop平台的资源利率和系统吞吐量有很大的影响。但是,Hadoop中现有的调度算法有许多不足之处,因此,研究Hadoop平台作业调度算法,并进行优化和改进,对Hadoop平台性能的提升具有重大意义。本文主要完成了以下工作:1、对云计算技术进行了介绍,重点分析了Hadoop平台的技术背景和组成架构,详细分析了HDFS文件系统的读写流程和MapReduce编程框架。2、对Hadoop平台下的作业调度流程进行了深入的剖析,重点介绍了现有的几种作业调度算法:FIFO调度算法、计算能力调度算法、公平份额调度算法和LATE调度算法,分析了他们的算法思想和主要优缺点。3、针对现有调度算法不适应异构环境的问题,提出了一种改进的调度算法,该算法根据系统信息,将作业进行分类,并做出调度策略。通过优化算法将作业与节点进行匹配,提高系统的整体性能。4、针对现有调度算法未考虑作业和节点的负载类型的问题,提出了一种基于资源感知的调度算法,该算法将作业和节点类型进行划分,并按照节点的负载情况选择合适的任务进行调度。5、为了验证算法的性能,搭建了Hadoop实验集群,并收集了大量测试数据对算法的性能进行验证。实验结果表明,我们提出的两种调度算法能够很好的提升Hadoop平台的性能。
其他文献
基于流固耦合的瞬态动力分析,研究了贯流式机组尾水管内涡带水力脉动的作用形式,并分析了作用于厂房和厂房基础的振动波形和动力响应。最后研究了尾水管内脉动水压力荷载的简
智能电网建设的前提基础是电力通信。电力通信技术为智能电网的安全稳定可靠运行提供了保障。因此,加强对电力通信在电网智能化中的应用意义重大。对智能电网与电力通信进行
教学行动研究是解决教学与研究相脱节的途径之一 ,把这种方法运用到商务汉语写作教学中 ,设计和实施相应的行动方案 ,既是一种尝试 ,同时也有益于改进商务汉语教学方法
提出一种利用污秽绝缘子红外图像特征和径向基概率神经网络(RBPNN)来检测不同湿度条件下自然污秽绝缘子污秽等级的新方法。采用修正后的阿尔法滤波器和基于波谷的图像分割方
本文分析了高师数学教育面临的新形势 ,探讨了高师数学课程构建的方针与对策 ,并提出了旨在抛砖引玉的一个数学课程构想
二肽肽酶-4(dipeptidyl peptidase-4,DPP-4)抑制剂通过抑制DPP-4酶活性,延长内源性GLP-1的生理半衰期,促进餐后胰岛素的分泌而降低2型糖尿病患者的餐后血糖。通过检索Medline
当前我国各项建设进展神速,估计在不长的时间内,较好的水资源站点将开发殆尽,会影响水资源的持续开发。本文提出:(1)水利水电要与其他资源一道和谐相处、共谋发展,抽水蓄能作
<正>2009年1月12日,《北京日报》发表的《追求真理离不开言论自由》,在海外掀起轩然大波。英国广播公司等一些媒体不仅转发了这篇文章,而且对
以剪力墙结构为研究对象,具体分析了剪力墙结构的类型和布置原则,并结合工程实例阐述了剪力墙的结构设计,分析结果对类似工程具有参考价值。