基于Hadoop平台的最大满意度调度算法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:gf_lucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop是一种分布式数据和计算的框架,在海量数据处理中应用非常广泛。MapReduce是一种程序设计模型,Hadoop正是以MapReduce作为核心程序设计模型的。MapReduce程序已经在各行各业的海量数据分析中得到证明,该程序可以帮助实现对海量数据的分析和调用。但其中的细部参数配置以及对部分源码的优化,当前大多是依靠有经验的程序员在进行维护和调整,缺乏有效的统一的科学方法。若部分程序消耗系统资源过大,或是浪费了较多的运行时间,将会拖累系统整体的效能,得出较为不好的结果。  本文以Hadoop自带的调度算法为基础,提出一种基于Hadoop平台的最大满意度调度算法,能有效解决MapReduce中存在的计算实时问题。该算法改进了Hadoop自带的算法,为每一提交的作业配置一项满意度分数,并求取在相同软硬件的Hadoop系统环境产生完成作业的最大满意度分数。算法根据用户在用户端输入的满意度分数,对比每个计算器的计算能力得出满意度分数和计算能力比值,对于进入Reduce的任务(Job)也设计了相应的算法,通过与Hadoop自带的调度算法三种算法进行实验对比,所提出的最大满意度调度算法可以得出用户希望的计算输出结果并在一定程度上减少调度时间,提升了系统吞吐量。  实验后发现本算法可以有效提升计算效能和吞吐量,并在一定程度上解决计算实时问题,对于该领域研究发展有一定的促进作用。
其他文献
在数控加工中,由于各种热源的作用造成机床部件产生热变形,从而严重影响工件的加工精度。除改善机床和加工条件外,在数控系统中进行补偿是解决热变形误差的有效手段,并且补偿方法
随着计算机科学技术的发展,网络数据呈爆炸式增长,如何从海量数据中挖掘有价值的知识成了当前研究的热门。然而,这些网络数据具有来源广泛、无结构、无层次、多噪音等特点。幸运
随着信息技术的快速发展,许多领域中每天都不断产生大量的数据,如传感器网络中传输的各种数据等。这些产生的海量数据很多都是以不确定数据流的形式存在。数据挖掘提供了对这
随着工作流技术的日趋成熟,工作流在企业、政府等地方都得到了广泛的应用,市场上的工作流产品也越来越多,这为用户提供了非常大的选择余地,但同时,我们也不得不承认,在实际应用中,不
近年来,森林火灾事故频发,给国家和人民造成了难以估计的损失。因此,提出一个有效的火灾检测方法一直都是学者研究的主要课题。传统的火灾检测技术多利用火焰温度、烟雾浓度
随着微机电技术(MEMS)、无线通信以及数字电子等技术的进步无线传感器网络发展迅猛。无线传感器网络以其低消耗、低能源、多功能的优势深刻地改变着人们的日常生产、生活方式
随着移动通信技术的迅猛发展,网络越来越明显地呈现出泛在化的特征,即任何人在任何时间任何地点都能畅通无阻地获得网络接入。而随着网络的泛在化,能够接入网络的设备种类也
随着大数据和分布式系统的广泛应用,云存储访问控制方法—密文策略的属性加密方案CP-ABE(Ciphertext-Policy Attribute-Based Encryption)的缺陷日益显著。许多文献提到,用CP-A
随着信息化进程的加速,政府及企业都在建设各自的信息系统,这些信息系统彼此独立,很难实现信息共享。数据交换系统能够很好的解决“信息孤岛”问题,使得异地异构的数据进行交换和
相对其他传统喷雾施药技术而言,风送式喷雾技术具有突出的优点,但国内外对风送式喷雾机的研究主要集中在风机内部结构优化、风机外部气流速度场模拟仿真和雾滴试验上,对风送式喷