基于IaaS云平台的Hadoop资源调度策略研究

来源 :北京交通大学 | 被引量 : 10次 | 上传用户:zyllovezk1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算是当前国内外研究的热点领域之一,它通过网络整合计算、存储、网络等资源,并且将这些资源按需提供给用户使用。Hadoop是一个开源的分布式系统框架,可以实现大规模的数据计算和存储,通常部署在服务器集群中。将Hadoop部署在IaaS云环境有诸多益处,但IaaS云为Hadoop提供的环境和传统的物理集群存在差异。本文主要研究将Hadoop部署在IaaS云环境,在以下三个方面开展研究性工作:(1)考虑到IaaS云环境中Hadoop不能了解底层物理主机的资源使用情况,为合理利用物理主机的资源和增强虚拟集群的可伸缩性,本文设计将Hadoop f口IaaS云融合的DHCI(Dynamic Hadoop Cluster on IaaS)架构。在DHCI架构中,除私有云和Hadoop原有的套件外,增加监控模块、虚拟机管理模块和调度模块。监控模块收集物理主机负载信息,为Hadoop资源调度研究提供了依据;虚拟机管理模块和调度模块实现集群灵活的伸缩。(2)在DHCI架构基础上,本文提出基于物理主机负载反馈的资源调度策略。通过调度模块获取的物理主机负载信息,并对这些负载信息进行分级处理,确保Hadoop进行资源分配时,有效避免将资源分配给负载过重的物理主机,实现物理主机负载的均衡。(3)本文在Hadoop集群中使用计算节点和存储节点相分离的部署策略,虽然可以较好地保证集群的可伸缩性,但在一定程度上破坏了Hadoop的数据本地性。为此,本文设计IaaS云平台上动态虚拟机迁移策略。基于“移动计算”的思想,充分考虑运算资源特点,将不满足本地性要求的计算节点迁移到相应存储节点所在的物理主机或机架上,以减轻带宽资源的消耗,进而提高系统的性能。最后,本文选用开源的计算管理平台OpenStack作为IaaS云平台,对所提出系统架构和策略进行实现。采用Hadoop勺性能测试工具Hibench实现系统性能测试。结果表明:在运行相同的任务情况下,DHCI架构完成时间要少于普通Hadoop集群。在任务运行过程中,对物理主机负载数据进行统计,可以发现DHCI架构下物理主机之间的负载比普通Hadoop集群更为均衡。在Hadoop数据本地性测试中,在执行相同任务情况下,经过本地性优化Hadoop集群的任务运行时间少于未经过本地性优化的集群。
其他文献
目的:本研究应用快速、高敏感性和特异性的荧光原位杂交技术(fluorecence in situ hybridization,FISH)检测BCR/ABL融合基因并对阳性病例进行分析。方法:回顾性分析2010年4月
本文使用汽油喷灯对几种针阔叶树种进行模拟火烧处理,测量各火烧处理后叶片生理指标(电导率、丙二醛、超氧化物酶、过氧化物酶、脯氨酸、蛋白质、可溶性糖、叶绿素、含水量、
狂犬病是由弹状病毒科的狂犬病毒引起的急性传染病,属典型的人兽共患病。犬类和野生动物是狂犬病的重要宿主和传染源。人一旦发病。病死率为100%。近几年云南省人间狂犬病发病
针对玉米籽粒直收过程中清选作业损失率高、籽粒含杂率高的问题,开展玉米籽粒收获机清选作业参数优化试验,探究整机作业工况下清选装置作业参数对籽粒损失率和含杂率的影响规
以不同烟草赤星病抗性品种JYH(抗病品种)和CBH(感病品种)为材料,在盆栽试验条件下,调查不同烟草赤星病胁迫程度(轻度胁迫、中度胁迫和重度胁迫)对光合色素含量、光合作用参数和叶绿
近年来,随着全球性气候变化,极端天气现象明显增多,水旱灾害发生趋于频繁,每年旱涝灾害都造成了巨大的经济损失,严重的威胁着人类各种社会经济活动的正常进行。全球性水资源
编前语:党的十九届四中全会明确提出,要建立不忘初心、牢记使命的制度。本期视点报道我省各地在学习教育、调查研究、检视问题、整改落实等方面,探索将“不忘初心、牢记使命”形成长效机制,坚持不懈锤炼党员干部忠诚干净担当的政治品格的经验做法。  “大家早上好!今天是2019年12月26日,星期四,今天与大家一起学习《中国共产党简史》第四章夺取民主革命的全国胜利……”早上九点,伴随着柔和的轻音乐,朗朗的读书声
卵菌是一类形态上与真菌相似,但在进化关系上与硅藻和褐藻极为相近的真核微生物。卵菌中包含很多来自植物、动物的病原微生物,其中疫霉属中一些成员是对植物具有毁灭性的病原