面向大规模共享集群的作业管理系统设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:uniw0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来集群系统已成为分布式计算领域研究的热点。随着集群规模的不断扩大和集群的共享化,作业管理在集群高性能计算中发挥着越来越重要的作用。针对大规模集群中的单节点瓶颈问题和共享集群中的作业资源需求复杂的特点,本文提出了可扩展的集群作业管理系统的设计模式:在系统结构层面,应采用集中式作业请求处理、层次化节点信息管理,而非请求处理和节点管理均采用集中式的作业管理。本文还提出资源信息分级、汇报制和查询制结合获取节点资源信息、作业流控制等降低管理节点通信处理开销的设计指导原则以避免管理节点瓶颈。 作业调度问题是影响集群作业管理系统性能的关键因素,针对共享集群的作业特点,本文提出并实现了基于内存和CPU利用率等计算资源需求,而非作业执行时间进行分时分区共享的作业调度策略和作业预填策略,并讨论了作业调度中应采用的资源参数问题。 最后,本文设计并实现了集群作业管理系统LilyJM。该系统遵循POSIX1003.2标准,实现了面向作业的CPU利用率和内存需求的作业调度策略,以及根据作业资源需求进行作业实际CPU利用率控制的机制。通过与OpenPBS类系统的对比实验,LilyJM系统在总吞吐率、平均响应时间、平均周转时间上的性能表现均优于OpenPBS。
其他文献
随着网络的发展和电子邮件的普及,垃圾邮件的数目飞速增长。大量涌现出来的垃圾邮件,不仅耗费了大量网络带宽和计算机时间空间开销,而且对用户的正常工作造成了严重的干扰。为了
伴随着计算技术的发展,在实际应用需求的推动下,数值计算得到了长足进步。数值软件尤其是并行数值软件是当前数值计算应用的关键环节。日益增多的大规模、复杂实际应用问题,对数
XML(Extensible Markup Language,可扩展标记语言)是由万维网联盟(WorldWide Web Consortium,W3C)定义的一种标记语言,由于其跨平台、与软硬件无关的特性,目前已被广泛用于组织、
奥运信息系统作为大型信息系统是奥运会管理、支撑、运作的关键基础设施,是奥运会成功举办的主要因素之一。通过建立简明准确的模型是分析和设计奥运信息系统的关键。 奥运
嵌入式操作系统面向的应用领域十分复杂,这要求嵌入式操作系统具有可配置、可剪裁的能力。将基于构件的软件开发方法应用于嵌入式操作系统领域,不仅可以使嵌入式操作系统具有可
随着大规模网络存储系统的发展,基于P2P结构的存储体系由于可扩展性、健壮性以及性能的优势,越来越受到人们的重视。文件的可用性是存储系统最重要的属性之一,可用性水平的高低
垃圾邮件问题已经成为当今Internet的灾害。垃圾邮件是指那些未经收件人许可就发送到收件人邮箱的电子邮件。垃圾邮件每年都在造成大量的金钱损失、生产力浪费,并且造成Intern
随着工业控制、交通管理、环境监测、网络监测等各个领域中数据流应用的大量出现,数据流上的查询处理成为近年来研究的热点问题。这些应用中的数据通常来源于多个计算设备,形成
随着科学技术的不断进步,现在照相机的像素已经越来越高,普通的手机像素也已经高达千万级别,传统的对图像的处理已经无法满足用户的需求,特别是在颜色编辑方面,现有的方法对图像的
本文从电子设计自动化技术对研发流程的工程化、标准化要求入手研究电子设计自动化元件符号库的建库技术,总结了北京大学微处理器研究开发中心为建立规范、统一、标准化的元件