基于Docker的HPC并行应用部署系统

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lyhl1949
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在高性能计算(HPC)领域,气象预测、地震监测、基因数据处理等并行应用对计算能力的需求越来越高。如何对HPC并行应用进行快速部署和便捷性维护成为一个急需解决的问题。  本文探讨了HPC并行应用部署中面临的各种挑战,基于Docker container技术,设计并实现了一个面向MPI并行应用的自动化部署系统whay。本文的主要工作和创新点如下:  1.资源管理方面,设计了resource和allocator模块:将分散在不同节点上的物理资源聚合起来,屏蔽了底层的资源分布细节;同时将普通用户请求的资源总量,根据对应的分配算法,进行拆分,分散到底层不同的节点之上。这使得从大量节点遴选合适节点集的工作完全自动化。  2.在资源调度方面,本文根据节点负载和并行应用特点,设计了scheduler模块。一方面,通过负载均衡策略,使得每个container绑定到固定的CPU上运行,从而避免了不同并行应用相互干扰。另一方面,针对不同的应用特点,我们优化了相应的资源调度算法,从而提高并行应用的执行效率。  3.多节点镜像传输方面,本文设计了流水镜像传输策略。相对于采用固定节点作为镜像服务器,流水传输集合中的每个节点既是客户端又是服务器,从而有效利用系统带宽。该机制使镜像的传输时间理论上缩短为单一镜像服务器传输时间的S+U/N*S(S是镜像文件大小,U是传输块大小,N是镜像目的节点个数),实际情况下16个节点的部署时间缩短为单一镜像服务器的46.7%,大大提高了HPC应用的署速度。  4.部署工作的易维护性方面,设计了任务管理模块manager。每一个并行应用的部署,都对应一个whay系统中的任务。该机制使得后续对应用的查看、升级、删除等操作无需对每个部署节点进行手动操作,而是对任务进行自动处理。  whay部署系统将机群资源虚拟化,将计算资源的搜集、分配、调度和应用的管理自动化,同时使得大规模镜像传输的效率获得了极大提升。利用whay系统,使得用户能够在5分钟之内将并行应用部署到1000个节点之上。
其他文献
随着电子文档的数目爆炸性增长和互联网技术的发展,电子文档的应用逐渐丰富。这要求一种更加智能化的方式来帮助人们处理大量的电子文档,例如信息提取、检索、格式转换、版面重
面部表情自动分类在智能人机交互中发挥着极为重要的作用,是计算机视觉、图像处理、模式识别等领域的一个热门研究话题。 Gabor函数是唯一能够达到时频测不准关系下界的函
管理信息系统即MIS,在信息化建设不断完善的现代社会中普及程度不断提高。MIS作为现代社会新学科,跨越管理科学、系统科学、运筹学、统计学等,在这些科学的基础上,形成信息搜集和
现代社会,信息是人类宝贵的资源,以数据库为核心的信息系统在人们的生活工作中的作用越来越重要。因此,数据库技术得以成为计算机科学技术中发展最迅速的领域之一,它已成为计算
随着用户信息需求的不断增长,需要目前的web检索系统能够为用户提供更加有效、更富个性化的检索服务。其中问答式信息检索作为一种能够接受用户自然语言提问,并返回问句直接答
随着我国高等教育改革的不断深化和办学规模的不断扩大,工作难度越来趔大,任务越来越重,原有的传统的管理手段无法适应现实需要。落户的管理手段会直接影响到了教学质量和办学水
空间数据挖掘是从空间数据库中提取隐含的、用户感兴趣的空间和非空间的模式、普遍特征、规则和知识的过程。由于空间数据的复杂性及其应用的专业性,一般的数据挖掘理论和方法
数据挖掘,也可以称为数据库中的知识发现(KDD),是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和
数据挖掘是数据库技术发展,目前己经成功地应用于各个领域,但大部分集中在银行、金融、大型商业数据库等赢利性领域中,在高校、政府等一些非赢利性机构中应用很少。智能自测试系
应用程序中变量和数据源之间的结合方式、对应关系以及变量取值和数据项之间的相互转换过程是持久化过程需要考虑的重要问题,它直接体现了数据在应用特定的语境中的语义,即所谓