基于拓扑感知的MPI Alltoall通信优化

来源 :2014全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:fzyfmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Alltoall通信是对网络性能要求最高、扩展性最差的MPI集合操作之一,同时又作为核心通信模式广泛应用于诸多计算领域.而随着高性能计算机系统规模的急剧增大,能够降低成本并提高利用率的过载网络(oversubscribed network)设计成为大规模计算系统网络设计的趋势.过载网络给Alltoall通信带来更严峻的挑战,网络的过载特性不仅会导致链路的竞争,还易引发消息顺序错乱从而严重降低通信性能.为此,本文提出一种针对过载网络的拓扑感知Alltoall优化方法.该方法以针对小规模系统的优化算法为基础算法,使用层次化通信结合粗粒度同步缓解大规模环境下由消息序错乱引起的通信低效问题,并使用“分批-节流(batch-throttling)”思想解决高网络过载率带来的过度竞争问题.在SMP集群和神威蓝光系统的上的测试结果表明,本文优化方法可以显著提升Alltoall通信性能.
其他文献
豆芽菜是我国城乡人民冬春季节的家常菜,但在传统豆芽培育中,存在周期长、产量低,有根须、纤维多,吃时口感差的特点.目前,采用科学的方法生产高产无根豆芽,生长周期短,操作
人总是要有点精神的。一个民族,要有自己的民族精神。一个企业,要有自己的企业精神。一个人,也要有自己的奋斗精神。一个大学生,应该有勤奋刻苦、好学上进的精神。虽然在不
为提高PPMLR-MHD(Lagrangian version of Piecewise Parabolic Method-Magnetohydrodynamics)数值模拟算法的计算速度,对其进行了并行化及性能调优.对于理想MHD模型,描述了基
会议
直线加速器中大规模带电粒子的追踪对高电流直线加速器的设计和优化至关重要.本文介绍了3维异构并行束流动力学模拟软件LOCUS3DG的开发现状,这是基于以前开发的并行束流模拟
阅读是语文教学的重要组成部分,同时也是语文学科教学的重点,更是培养学生语言组织能力和表达能力的重要途径.随着新课程教育改革的深入,学生在教育教学中的主体地位得到了凸
在核心素养的教学背景,通过在小学语文教学中的传统文化渗透活动,对于小学生的综合素质养成有着积极的价值.但对低年级阶段的小学生而言,他们的传统文化吸收还存在着客观的困
一、概述 软件系统是为了用户方便和充分发挥计算机效能的各种程序的总称,也可称为软设备或程序系统。它包括操作系统、各种程序设计语言及其编译系统、各种应用程序系统和
在这篇文章中,描述了一个基于稀疏表示的时变体数据压缩绘制框架,它能有效缓解大规模时变数据绘制对于存储和传输带宽的严峻挑战.压缩方法首先利用时变体数据的时间一致性,提
会议
MC33370系列IC产品是美国摩托罗拉(Motorola)公司新近推出的五端单片开关电源集成电路。该系列产品具有较完善的工作状态控制能力。本文阐述了它们的性能特点、内部结构和工
数学教学需要和小学生的生活实践相联系,在具体的学习过程中应该以教材为主要内容,立足学生的生活经验、已经具备的数学知识出发,运用多种方式,建立起一个探索数学知识的场景