集合通信网卡的设计与研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:kunjian99_Gmail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算机系统规模急剧增大,节点数量和处理器核心数目不断增长,多进程间消息通信带来的开销日益增加,以集合通信为代表的多进程间通信往往成为系统瓶颈。集合通信消息开销巨大,软件优化的方法无法胜任,考虑到高性能计算机多节点的通信是通过互连网络进行的,所以可以构建硬件支持集合通信专用网络来加速集合通信操作。   随着多核技术的发展,节点内的硬件并行度大大增加,节点内部的通信压力加剧,集合通信的节点内部分越来越重要。因为采用软件算法有扩展性问题,而且频繁的访存操作增加节点内通信开销,所以可以考虑采用基于网卡的实现方法来加速节点内集合通信操作,这种方法能够分担节点内处理器的通信和计算开销,使得通信与计算重叠。   本文配合曙光6000专用集合通信交换机芯片,设计并实现集合通信网卡,与交换机一起构成专用集合通信网络。本文的主要贡献包括:   1.提出了一种支持集合通信操作的网卡结构,此网卡可以加速节点内集合通信操作,而且与交换机构成集合通信网络加速节点间集合通信操作。该集合通信网络具有良好的扩展性、高带宽、低延迟、可靠性和可管理性等特性。   2.设计并实现集合通信核心部件:Barrier模块、Reduce模块、Burst-AllReduce模块。这三个部件不仅具有网络数据交换功能,而且具有运算功能。   3.采用仿真验证平台对专用集合通信网络进行功能验证和数据测试。主要测试节点内集合通信操作和节点间集合通信操作的延迟和带宽,并给出数据的分析和性能评价。   对数据的分析可以发现:(1)基于数据包的Barrier操作延迟相对较大。(2)Reduce操作带宽利用率低,延迟较小,适用于小消息归约,Burst-AllReduce操作启动代价大,带宽利用率高,适用于大消息归约。  
其他文献
软件作为信息系统的基础,软件中的任何安全漏洞都可能导致非常严重的后果。随着系统规模的不断扩大,结构日益复杂,软件中的安全漏洞也会相应增多。软件安全漏洞的检测技术是保证
随着数据采集、存储技术的飞速发展,数字图像的积累越来越容易,用户在数字图像管理方面的需求不断增加、深化,利用机器学习技术来提高图像自动标注的性能受到了越来越多的关注。
高中阶段数学在学习内容和学习方式上都发生了比较大的变化,学好高中数学,更需要我们去理解和领悟.对高中数学的内容及其特点有更深刻的了解,才能更容易找到适合高中数学的学
时代给数学学科提出了很高的要求,希望通过数学的学习提高思维能力,合理运用思维联系并合理运用于数学问题以及其他各科甚至实践问题的解决中去.这也是新课改明确提出的要求
随着信息时代的到来,计算机技术得到了前所未有的跨越式发展,人们对软件质量的要求也越来越高。可靠性作为衡量软件质量的重要特性,其定量评估和预测已成为众多学者关注和研
美国海军研究局早就从事水下机器人的研制工作,它们研制的这种机器人能在深水中完成战斗任务。不久前媒体报道了两种这样的机器人,虽然技术处理不一样,但是使用的目的是一样
软件总费用的很大一部分都投入到软件维护中用于修改已交付的程序来满足不断变化和增长的用户需求,为了提高软件的维护性,降低成本,采用先进的开发方法显得越加迫切。本实验室为
如何准确、有效地提取影像中的特征信息是影像目标识别的核心内容,尤其是对中分辨率影像和高分辨率影像的特征信息的提取是影像目标识别的热点和难点。本论文以高分辨率影像
不等式证明是高中数学的重点难点之一.不等式的种类繁多,证明的方法也难易悬殊,使用的技巧各异,尽管教材中对不等式的证明给出了系统的总结,但是有很多不等式,我们还是较难快
随着信息技术的发展,信息技术在日常生活中的应用越来越广泛,从而受到越来越多企业的关注与资金投入。另一方面,随着信息技术的普及,企业中的数据越来越多,如何有效地分析这些数据