集合通信网卡的设计与研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：kunjian99_Gmail

【摘要】

：

高性能计算机系统规模急剧增大，节点数量和处理器核心数目不断增长，多进程间消息通信带来的开销日益增加，以集合通信为代表的多进程间通信往往成为系统瓶颈。集合通信消息开销巨

【作者】

：

蔺建邦

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2011年期

【关键词】

：

曙光6000 通信网卡集合通信集合通信网络多进程通信交换机芯片

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高性能计算机系统规模急剧增大，节点数量和处理器核心数目不断增长，多进程间消息通信带来的开销日益增加，以集合通信为代表的多进程间通信往往成为系统瓶颈。集合通信消息开销巨大，软件优化的方法无法胜任，考虑到高性能计算机多节点的通信是通过互连网络进行的，所以可以构建硬件支持集合通信专用网络来加速集合通信操作。　　随着多核技术的发展，节点内的硬件并行度大大增加，节点内部的通信压力加剧，集合通信的节点内部分越来越重要。因为采用软件算法有扩展性问题，而且频繁的访存操作增加节点内通信开销，所以可以考虑采用基于网卡的实现方法来加速节点内集合通信操作，这种方法能够分担节点内处理器的通信和计算开销，使得通信与计算重叠。　　本文配合曙光6000专用集合通信交换机芯片，设计并实现集合通信网卡，与交换机一起构成专用集合通信网络。本文的主要贡献包括：　　 1．提出了一种支持集合通信操作的网卡结构，此网卡可以加速节点内集合通信操作，而且与交换机构成集合通信网络加速节点间集合通信操作。该集合通信网络具有良好的扩展性、高带宽、低延迟、可靠性和可管理性等特性。　　 2．设计并实现集合通信核心部件：Barrier模块、Reduce模块、Burst-AllReduce模块。这三个部件不仅具有网络数据交换功能，而且具有运算功能。　　 3．采用仿真验证平台对专用集合通信网络进行功能验证和数据测试。主要测试节点内集合通信操作和节点间集合通信操作的延迟和带宽，并给出数据的分析和性能评价。　　对数据的分析可以发现：(1)基于数据包的Barrier操作延迟相对较大。(2)Reduce操作带宽利用率低，延迟较小，适用于小消息归约，Burst-AllReduce操作启动代价大，带宽利用率高，适用于大消息归约。　　

其他文献

内存泄漏静态分析研究与改进

软件作为信息系统的基础，软件中的任何安全漏洞都可能导致非常严重的后果。随着系统规模的不断扩大，结构日益复杂，软件中的安全漏洞也会相应增多。软件安全漏洞的检测技术是保证

学位

软件安全漏洞静态分析内存泄漏函数摘要值流图

基于多标记学习的图像标注技术的研究

随着数据采集、存储技术的飞速发展，数字图像的积累越来越容易，用户在数字图像管理方面的需求不断增加、深化，利用机器学习技术来提高图像自动标注的性能受到了越来越多的关注。

学位

数字图像标注技术机器学习多标记学习

教学要适应高中数学的新变化

高中阶段数学在学习内容和学习方式上都发生了比较大的变化,学好高中数学,更需要我们去理解和领悟.对高中数学的内容及其特点有更深刻的了解,才能更容易找到适合高中数学的学

期刊

教学高中数学概念学习内容数学的内容学习方式学习方法高中阶段低年段专业学生精简

高中数学教学中如何培养学生思维能力

时代给数学学科提出了很高的要求,希望通过数学的学习提高思维能力,合理运用思维联系并合理运用于数学问题以及其他各科甚至实践问题的解决中去.这也是新课改明确提出的要求

期刊

数学教学如何培养培养思维能力对思维思维主体数学学科解决问题环境背景合理运用动力作用教学实践高思维能力综合分析学习个体心理因素土壤

软件可靠性建模及最优化问题研究

随着信息时代的到来,计算机技术得到了前所未有的跨越式发展,人们对软件质量的要求也越来越高。可靠性作为衡量软件质量的重要特性,其定量评估和预测已成为众多学者关注和研

学位

软件可靠性可靠性建模模块级软件再生小生境遗传算法可靠性最优化

美国开发的新型水下机器人

美国海军研究局早就从事水下机器人的研制工作,它们研制的这种机器人能在深水中完成战斗任务。不久前媒体报道了两种这样的机器人,虽然技术处理不一样,但是使用的目的是一样

期刊

水下机器人特种部队水雷海军陆战队战斗任务海洋环境海军研究伊拉克战争锚地海豚

OCP应用架构中配置管理系统的设计与实现

软件总费用的很大一部分都投入到软件维护中用于修改已交付的程序来满足不断变化和增长的用户需求，为了提高软件的维护性，降低成本，采用先进的开发方法显得越加迫切。本实验室为

学位

配置管理系统软件维护OCP架构

基于独立成分分析的影像目标识别

如何准确、有效地提取影像中的特征信息是影像目标识别的核心内容,尤其是对中分辨率影像和高分辨率影像的特征信息的提取是影像目标识别的热点和难点。本论文以高分辨率影像

学位

独立成分分析特征提取模式识别高空间分辨率影像

借助导数巧用函数性质证明不等式

不等式证明是高中数学的重点难点之一.不等式的种类繁多,证明的方法也难易悬殊,使用的技巧各异,尽管教材中对不等式的证明给出了系统的总结,但是有很多不等式,我们还是较难快

期刊

导数函数性质证明不等式函数单调性等式证明函数不等式相关性质恒等变形合理利用高中数学初等方法等价转换原问题转化种类运用系统教材

基于云计算的商业智能平台关键技术的研究与实现

随着信息技术的发展，信息技术在日常生活中的应用越来越广泛，从而受到越来越多企业的关注与资金投入。另一方面，随着信息技术的普及，企业中的数据越来越多，如何有效地分析这些数据

学位

云计算海量数据商业智能平台工作流引擎插件框架数据挖掘技术

集合通信网卡的设计与研究

其他学术论文