高效能计算机若干关键技术的研究与实现

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:kong26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
内存墙、I/O墙、功耗墙、复杂性墙、编程墙、扩展性墙是高性能计算机的发展及其应用的主要瓶颈。以高性能、可编程、可移植、稳定性为特征的高效能技术是高性能计算机研究的新方向。本文结合曙光5000A百万亿次高性能计算机的设计与实现,对大规模高性能计算机如何降低能耗、提升效能、并减少管理的复杂度等关键技术进行了研究。本文在功耗管理、应用加速、自主管理、效能评价指标,以及曙光5000A百万亿次高性能计算机的设计与实现方面开展研究工作,创新性成果如下:   1、提出了一种基于遗传算法的功耗管理方法,该方法采用作业队列的能效比作为调度因素,与面向资源效率的传统作业调度算法相比,在确保提升资源利用率、减少资源碎片、提升作业吞吐率、减少饥饿作业的前提下,大幅提升了系统的能效比。在实际应用环境中的测试表明,能有效降低系统能耗。   2、设计并实现了一种分布式层次化的自主管理机制,该机制中采用的触发式Bully选举算法具有较高的执行效率,并能够适应节点故障、链路故障和节点变化等情况,具有一定的容错能力和动态特性。该机制支持在不停机条件下新增设备,修改特征参数,支持引入新的规则和进行启发式推理,从而提高了管理效率和故障定位的准确性。   3、设计并实现了一种基于CBF哈希过滤的五元组IP包分类算法,在网络安全应用加速卡中进行了有效实现,加速了TCP/IP协议栈的处理。设计并实现了一个DGEMM应用加速器,基于2颗Xilinx Virtex V350MHz FPGA可实现44.8GFLOPS的浮点计算性能。   4、设计并实现了一种高密度可扩展的计算节点结构,包括四路SMP的刀片设计,可实现多功能I/O扩展的PCI-E扩展模块的设计,以及管理模块、互连网络模块、机箱结构的设计,并应用于曙光5000A高性能计算机。本文还给出了曙光5000A的性能评测结果。   5、提出了一个相对效能评价指标RPI,该指标综合考虑了系统采购成本、运营维护成本、关键应用性能、代码编程难易度、管理复杂度等诸多因素,有效地解决了各参数直接测量值量纲不同的问题,更具合理性和测量的简洁性。
其他文献
应用服务器为网络应用的开发、部署和运行提供全方位的支持,并提供一系列公共服务以降低应用的开发难度。目前,越来越多的网络应用的开发和运行都依赖于应用服务器和它所提供的
随着Web服务的广泛应用,面向服务的计算(SOC)已成为软件技术的发展方向。面向服务的计算采用面向服务体系架构(SOA),通过集成分布、自治的Web服务来构建软件应用,具有快速开发、
近些年歼-10战斗机、FAST射电望远镜等新型大型装备的快速发展,依赖大量试验数据的深度分析。传统的试验数据处理主要依靠专家经验与计算机工具辅助处理,在处理中多依赖单一计
由于多媒体程序在现代计算机系统中越来越广泛的应用,其性能受到了普遍重视。目前,大多数通用微处理器都通过引入一套短SIMD指令对媒体程序进行支持。这些指令可以对拼装在寄存
随着社会的迅速发展,信息技术得到广泛的应用和推广。作为信息技术的一个重要组成部分,环境信息系统(Environment Informaiton System)在信息社会中扮演越来越重要的地位。信息
伴随着近年来中国互联网的飞速发展,我国校园信息化的步伐也在不断加快,投入不断增多。校园网在日常教学、生活中的作用日益明显,具体表现在用户基数的迅速增长、校园网内资
随着计算机网络与通信技术的快速发展,移动搜索以其便利性、准确性、个性化等突出优点备受关注。如何利用移动设备从海量信息中检索出有用的信息已成为一个非常重要的研究课
基于无线传感器网络的定位系统具有监控范围广、部署方便等优势,可用于测控、导航、安全等许多领域,受到军界和工业界的高度重视,也是学术界多领域交叉的研究热点。受限的电能、
ZISC(Zero Instruction Set Computer——零指令集计算机)神经网络芯片,是目前国外先进、成熟的神经网络芯片,已经被广泛应用于产品检测、物体识别、字符识别、图像跟踪等领域。
在Internet时代背景下,应用环境和用户需求越来越易于发生变化。如何使Web用户界面适应和满足用户需求变化和多样性要求,已成为Web软件业亟待解决的热门问题之一。为了使Web