论文部分内容阅读
无论是基于云平台的高性能计算(HPC in Cloud),还是基于超算中心的云计算服务,高性能计算和云计算在基础设施上的融合都是数据中心重要发展趋势。在融合的趋势下,高带宽、低延时是高性能应用和云计算应用对通信系统共同的需求,但为了满足这种共性需求,必须展开探索面向应用融合的互连网络软硬件架构。 面对上述的需求,中国科学院计算技术研究所高性能计算机研究中心提出了基于融合互连网络接口控制器(Fusion Fabric Controller,FFC)的通信系统硬件平台。基于该硬件平台,本文设计并实现高性能融合互连网络通信系统,论文的研究内容和贡献如下: 1、针对高性能和云计算通信架构的差异性而导致应用程序彼此隔离的问题,本文提出了高性能融合互连网络通信架构,该架构可以支持共享基础上的高带宽、低延时通信。 2、针对RDMA系统安全性问题,本文提出了针对宿主机和客户机的内存保护方法。宿主机实现了反向的DMA映射功能,而客户机实现了基于前后端的I/O映射机制,有效的解决了用户级通信安全隐患。 3、针对操作系统对用户级通信的地址访问限制,本文提出了基于宿主机和客户机的内存注册和地址映射机制,实现了内存注册和地址映射的接口,使用户级通信突破地址访问限制,为通信流程提供统一规范。 4、针对FFC特征的TCP/IP通信设计问题,本文提出了基于NAP/PUT的高速轮询的TCP/IP通信方法。 基于上述技术,本文开发了高性能融合互连网络通信系统的通信软件平台,包括FFDRVIER,FNETBCL和IPoFN三大模块。实际测试表明,在宿主机中通信系统点到点的最低通信延时为2.67μs,最大带宽可以为1230.47MB/s,在客户机中点到点最低通信延时为2.83μs,最大带宽可达1121.32MB/s。而TCP/IP的点到点最低通信延时为8μs,最高通信带宽为821.8MB/s。