论文部分内容阅读
移动互联网和人工智能的发展,5G时代下大规模新型应用的提出,使得数据中心(DC)的计算规模和网络流量急剧增长。分布式计算应用的发展使得数据中心内流量的通信模式也变得多种多样,分布式计算对网络的连接结构也提出了新的需求。传统的网络越来越无法支撑新的数据密集型的应用,分散光网络和资源分散网络作为新型光互连网络受到关注,而这些新型光互连网络要求现有网络结构和节点的功能变得开放,本文针对开放的互连网络以及资源分散网络所带来的新的挑战,设计并实现了面向分布式计算的分散网络光互连节点。分散化网络互连节点具有开放可控得系统功能,主要包括数据层面上的流信息统计,发送通道选择以及光分组汇聚等功能,控制层面上的节点内流信息和各功能模组状态上报,并根据上层控制系统的指令对节点内的参数结构配置更改以及节点互连的光交换矩阵连接进行配置。本文采用高速FPGA实现了上述节点的功能逻辑,并搭建互连网络实验平台对节点的功能进行验证。另外,基于该光互连节点,提出了利用流相关性的网络故障定位和恢复功能,讨论了基于流的相关性进行流分类的网络路径信息发现与提取,并通过SDN控制器实现了网络故障的定位与恢复,通过搭建实验平台,对该功能进行了不同类型故障场景下的实验与验证。最后,分析了资源分散化数据中心网络(DDC)的网络模型与资源结构,讨论了不同计算作业在不同的DDC模型结构下的内存通信量与网络通信量的关系,基于FPGA平台对资源分散网络节点中的流量进行了模拟,针对资源分散网络中的流量排队与调度问题,评估了优先级方式、带宽预留以及轮询三种常见的调度方式对资源分散网络流量负载传输性能的影响。