数据中心网络拥塞管理机制研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wd707800502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新兴的人工智能、HPC云、基于NVMe-over-Fabric的分布式存储、实时大数据分析等应用发展,RDMA技术正广泛应用于数据中心。通过传输层的硬件卸载及OS-bypass的数据路径,RDMA技术大幅降低了主机端协议栈开销和延迟,将数据中心网络的性能需求带入微秒量级,同时也促进了25G、100G甚至400G高带宽网络的应用发展。然而RDMA技术需要承载在无损数据中心网络之上。当前增强型以太网、InfiniBand等无损数据中心网络,仅满足了无丢包的需求,在兼顾高吞吐、低延迟方面面临严峻挑战。  无损数据中心网络的最大挑战来自于网络拥塞。为实现链路级零丢包,无损数据中心网络采用了链路层反压流控。一旦发生网络拥塞,交换机缓存队列的队头阻塞导致拥塞逐级反压,最终形成拥塞树,影响网络整体性能。而数据中心普遍存在的微突发流量会进一步加剧该挑战。本文以无损数据中心网络的网络拥塞作为研究对象,以追求低延迟高吞吐的无损网络性能为目标,对网络拥塞管理机制展开了深入研究。论文创新性工作包括如下:  (1)开发了一款基于OMNeT++框架的弹性数据中心网络模拟器FlexDCNSim。该模拟器支持可配置的服务器节点和网络部件,支持丰富的网络拓扑和协议,可运行无修改的TCP/IP网络协议栈,具有高准确性和良好的扩展性。  (2)针对拥塞控制的及时性问题:提出了一种局部拥塞控制机制(RCC),将传统端到端拥塞控制下移至点到点基于交换机的逐跳拥塞控制。为了及时检测并有效控制拥塞,该机制在交换机同时对输入、输出队列进行拥塞测量,并同时对造成拥塞的数据流进行精确识别;一旦检测到拥塞,该机制将产生拥塞通知并连同拥塞流D(如五元组)立即传递给邻居交换机;各交换机将根据局部的拥塞程度,采用基于窗口的速率控制对拥塞流进行拥塞控制,而不损害非拥塞流的性能。实验结果表明,RCC可以及时、公平地响应微突发拥塞,一旦拥塞解除能够快速恢复速率,显著降低延迟敏感的老鼠流流完成时间达11%~24%,同时对吞吐敏感的大象流几乎无影响。  (3)针对网络负载均衡问题:提出了一种局部拥塞感知的逐跳数据包分发方法(CPS)。每台交换机基于RCC提供的局部网络状态信息,选择可用的轻载路径逐包分发,尽可能地均匀分配负载而不增加交换机复杂度;同时在末端增加乱序包重排序,减小乱序数据包对上层应用地影响。实验结果表明,CPS具有较小的数据包乱序重排序的情况下,提供了优于近期典型的负载平衡机制的网络性能。在60%的网络注入率下,CPS相比于当前典型的负载均衡机制,可以减小95%的流完成时间,吞吐率提高约32%;应对Incast流量模式,CPS可以减小23%的Incast流FCT的尾延迟。  (4)针对动态流量热点问题:提出了一种局部拥塞感知的自适应路由方法(SAR)。该机制通过识别拥塞区域并在拥塞区域边缘实施自适应路由,根据局部网络拥塞状态,动态地调度静态路由上的非拥塞流量绕开拥塞热点,通过拥塞程度较低的等价多路径进行转发,充分利用网络低利用率的带宽。实验结果表明,该方法在典型数据中心负载下,背景流网络带宽可以提升12%,老鼠流的流完成时间可以降低38%。
其他文献
随着计算机技术的发展,人们开始探索将各种新技术应用于教育教学领域,同时也促进了CAI理论的发展。其中,课程软件概念的提出将CAI的功能从辅助教学扩展为教学与自学相结合的辅助
数字化半色调是一种把连续调图像转化为半色调图像的技术,广泛地应用于印刷和照排系统中。误差扩散算法是实现上述转化的最主要算法。随着印刷等技术的发展,对数字化半色调的速
演化性是软件的本质属性。为适应Internet开放环境和用户需求的变化,系统需要能够动态调整自身。系统的动态演化能力作为衡量软件自适应性和灵活性的重要指标,已成为软件工程
不同于传统基因表达检测技术,高通量微阵列技术可以同时测量成千上万基因表达水平,为功能基因组学基因调控网路研究提供强大的技术支撑。关联分析方法用于分析微阵列数据集基
视频监控中的异常行为检测已经受到广泛关注,特别是在公共安全领域。随着视频资料膨胀式的发展,人为监控判断资料的异常已经不能够满足安全保障的需要。本文致力于解决视频监控
需求工程是软件开发中的一个重要阶段。需求工程分为需求获取、需求分析、需求规约、需求确认和需求管理五个基本活动。其中,需求获取是整个需求工程的开端,其输出制品的质量会
二十世纪九十年代以来,互联网逐渐深入到人们日常生活的各个方面,成为不可或缺的一部分。互联网流量识别是互联网流量测量领域的研究热点之一,在提供网络信息、保证服务质量等方
随着信息技术的高速发展和现代战争的需要,多传感器信息融合作为一门新兴交叉学科得到广泛关注。基于信息融合技术的目标识别已成为国内外研究的热点。如何快速、准确地对目
为了追求更高的精度,当前神经网络的研究朝着模型更复杂、训练数据规模更大的方向发展,这导致模型的训练部署更困难、训练时间急剧增长。怎样将大型神经网络模型在多GPU集群环
中文词法分析是中文信息处理的重要基础,汉语是没有自然分割的连续文本,古代汉语更是没有任何边界标志,我们现在所看到的文言文中的标点符号,都是后人为了方便人们阅读而添加的。