数据中心网络拥塞管理机制研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：wd707800502

【摘要】

：

随着新兴的人工智能、HPC云、基于NVMe-over-Fabric的分布式存储、实时大数据分析等应用发展，RDMA技术正广泛应用于数据中心。通过传输层的硬件卸载及OS-bypass的数据路径，RDMA

【作者】

：

刘小丽

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2018年期

【关键词】

：

数据中心网络拥塞管理负载均衡自适应路由网络模拟器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着新兴的人工智能、HPC云、基于NVMe-over-Fabric的分布式存储、实时大数据分析等应用发展，RDMA技术正广泛应用于数据中心。通过传输层的硬件卸载及OS-bypass的数据路径，RDMA技术大幅降低了主机端协议栈开销和延迟，将数据中心网络的性能需求带入微秒量级，同时也促进了25G、100G甚至400G高带宽网络的应用发展。然而RDMA技术需要承载在无损数据中心网络之上。当前增强型以太网、InfiniBand等无损数据中心网络，仅满足了无丢包的需求，在兼顾高吞吐、低延迟方面面临严峻挑战。　　无损数据中心网络的最大挑战来自于网络拥塞。为实现链路级零丢包，无损数据中心网络采用了链路层反压流控。一旦发生网络拥塞，交换机缓存队列的队头阻塞导致拥塞逐级反压，最终形成拥塞树，影响网络整体性能。而数据中心普遍存在的微突发流量会进一步加剧该挑战。本文以无损数据中心网络的网络拥塞作为研究对象，以追求低延迟高吞吐的无损网络性能为目标，对网络拥塞管理机制展开了深入研究。论文创新性工作包括如下:　　(1)开发了一款基于OMNeT++框架的弹性数据中心网络模拟器FlexDCNSim。该模拟器支持可配置的服务器节点和网络部件，支持丰富的网络拓扑和协议，可运行无修改的TCP/IP网络协议栈，具有高准确性和良好的扩展性。　　(2)针对拥塞控制的及时性问题:提出了一种局部拥塞控制机制(RCC)，将传统端到端拥塞控制下移至点到点基于交换机的逐跳拥塞控制。为了及时检测并有效控制拥塞，该机制在交换机同时对输入、输出队列进行拥塞测量，并同时对造成拥塞的数据流进行精确识别;一旦检测到拥塞，该机制将产生拥塞通知并连同拥塞流D（如五元组）立即传递给邻居交换机;各交换机将根据局部的拥塞程度，采用基于窗口的速率控制对拥塞流进行拥塞控制，而不损害非拥塞流的性能。实验结果表明，RCC可以及时、公平地响应微突发拥塞，一旦拥塞解除能够快速恢复速率，显著降低延迟敏感的老鼠流流完成时间达11％～24％，同时对吞吐敏感的大象流几乎无影响。　　(3)针对网络负载均衡问题:提出了一种局部拥塞感知的逐跳数据包分发方法(CPS)。每台交换机基于RCC提供的局部网络状态信息，选择可用的轻载路径逐包分发，尽可能地均匀分配负载而不增加交换机复杂度;同时在末端增加乱序包重排序，减小乱序数据包对上层应用地影响。实验结果表明，CPS具有较小的数据包乱序重排序的情况下，提供了优于近期典型的负载平衡机制的网络性能。在60％的网络注入率下，CPS相比于当前典型的负载均衡机制，可以减小95％的流完成时间，吞吐率提高约32％;应对Incast流量模式，CPS可以减小23％的Incast流FCT的尾延迟。　　(4)针对动态流量热点问题:提出了一种局部拥塞感知的自适应路由方法(SAR)。该机制通过识别拥塞区域并在拥塞区域边缘实施自适应路由，根据局部网络拥塞状态，动态地调度静态路由上的非拥塞流量绕开拥塞热点，通过拥塞程度较低的等价多路径进行转发，充分利用网络低利用率的带宽。实验结果表明，该方法在典型数据中心负载下，背景流网络带宽可以提升12％，老鼠流的流完成时间可以降低38％。

其他文献

智能可视化算法课程软件

随着计算机技术的发展，人们开始探索将各种新技术应用于教育教学领域，同时也促进了CAI理论的发展。其中，课程软件概念的提出将CAI的功能从辅助教学扩展为教学与自学相结合的辅助

学位

计算机辅助教学CAI智能可视化人机交互算法课程软件

一种基于可配置处理器的误差扩散算法实现方法

数字化半色调是一种把连续调图像转化为半色调图像的技术，广泛地应用于印刷和照排系统中。误差扩散算法是实现上述转化的最主要算法。随着印刷等技术的发展，对数字化半色调的速

学位

调频挂网误差扩散指令融合多处理器

基于J2EE的软件动态演化平台设计与实现

演化性是软件的本质属性。为适应Internet开放环境和用户需求的变化,系统需要能够动态调整自身。系统的动态演化能力作为衡量软件自适应性和灵活性的重要指标,已成为软件工程

学位

动态演化体系结构D-ADL演化平台J2EE

微阵列数据集的频繁闭合模式挖掘算法研究

不同于传统基因表达检测技术,高通量微阵列技术可以同时测量成千上万基因表达水平,为功能基因组学基因调控网路研究提供强大的技术支撑。关联分析方法用于分析微阵列数据集基

学位

微阵列技术微阵列数据集数据挖掘关联规则频繁闭合模式

基于HDP-HMM的异常行为检测方法研究

视频监控中的异常行为检测已经受到广泛关注，特别是在公共安全领域。随着视频资料膨胀式的发展，人为监控判断资料的异常已经不能够满足安全保障的需要。本文致力于解决视频监控

学位

视频监控图像识别行为检测图像处理

面向企业信息系统的基于场景的协同式需求获取方法

需求工程是软件开发中的一个重要阶段。需求工程分为需求获取、需求分析、需求规约、需求确认和需求管理五个基本活动。其中，需求获取是整个需求工程的开端，其输出制品的质量会

学位

软件开发企业信息系统需求获取场景建模

基于TCP流功能划分的P2P协议分类和僵尸网络流量检测

二十世纪九十年代以来，互联网逐渐深入到人们日常生活的各个方面，成为不可或缺的一部分。互联网流量识别是互联网流量测量领域的研究热点之一，在提供网络信息、保证服务质量等方

学位

协议分类流量识别僵尸网络邮件滥发网络流量P2P流量

基于信息融合技术的目标识别方法研究

随着信息技术的高速发展和现代战争的需要,多传感器信息融合作为一门新兴交叉学科得到广泛关注。基于信息融合技术的目标识别已成为国内外研究的热点。如何快速、准确地对目

学位

目标识别信息融合神经网络证据理论

深度学习模型的分布式优化方法研究

为了追求更高的精度，当前神经网络的研究朝着模型更复杂、训练数据规模更大的方向发展，这导致模型的训练部署更困难、训练时间急剧增长。怎样将大型神经网络模型在多GPU集群环

学位

深度学习模型分布式优化模型划分神经网络

古今汉语平行语料库自动分词及标注工具的研究

中文词法分析是中文信息处理的重要基础，汉语是没有自然分割的连续文本，古代汉语更是没有任何边界标志，我们现在所看到的文言文中的标点符号，都是后人为了方便人们阅读而添加的。

学位

古今汉语平行语料库自动分词训练语料分词标注马尔科夫模型中文信息处理

数据中心网络拥塞管理机制研究

其他学术论文