论文部分内容阅读
云计算技术的目标是希望使得需要计算、存储和网络服务能力的企业能够从昂贵的设备采购、繁琐的应用部署和复杂的系统管理中释放出来,将更多精力投入业务软件开发与解决方案的创新。云计算允许用户按需支付,并支持其应用按需增长处理能力,降低其前期投资风险。然而,这种开放服务模型将使得具有不同背景的租赁者驻留在同一数据中心,从而带来潜在的安全威胁。例如,租赁者通过部署恶意应用并实施恶意攻击,在数据中心内部制造混乱。因此,云计算提供者不仅需要设计可扩展的数据中心结构,满足日益激增的应用需求,而且更重要的是,提供有效的性能隔离机制,保障不同租赁者之间性能互不干扰。云计算数据中心的资源主要包括计算、存储和网络资源。目前主要利用虚拟机管理器的机制,如Xen和Hyper-v,以虚拟机为单位对计算和存储资源进行划分,从而使得计算和存储资源得到比较好的隔离。但租赁者如何共享网络目前缺乏有力的控制,从而无法提供网络带宽隔离。例如利用VLAN可实现可达性或者流量隔离,但其目前不提供网络带宽配额,无法提供网络带宽隔离。缺乏有效的网络带宽隔离机制,当前面向云计算的数据中心网络至少存在以下风险。一是以流为单位的带宽分配方式,容易诱发自私和攻击行为,如通过并行发起多个流,占用更多网络带宽,发起流量攻击等。二是许多新的并行计算模式,如搜索和MapReduce等,引入同步性极强的多对一通信模式,对于低延时和小缓冲的数据中心网络容易导致TCP拥塞崩溃。三是许多既有应用基于非响应式协议实现,允许这类应用迁移到数据中心,势必对其他应用带来性能干扰;而禁止其迁移将损失潜在的商业利润,或对应用进行重写。针对上述问题,本文研究如何实现云计算数据中心网络租赁者之间网络层次的带宽隔离问题,主要创新和成果主要有以下三个方面:首先,从数据中心网络防范拓扑探测的角度,探索了云计算数据中心租赁用户利用端对端方法,探测数据中心网络逻辑路由拓扑结构的可能性,并提出一种基于UDP流粗粒度丢包特性的递进式探测算法。租赁用户仅利用正常流量,能否探测出其虚拟机之间的网络路由拓扑结构,目前尚不可知。传统的端对端路由拓扑探测技术,基于报文级的细粒度丢包或延时特性进行统计聚类,进而推测出逻辑路由拓扑的最大似然估计结果。但是直接应用这些技术将面临两个问题:一是假设探测报文在路由过程中总是可以获得细粒度的丢包和延时特性,这种假设在高带宽、低延时网络并不总是合理;二是基于报文级的统计分析方法,在网络带宽很高时将引入巨大的存储和计算开销,可扩展性较差。通过进一步研究和大量实验,本文提出,将路由拓扑分解成以接收虚拟机为根的探测树,依据特定的策略制造拥塞,并利用流级粗粒度丢包多维特性进行递进式探测,可以获得非常准确的逻辑路由拓扑结构,且单次探测可以在若干毫秒内完成。租赁用户可利用路由拓扑结构,为其自私和攻击行为服务。这就要求网络带宽隔离机制应尽可能将网络负载控制在较低的水平,且实现细粒度的拥塞控制。其次,从数据中心网络防范流量攻击的角度,探索了数据中心网络面临低速率拒绝服务攻击的可能性和必要条件,包括非响应式数据流和响应式数据流,特别是利用数据中心网络路由拓扑结构进行灵巧攻击的条件,并提出了理论分析模型。对于当前数据中心网络面临流量攻击的问题,尽管已有一些定性的讨论,但是对于实施该类攻击所需条件及其后果,缺乏定量的分析。通过构建理论分析模型和进行大量实验,本文指出,数据中心网络的低延时和小缓冲特性,使得租赁用户一是可以聚合多个同步流进行低速率拒绝服务攻击,二是可以利用网络的路由拓扑结构,将攻击目标选定在网络边缘或者网络内部。分析模型和实验结果表明,攻击流持续攻击时长通常只需若干毫秒就可能将目标TCP流的吞吐降至非常低。因此,需要研究数据中心网络的带宽隔离,在网络可用带宽不够时,尽可能抑制并发流;在实施拥塞控制时,统筹考虑拥塞可能发生的位置。最后,针对当前网络带宽隔离技术的不足,同时考虑防范拓扑探测与防范流量攻击问题,本文提出一种数据中心网络的带宽隔离机制,也就是统一的逻辑通道,对响应式和非响应式数据流进行统一的带宽分配,并提出一种基于RTT的接收端拥塞控制机制。现有基于资源预留的带宽分配方式,能实现较好的带宽隔离,但其实现复杂且资源利用率低;而现有动态带宽分配方式,能充分利用资源,但仅关注网络边缘链路的带宽公平性,同时缺乏对并发流的抑制和细粒度的拥塞控制机制。本文提出,利用统一的逻辑通道强制细粒度按需动态带宽分配机制,保障流之间的公平带宽分配;并提出接收端增强的细粒度拥塞控制算法,兼顾了网络边缘和网络内部链路出现拥塞的情况,依据网络当前拥塞程度决定进入网络的并发流数目,在避免网络拥塞的前提下尽可能保证带宽分配的公平性。实验结果表明,该机制能够有效防止用户端有意或无意占用其他用户网络带宽,抵御来自用户端的低速率拒绝服务攻击,保障数据中心网络带宽隔离。