数据中心服务系统自恢复技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:linyibaby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前人们生活对网络服务系统的依赖性日益增强。在这种强大的需求牵引下,催生大量新兴服务及服务模式,同时促使服务系统的后端数据中心基础平台经历并正在经历着一个从传统的物理机群平台向虚拟机平台进而向更开放灵活的云计算平台的演进[7]。   这个演进过程中,服务系统的规模、复杂性及负载压力都在不断膨胀[7]。这就对系统可靠性可用性提出严峻挑战[2,6,7]。同时用户对服务质量提出苛刻要求[1,2]。这种情况下,单纯的人工维护,成本高且很难保证对大规模复杂系统故障作及时处理和恢复[6]。这使得对服务系统故障的自动恢复方法的研究成为一个极具价值的研究领域。   当前不断演进的基础服务平台及新兴的服务需求服务模式,对系统自动恢复中涉及的状态检测、故障定位诊断、恢复操作序列生成及恢复执行,提出诸多新挑战,同时理论研究和技术进展又为自恢复技术的创新提供契机。为此本文针对近期主流的三类服务系统平台的自动恢复技术作了以下几方面的创新研究工作,主要研究成果和创新点如下:   1,面向多层服务的选择再生框架;当前主流的服务系统数据中心大多采用多层服务模型[8]。对服务运营商来说,多层服务系统服务质量及可用性保证是一个关键问题[6]。然而,当前主流的基于系统参数检测的处理方法,无法有效实现对系统端到端服务性能保证[71]。为此本文提出把请求跟踪技术引入到入到服务再生和服务质量保证领域,通过对请求端到端的处理路径上的各部分性能特征的分析及时确定和恢复异常部件,保证端到端服务质量。实验结果表明本方法可以有效保证系统的端到端的服务质量。   2,请求路径驱动的故障诊断定位方法;当前数据中心采用系统范围的参数统计分析方法检测定位和诊断系统故障[12,13]。然而传统的基于系统参数的统计模型的故障诊断方法存在较多的误报[16,91]。为此本文提出一个层次化的状态模型方法。该方法使用请求跟踪信息指导全系统参数统计状态模型的构建。实验结果表明本方法可以有效降低故障诊断的误报率(<8%)。本方法用于选择性再生框架,实现对复杂部署场景的处理。   3,层次化动态恢复序列的生成方法;针对当前生产系统上普遍存在的故障定位诊断能力受限[72,73]的情况,本文提出一个基于试探的层次化动态恢复序列的生成方法。与基于POMDP的恢复方法[72]相比,本方法可以有效利用系统层次化结构的特点,扩展试探性恢复的适用范围及恢复效果。同时本文提出的基于恢复覆盖的操作迭代生成算法,可以有效处理[72]方法未能处理的并发故障问题。实验结果表明本方法可以对故障定位受限的大规模层次化系统,故障并发情况下,有效保证系统的可用性(>96.5%)。   4,面向虚拟机群自恢复研究的模拟平台;虚拟机技术为服务系统平台引入诸多良好特性。然而对于系统可靠性方面。虚拟机平台的引入意味着什么。尤其是在Amazon EC2和S3系统出现故障[2]之后,越来越多的运营商在考虑是否要引入虚拟机平台时,往往犹豫于虚拟机系统的可靠性问题[101,102]。为了深入研究虚拟机平台下故障可能带来的损失及各种故障恢复方法的效果,本文提出并设计实现了一个面向虚拟机群故障自动恢复研究的模拟平台。本模拟平台具有对于虚拟机各部件及动态流式负载的配置能力,具有对于虚拟机检查点、迁移等失效恢复机制及多种恢复策略的模拟。同时,我们设计实现了失效模型框架,可以把模拟场景放在一个广域的失效空间里,研究虚拟机群在各类失效情况下的性能特性及各类恢复机制和策略的效果。本平台可以为基础运营商在考虑对是否引入虚拟机平台,提供一个针对特定配置场景的可靠性估计评价手段。   5,云计算环境异构负载的资源提及恢复方法;云计算环境下,资源提供者与服务提供者相互分离[7]。服务提供者以pay-as-you-go模式[21]申请使用资源。当负载资源发生故障时,传统方法或者对负载服务作再生恢复[10]、或者随机的使用空闲资源顶替故障资源[8]。而对于云计算环境,资源提供者往往配置有大量的空闲待用的资源.如何充分利用空闲资源提高负载资源可靠性及如何扶负载可靠性的角度提高恢复效率,是一个尚未被很好关注和解决的问题,为此本文提出基于云计算环境下异构负载的资源失效规律的特性的全局资源提供及替代恢复方法。本方法综合考虑异构服务的失效在时间和空间上的特性。模拟平台的验证结果表明,与传统资源失效恢复方法相比,本方法可以有效保证负载资源的可靠性,同时对于系统服务质量和资源利用率不引入负面影响;通过对系统失效的时间特性和空间特性的分析和评价表明,本方法适用于大规模开放的云计算场景。同时本方法不涉及对云计算平台的修改或侵入式检测。
其他文献
互联网诞生于美国少数几所学校和科研机构中,随着技术的发展,互联网慢慢地融入到人们的日常生活中。从互联网诞生初期到今天,互联网以惊人的速度在用户身边蔓延开来,因此导致了各
现代企业资源具有分布式、异构性、跨领域协同工作等特点。在企业信息化建设过程中,由于业务的复杂性和计算机技术飞速发展,许多信息系统的开发缺乏整体规划和系统性,不同时期构建的业务系统可能基于不同的操作系统平台和数据库技术。因而各个系统之间很难有效地实现信息共享和交互,形成了“信息孤岛”现象。随着电力市场的发展和协同业务开展的增多,“信息孤岛”式的系统已经不能满足企业发展的需要,迫切需要研制出一套真正的
随着Internet的快速发展,越来越多的软件运行在开放、动态、多变的网络环境下,软件的形态也在不断演化,这使得针对运行时软件的信任管理变得更加困难。开放网络环境下的软件通常
由于各种通信网络的迅速发展,多媒体技术已经广泛融入人们的日常生活中。其中,视频压缩技术是目前应用最为广泛的多媒体技术之一。最新的H.264/AVC视频压缩标准中采用了许多
在深入分析了Windows家庭服务器操作系统之后,编程实现了一整套专门针对家庭服务器的远程控制下载软件,为充分发挥家庭服务器的内容存储和分享提供了坚实的基础。本远程控制下
无线胶囊内窥镜的问世是消化道无损诊断的革命性创新,随着临床应用的展开,产品的局限性逐步体现出来。其中,运动和姿态控制是迫切需要解决的问题,要实现运动和姿态控制,必须先知道
随着信息化的发展,信息系统的安全越来越重要,保护数据资料防止泄密更是信息安全的重点。数据防泄漏技术是防止信息泄密的重要手段之一,其目的是采取技术和管理手段防止信息数据
节点位置信息是无线传感器网络应用必不可少的元素,是事件位置报告、目标追踪、地理理由、网络管理等功能的前提条件。为了提供有效的位置信息,无线传感器网络节点必须在随机
疾病智能分析系统是典型的临床决策支持系统,是人工智能研究领域非常活跃的分支。疾病预测模型是疾病智能分析系统的核心部分,采用机器学方法依据医学数据集构建疾病预测模型,在
本文主要研究了采用基于安全套接字层(SSL)协议的VPN技术构建云南中医学院校园远程访问系统的方法和过程。SSL VPN是虚拟专用网技术领域中的一种较新的技术,在当前有着相当广