论文部分内容阅读
虚拟化技术作为云计算中最关键的核心技术,使得商用云数据中心可以向用户提供按需配置的弹性计算资源。然而,在数据中心的部署中,高性能计算往往是评价的最主要标准,缺少对能源消耗和碳排放的关注。随着云数据中心的规模越来越大,其消耗的电能也十分巨大,这不仅带来了较高的运行成本,而且还产生了较高的二氧化碳排放量。导致数据中心耗电量巨大的一个很重要的原因是计算资源的低效利用。大量数据表明,数据中心中大部分服务器设备事实上处于低负载运行状态,即处于满负荷的10%-50%,而这些设备却要消耗满负载运行时能耗的70%。不仅如此,还带来了额外的冷却系统能耗。在倡导绿色节能、降低碳排放从而实现可持续发展的今天,云数据中心应该不仅仅关注用户服务质量,而应该更加重视提高资源利用率对能耗的影响,实现绿色节能高效的可持续发展目标。但是,除非开发并应用先进的节能资源管理解决方案,否则这些数据预计将进一步快速增长。本论文重点围绕以绿色节能为目标的的云数据中心资源管理问题进行研究,在满足用户服务质量的前提下,通过建立能耗模型,对比分析云环境下主机负载数据的新特点,提出一系列的主机负载检测、虚拟机安置等动态虚拟机均衡算法,使用真实云环境下的主机负载数据进行仿真实验,结果表明,本文提出的多个算法组合与基准参考算法相比,都有明显的性能提升。具体而言,本文的主要工作内容和创新点如下:1.针对高能耗问题,对云计算系统的节能技术进行了分类研究。从静态和动态功率管理,硬件和软件层面,操作系统级、虚拟机级和数据中心级等多个类别展开了深入的分析。在研究过程中,重点从系统资源、优化目标、节能技术、负载特性等多个方面进行展开。重点分析了操作系统级、虚拟机以及云数据中心级三方面节能高效的关键技术。相关分类研究对本文进一步开展以绿色节能为目标的动态虚拟机均衡算法研究具有很强的指导意义。2.提出了云计算环境下一整套分布式动态虚拟机均衡的启发式算法。提出利用中值绝对偏差和四分差来改进传统的设定静态阈值,进一步利用局部回归LR和强局部回归LRR的动态自适应算法进行过载主机探测。提出利用最短迁移时间策略、随机选择策略和最大相关性策略等三种迁移选择算法进行虚拟机迁移选择。将云计算环境中的虚拟机安置问题定义为一个一维装箱问题,设计基于功耗的改进降序最佳自适应启发式算法BFD-PA进行虚拟机安置。通过使用真实Planetlab云数据中心工作负载数据进行仿真实验。结果表明,所提出的结合局部回归算法和最短迁移时间策略来实现虚拟机均衡的综合算法显著优于其他动态虚拟机均衡算法,能够大大降低SLA违例情况和并减少虚拟机迁移的数量。3.提出了基于相空间重构(PSR)和数据组合处理进化方法(EA-GMDH)的组合算法,首次将其用于云计算环境下的主机负载预测领域。利用PSR方法,将一维工作负载的时间序列重构成了多维空间中的时间序列,送入EA-GMDH神经网络,通过训练和学习得到最终的预测结果。通过使用真实Google云数据中心工作负载数据进行仿真实验。本文提出的EA-GMDH算法在平均负载预测和精确负载预测两个方面都好于对比的基准算法:Bayes, EMA, LWMA, LMA, AR, ANN和PP等。4.提出了一种全新的实现云环境下主机负载预测的方法,利用Autoencoder自编码网络和Softmax分类器,将回归问题转换成分类问题,再次提升了负载预测的准确度。通过无监督学习方法成功地将历史窗口中的负载数据特征提取出来。基于这些提取的特征,利用分类器,成功地获得了负载数据的预测结果。同样,通过使用Google云数据中心的工作负载数据作为数据源进行仿真。与基准参照算法ANN、Bayes以及EA-GMDH算法相比,提出的新算法可以获得更高的准确度性能,从而更好地为实现云环境下更为精确的动态虚拟机均衡提供服务和支撑,最终达到在满足QoS要求下降低系统整体能耗的目的。