论文部分内容阅读
虚拟集群技术的采用在提升硬件资源利用率的同时,也对存储系统的性能提出了很高的要求。一方面,作为虚拟机主要存储形式的稀疏镜像文件的引入,加重了存储系统的碎片化程度;另一方面,多台虚拟机同时运行在一台物理机上,不同存取模式对存储系统的竞争访问使得I/O性能进一步下降。此外,虚拟集群的部署和迁移过程中涉及到大量镜像文件的存储和分发操作,高效存储并在需要时快速传输这些镜像并非易事。论文在对多虚拟机环境I/O工作流的特性分析研究的基础上,针对这些问题进行了研究,其主要工作和贡献包括:设计了一种面向虚拟机镜像的混合存储架构,并根据多虚拟机工作流的特性提出了热区跟踪替换算法。混合存储架构由固态硬盘(SSD)和普通硬盘(HDD)构成,能够利用SSD突出的随机存取性能,克服多虚拟机环境工作流随机性增加导致的I/O系统性能下降问题。热区跟踪(HZT)替换算法采用高效的数据结构维护全局数据块的存取热度,确保热区数据驻留在SSD中。实验表明,在多虚拟机环境下,采用HZT算法的混合存储系统的命中率相对传统算法可提高12%,采用适当的预取策略可使命中率提高23%,同时累积响应时间下降34%。提出了虚拟机镜像按需分发框架。根据虚拟机启动和运行过程中通常只对有限数据块访问,采用按需的分发机制减少了集群部署和关闭过程的数据传输,避免了大量镜像存取请求带来的存储节点和网络瓶颈问题。设计了差异化的数据块划分方法,使用能够提升索引管理效率和数据存取性能的大数据块划分对镜像数据进行去冗余处理,而对镜像分发则采用能够提高数据传输效率的较小数据块划分,兼顾了去冗镜像存储系统读写性能和镜像数据分发效率。对于50个镜像的分发实验表明,相比于全镜像分发,按需分发速度可以提升13-22倍。提出了一个用于多数据中心环境的虚拟机快速动态迁移架构和相应的迁移方法,其核心思想是:利用镜像副本减少虚拟机动态迁移过程中的镜像数据传输,使得虚拟机能够灵活地在各数据中心之间通过低带宽的广域网快速迁移;采用前拷贝和后拷贝相结合的跨数据中心快速动态镜像迁移(FlimCD)算法和脏块去冗机制进一步减少数据传输;通过缺块预取和热区排序传输机制减少后拷贝阶段的远程缺块率,降低镜像迁移对虚拟机性能的影响。测试结果显示,优化后的FlimCD算法比前拷贝算法迁移时间下降64.3%,镜像拷贝后期的缺块率下降49%以上。