数据中心存储系统工作负载分析及缓存机制研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wc836952
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据中心运行着多种类型的应用,例如社交网络、大数据分析、企业应用。这些应用对存储系统的要求(持久性、一致性和性能等)各有不同。随着存储技术的发展,存储层次结构的深度不断增加,且更加多样化。为了应对日益增长的存储需求,数据中心普遍采用多级存储架构,目的是平衡系统整体性能、可用性以及成本等因素。由于各级存储层之间存在功能和性能的差异,各层之间能否良好协作,能否适应多样化的存储需求,会直接影响到应用的性能。  为了提高数据存取性能,针对多级存储的研究及产品不断涌现。例如,Web应用和服务普遍积极地将后端存储中的数据进行缓存,目的是降低数据访问延迟和降低后端存储的负载。常见的缓存机制包括Key-Value缓存,本地对象缓存和前端HTTP缓存等。缓存的性能是由工作负载和缓存替换策略共同决定的。但多数Web应用和服务所采用的缓存替换策略不够灵活(例如LRU策略、FIFO策略),无法适应多样化的存取负载。  随着数据量的爆炸性增长,如何实现高性能低成本数据备份成为数据中心存储系统的重要任务之一。数据去重技术已被广泛应用于数据中心备份系统,其基本工作流程可以被大致分为切块、指纹计算、指纹索引和进一步压缩四个步骤。由于指纹索引是公认的性能瓶颈,系统通常会在内存中维护一个指纹缓存并利用指纹预取来加速重复数据鉴别。但当前系统所采用的指纹缓存替换策略没有区分按需请求和预取请求,无法使指纹缓存发挥最大效能。  针对上述研究现状,本文面向数据中心存储系统,分别针对存取负载和备份负载进行分析并设计了相应的缓存机制,致力于进一步提高数据存取性能和数据备份性能,最终实现数据中心存储系统整体性能提升。  首先,本文从时间、空间和时空三个维度对存取负载进行分析。分析结果发现存取负载具有局部性,但普遍存在扫描现象(扫描是指仅出现一次的访问序列,通常来自搜索、更新和一些周期性操作)。已有研究中针对存取负载的缓存机制普遍存在无法适应扫描或开销过大的问题。本文提出一种紧凑型抗扫描缓存替换框架MemSC。MemSC为每个对象赋予一个多粒度优先级标识,每个优先级标识通常仅需要2比特,显著降低了元数据空间开销,通过动态调整标识的优先级即可支持抗扫描缓存替换策略。  然后,本文针对备份负载进行分析。分析结果发现指纹预取机制能够提升指纹缓存的性能,但大多数预取指纹在被逐出指纹缓存前没有被使用过或仅被使用过一次,这些不准确的预取指纹会污染缓存。本文提出一种预取感知指纹缓存管理机制PreCache。PreCache的基本设计理念是为预取请求和按需请求做出不同的缓存替换决策。PreCache可以适配到多种已有的缓存替换策略中,包括LRU策略以及更智能的策略。PreCache和指纹预取机制的相互作用能够进一步提升数据备份性能。
其他文献
Verilog是工业界广泛使用的一种硬件描述语言,可用于不同抽象层次的数字系统建模.为了确保开发的正确性,对Verilog语言的准确理解是十分必要的.而目前它的形式化语义研究还不
对等网技术是 Internet上的一种分布式网络控制技术,它将逐渐取代传统的C/S模式,使Internet的应用从中心服务器模式向网络节点边缘化方向发展。  当前P2P应用系统的特点在
本文以高校艺术类考生面试为例,介绍了面试的流程和其中存在的问题,提出了建立网络评分管理系统的必要性和系统建设的目标、系统的主要功能及系统采用的关键技术。 针对本系
随着软件产业的不断发展,软件应用的日益广泛,软件开发面临着越来越多的挑战,软件危机也随而生。软件复用在这种背景下发展起来,它是解决软件危机的有效途径。作为软件复用核心技
由于在满足企业级系统安全需求方面显示了极大的优势,基于角色的访问控制(RBAC)近年来成为访问控制领域的研究热点。研究人员已经提出若干基于角色的访问控制模型,其中包括著名
本文主要讨论了数据挖掘的一些基本概念、模式、算法及其在税务系统中的应用,并围绕数据挖掘讨论了解决目前在税务系统中存在的问题的一个解决方案。 首先,本文说明了什么是
多元变参数振动钻削是一种为适应新型材料的出现而进行的优化切削过程,在切削过程中为提高孔加工质量而提出的最优化加工方法。该方法在钻削过程的不同区段,要求采用该区段的最
本文所研究的数字签名就是一种常用的信息安全技术,而其中的多重数字签名正受到人们越来越多的关注.可是,已有的椭圆曲线多重数字签名方案只适合进行广播多重签名,不适合进行
本文针对支持向量机目前存在的若干关键问题展开深入的研究,涉及支持向量机的训练、分类、模型选择和多分类器构造等方面,并将研究成果应用于人脸识别问题中。取得的创新性成果
本论文的目的是利用GIS技术和相关的无线电波传播预测模型来研究无线电波的传播现象。预测的结果以直观的方式输出,这将有助于专业人员建立和优化移动通信系统。  本论文对