一种支持海量数据备份的可扩展分布式重复数据删除系统

来源 :中国计算机学会第一届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:biuesnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代信息化社会中,数据的爆炸式增长使得存储和管理数据的成本越来越高,数据备份和恢复的时间越来越长,数据中心的能耗越来越严重.重复数据删除技术在缓解数据的高速增长和节约成本方面有很好的应用前景.然而面对日益增长的海量数据,重复数据删除技术需要在数据路由和指纹查询方面提供高可扩展的支持.对于数据路由,提出了基于分布式布隆过滤器的有状态数据路由技术:拆分Bloom Filter并将其分布于多节点并发管理,可以在提高数据路由的扩展性同时降低其通信开销.对于去重节点内的指纹查询,提出了基于取样机制的指纹查询优化方法:通过可扩展Hash结构组织海量取样指纹信息,并根据取样指纹的时间局部性原理对指纹缓存进行管理.为了对研究工作进行评价,设计并实现了分布式重复数据删除系统3D-deduper,并进行了数据路由和去重性能相关的测试.实验结果表明,基于分布式布隆过滤器的数据路由技术能够使得分布式重复数据删除系统维持与单节点重复数据删除系统相当的去重率,波动低于5%.在取样查询方面,数据去重率在取样率为1/32时仍能达到非取样重复数据删除系统数据去重率的95%以上.在去重性能方面,单节点去重带宽最高可达到200MBps.在节点扩展时,去重带宽仍能保持近似线性的扩展性.
其他文献
脑卒中偏瘫的患者肢体功能会受到影响,导致认知度低,生活质量下降.针对其具体情况,在临床上关键是尽早地对患者进行功能指导,促进肢体功能的恢复.对脑卒中偏瘫而言,早期的康
目的:分析微创手术用于脊柱创伤治疗中的疗效.方法:选择2019年6月至2020年8月我院收治的脊柱创伤98例患者进行这一次的研究,随机分为两组,即参比组(49例)与观察组(49例),参比
3月18日,一个叫秦海璐的女孩引起了香港媒体的关注。当这个来自大连的女孩和刘德体华一起接过第6届香港电影金紫荆奖最佳男女主角的奖杯时,所有的幸运的兴奋都写在了她的灿烂
目的:评价糖尿病肾病患者护理中人性化护理的实施效果.方法:选择2019年4月至2020年4月我院接收的78例糖尿病肾病患者纳入研究,随机分成一般组和观察组,每组39例患者,一般组采
克山病是一种以心肌损害为主的地方病,病因迄今未明。近几年来,在毛主席光辉《六·二六》指示指引下,广大卫生和地学工作者,深入病区开展多种学科大 Keshan disease is a endemi
相较我国陆上酒驾的严厉治理,水上酒驾治理显得疲软乏力,而水上酒驾却是水上交通安全不可忽视的重大隐患之一,有必要重拳治理.本文从陆上酒驾与水上酒驾立法现状比较切入,分
在聚氯乙烯(PVC)的生产工艺过程中,工人可能接触到不同量的PVC粉尘,有关PVC及氯乙烯单体的毒性资料已有报导,但有关吸入或吞入PVC的影响和该粉尘的生物学或生化活性知识直到
长期以来,非法中介行为干扰海事执法情况非常严重,本文解释和定义了非法中介行为的涵义,对非法船舶中介行为的违法性和通常表现形式进行了分析,提出了彻底消除非法船舶中介的
银杏早实丰产捷径“孙子砧”接上“祖母芽”银杏结实晚,主要是其营养生长期太长,因此,常采用嫁接法缩短植株的形态生长,尽快提前生理发育期,以实现银杏的早实丰产。“孙子砧”接上
【摘 要】在企业中,政工工作和人力资源管理工作虽然是两个不同部门,职能也相对独立,但是它们之间密切联系,相互补充各自的不足之处,所以,如何把企业中的政工工作与人力资源管理工作结合起来发挥作用,是企业发展必须要面对的情况。本文对于企业政工和人力资源管理工作之间的关系进行了简要分析,并对其提出了相应建议,实现企业的有效管理。  【关键词】人力资源管理;政工;管理制度  现代企业管理中,人力资源管理是非