Improving Metadata Caching E?ciency for Data Deduplication via In-RAM Metadata Utilization

来源 :计算机科学技术学报(英文版) | 被引量 : 0次 | 上传用户:imanhuaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
We describe a data deduplication system for backup storage of PC disk images, named in-RAM metadata utilizing deduplication (IR-MUD). In-RAM hash granularity adaptation and miniLZO based data compression are firstly proposed to reduce the in-RAM metadata size and thereby reduce the space overheads required by the in-RAM metadata caches. Secondly, an in-RAM metadata write cache, as opposed to the traditional metadata read cache, is proposed for further reducing metadata-related disk I/O operations and improving deduplication throughput. During deduplication, the metadata write cache is managed following the LRU caching policy. For each manifest that is hit in the metadata write cache, an expensive manifest reloading operation from the disk is avoided. After deduplication, all the manifests in the metadata write cache are cleared and stored on the disk. Our experimental results using 1.5 TB real-world disk image dataset show that 1) IR-MUD achieved about 95%size reduction for the deduplication metadata, with a small time overhead introduced, 2) when the metadata write cache was not utilized, with the same RAM space size for the metadata read cache, IR-MUD achieved a 400% higher RAM hit ratio and a 50% higher deduplication throughput, as compared with the classic Sparse Indexing deduplication system where no metadata utilization approaches are utilized, and 3) when the metadata write cache was utilized and enough RAM space was available, IR-MUD achieved a 500% higher RAM hit ratio compared with Sparse Indexing and a 70% higher deduplication throughput compared with IR-MUD with only a single metadata read cache. The in-RAM metadata hessing and metadata write caching approaches of IR-MUD can be applied in most parallel deduplication systems for improving metadata caching e?ciency.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
体层tomography摄影又名断层摄影、分层摄影 ,它能使选定层面的组织影像清晰可见 ,而层面上下组织结构模糊不清 ,解决了各组织相互重叠的影响。体层摄影的质量保证 (QA) ,内容广泛 ,涉及
期刊
目的:观察多西他赛对人胃癌裸鼠移植瘤的放射增敏作用和多西他赛联合放射对肿瘤细胞凋亡的影响。方法:建立人AGS胃癌裸鼠移植瘤动物模型28只,随机分为4组:对照组、单纯照射组
本研究旨在观察和对比腹腔镜筋膜内子宫切除术与经腹子宫切除术的临床疗效,以探讨腹腔镜在子宫切除术中的应用价值。1资料与方法1.1临床资料:选择我院于2007年9月至2009年1月
近日,在柳州市2019年市政服务政务公开和公共资源交易工作会议上,柳州市行政审批局(以下简称“审批局”)表示继續“提速、增效、降本、惠民和创新”,大力开展“政务服务高质量发展年”,打造“政合你意”2.0版,铸造独具特色的放管服改革“柳州样板”。  据介绍,在过去的2018年里,柳州市政务服务中心窗口(含分中心)政务服务办件总数为18 2.56万件,无超时办件;累计进入柳州市、鹿寨县公共资源交易平台
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
头位分娩监测产程中活跃期延长、停滞时有发生,不及时发现、正确处理,会导致新生儿窒息、死产、产后出血等严重后果。现将我院近2年来活跃期停滞病例分析报告如下。1资料与方
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
患者 ,男 ,35岁。因头痛 2d ,加重昏迷 9h入院。病前曾接触过病羊。体检 :T 39.4℃。深昏迷。瞳孔等大等圆。光反射存在。皮肤有散在出血斑。左腋下淋巴结肿大。实验室结果 :血WBC
我科自2003年9月至2008年12月,分别采用微创胸腔置管引流结合注射白细胞介素(IL)-2、顺铂及胸腔置管引流单一注射顺铂治疗,发现前者疗效优于后者,现报告如下.