分布式存储中纠删码流水线修复技术的研究

来源 :四川师范大学 | 被引量 : 0次 | 上传用户:wenjun_wu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着区块链、机器学习、人工智能等前沿科技的发展,每天都会产生海量的数据,如何存储及处理这些数据成为大数据研究领域的热点。分布式存储可以实现大规模的存储需求,但系统中的节点时常出现故障而导致存储数据丢失。为了保证数据的安全性和可靠性,选用纠删码作为数据容错机制,在节点发生故障之后对失效数据进行有效地修复。不过,纠删码修复过程中必须从其他可用于解码计算的节点上下载数据,占用的网络带宽较多、修复时间较长,致使数据读取性能下降。如果修复速度较慢,甚至不如节点发生故障的速度,系统的可靠性将无法维持。流水线是目前效率最高的数据传输网络结构,流水线修复方法(Repair Pipelining,RP)可显著缩短修复时间,提高修复效率,但仍然存在一些缺陷(例如,负载不均衡)。基于此,本课题重点研究分布式存储中纠删码流水线修复技术的若干相关问题。首先,提出基于负载均衡的流水线修复方法(Repair Pipelining based on Node Load Balancing,NLB-RP),处理RP修复过程中节点负载不平衡的问题。RP中改善了节点负载不均衡的情况,但仍有改进空间。NLB-RP中通过添加不同构造的数据传输路径来平衡节点负载,并选取更多节点加入修复,进一步减少节点负载。综合理论分析及实验数据,可以证明NLB-RP从局部上平衡、从整体上减轻了节点负载,并且没有引入新的修复代价。与RP相比,NLB-RP的节点负载方差计算结果为0,这说明各个节点具有相同的负载。因此,NLB-RP是一种具有最优负载均衡性的修复方法。其次,设计部分并行的流水线修复方法(Partially Parallel Repair Pipelining for Multiple Failures,PPRP)以提高多节点修复效率。构建基于流水线路径的多节点修复模型,将修复操作划分为多个并行的部分以此提高流水线的并行度,降低了总的修复时间。与此同时,部分节点传输计算中间数据以此避免冗余传输本地数据,降低了总的修复带宽。最后,基于Piggybacking码设计去冗余流水线修复方法(Repair Pipelining for Reducing Redundancy based on Piggbacking,Pig-RP)以扩展流水线修复方法并应用于其他编码策略。Piggybacking码具有低修复带宽和低磁盘I/O开销,但缺乏快速修复方法。因此,利用流水线网络结构加速其修复过程。先基于单节点修复设计Pig-RP,再扩展到多节点修复场景中。修复单节点时,Pig-RP主要通过降低拥塞度来降低修复时间。修复多个节点时,Pig-RP不仅降低拥塞度,还大幅度降低修复带宽和磁盘I/O开销,从而减少总的修复时间。
其他文献
CAN(Controller Area Network)总线局域网是一种基于广播形式的的网络,由于其高实时性和可靠性,以及其短帧的结构等特点,使其广泛的应用于智能网联汽车行业。但是在该行业中对于安全性能和服务质量(本文表示为实时性)等有严格的条件限制。在CAN总线上,数据以明文形式进行广播传输给连接到总线的所有的电子控制单元,即EDU(Electronic Control Unit),因此其在安全
化学防护服是防御有毒、有害化学品直接损害人体皮肤或经皮肤吸收伤害人体的防护服。气密型化学防护服属于化学防护服的一种,由于其体积庞大,且与外界无气体交换的特点,散热
内向型汉英学习型词典(以下简称汉英词典)主要服务于中国英语学习者的语言编码需要,如汉英翻译和英语写作。汉英词典中的例证不仅能提供对等词的使用信息,而且能区分同义的对等词,是高阶学习者进行语言输出时常用的参考信息。然而,现有词典所提供的例证数量有限,语境信息匮乏,大部分的词目词只提供了两三个最常用的语境。此外,由于现有的汉英词典没有提供对等词的辨析或用法信息,词典使用者往往难以进行选择。一般情况下,
横向磁通感应加热(transverse flux induction heating,简称TFIH)与纵向磁通感应加热相比,加热频率低,无功功率也有所减小,更加节省能耗,同时由于线圈不围绕工件,利于工件的
石墨相氮化碳(g-C3N4)作为一种新型半导体材料,具有较好的可见光吸收能力,且物理化学性质稳定,合成步骤简单、制造成本低廉、光催化活性较好。因此,利用g-C3N4可见光催化降解有
电磁波的广泛应用变革了人类的生产、生活方式,但与此同时也带来了很多负面影响,发展性能优良的吸波材料迫在眉睫。近年来,碳材料被广泛用于电磁波吸收领域,然而,单纯的碳材
近年来,由于易修饰的分子结构、良好的热力学以及光学特性,稠环电子受体(FREAs)引起了研究者们的广泛关注。FREAs作为非富勒烯有机太阳能电池(NF-OSC)新兴的一个分支,取得了
表面增强拉曼(SERS)效应从发现至今已有几十年的历史,其在痕量化学物质快速检测方面和物质分析方面已经显示出了越来越巨大的潜力,广泛应用于化学、材料、生物医药等方面。近年
法人作品是我国著作权权利归属体系中特殊的制度设计,是著作权研究中不可忽视的重要方面。自我国在1990年《著作权法》第11条第3款规定法人作品以来,关于法人作品的争议非常
随着数据的爆炸式增长,迫切需要一种同时满足大存储容量和低存储代价的存储系统。近年来,基于区块链技术的去中心化存储系统在提供目前所需的同时,又保证了数据高可用性和安