分布式存储系统中MDS码的修复方案

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ch3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式存储系统通常使用副本技术来实现数据的可靠性。副本实现简单,但系统冗余度太高,只能通过增加拷贝数量来提高数据存储的可靠性。近些年,纠删码被用来替代副本技术以减少存储开销[1]。Reed-Solomon(RS)码具有非常高的存储效率,所以被广泛应用于生产环境。在大规模的分布式系统中,存储节点发生故障是很频繁的[2][3]。在故障节点修复过程中网络产生的通信量被称为修复带宽。在Facebook,8%的数据采取了纠删码存储方案,在修复故障节点过程中产生的修复带宽约占网络总流量的20%[4]。Dimakis等人将如何减少故障节点的修复带宽称为修复问题[5]。传统修复方案通常将k个存活节点的数据下载到新节点,然后新节点再修复出故障节点的数据[6]。这个过程会导致很大的带宽开销,甚至导致网络阻塞的发生。在存储节点发生故障频繁的大规模分布式存储系统中,数据维护带来的大通信量,导致节点故障难以容忍。网络编码和干扰对齐是优化修复带宽的理论基础。在网络编码的基础上,Dimakis等人将分布式存储系统抽象为一个有向图,然后通过网络信息流中的最大流最小割理论,给出了纠删码的最小修复带宽下界,并提出了再生码的概念[6]。Shah等人证明了干扰对齐技术在最小存储再生码的编码方案构造中的必要性[7]。相对广义汉明重量理论,源于对第二类窃听信道的研究[8]。第二类窃听信道模型和纠删码的修复模型非常相似。该理论对优化修复带宽具有很好的指导价值,应用在分布式存储系统中,可以研究在对r份数据进行恢复时,最少需要的d_r份编码消息,从而降低数据恢复时的带宽资源,提高系统性能。本文在网络编码的基础上,使用相对广义汉明重量来优化修复带宽,研究内容包括:1)概述了纠删码的标量模型和矢量模型。相比于标量模型,矢量模型可以将编解码过程简化为XOR运算,提高计算性能,同时矢量模型是优化MDS码修复带宽性能的基础。本文基于有限域上元素的性质,分析了如何将标量纠删码转化为矢量纠删码。2)分析了网络编码及干扰对齐优化故障节点修复带宽的工作原理,通过举例说明了局部干扰对齐怎样有效地优化修复带宽性能,但得到的结果却不是最优的,并分析了局部干扰对齐的不足之处。3)通过借鉴相对广义汉明重量的推导过程及思想,利用概率论和互信息量对单节点最小修复带宽进行了推导,给出了单系统节点修复带宽的下界限,并将该结论推广到了故障校验节点的修复问题。
其他文献
车辆检测在辅助驾驶、交通管理、遥感图像等方面都有着重要应用,随着近些年车辆的不断增多,和人们对于车辆检测技术需求的不断提高,车辆检测已经成为目标检测领域的重要研究
神经元信息传递机制的研究,是脑科学领域内的重要研究课题之一,是人类对大脑的认知过程的重要环节,并且对于治疗脑神经疾病也具有极其重要的意义。近年来,关于神经信号传递机制的相关研究引起了相关领域研究学者的广泛关注。神经信号的传递机制研究尤以研究神经元的电信号为主,因此神经电信号的采集成为了重点研究问题之一,针对这一问题,本文提出并研发一套基于微电极阵列(Microelectrode Array,MEA
目前在工业生产线上,工业机器人对固定位置目标物体的抓取及搬运控制较为成熟,但是实际工业生产线上的目标物体的位置和姿态并不总是固定或规则的,当前对于这种位置和姿态不
近年来,随着人工智能技术的发展与成熟,其应用越来越广泛,自动驾驶则近几年国内外研究团队对人工智能技术的一个重点研究方向。车辆检测是自动驾驶需要完成的首要任务,使用多
多进制相位调制是无线通信中的一种主要调制方式,具有抗干扰性强、频谱利用率高、电路实现简单等优点,被广泛应用于卫星通信、民用移动通信中。其子类信号二进制相移键控信号、四进制相移键控信号和八进制相移键控信号的识别一直是调制识别领域中的热点问题。传统调制识别算法方法需要强大的专业知识和工程技巧来设计特征提取器,难以实现信号特征的自动提取。因此,本文将卷积神经网络应用到调制信号识别领域中,对多进制相位调制
工业机器人技术的发展日新月异,随着市场对机器人需求的加大,同时也让我国发展为世界最大的工业机器人应用市场,并为中国制造业的转型发展提供了巨大推动力,极大提升了该行业
“云计算”的概念由谷歌最早于2006年提出后,该技术当前在全球蓬勃发展,由最初简单的“数据共享”到如今的“应用共享”,改变了人们的生活。云计算技术同样应用在了政府的政
涡扇发动机是一种高度精密的热力机械。这种机械系统结构复杂,经常在极端环境下工作,极易发生故障造成不可挽回的损失。为了保障系统安全可靠运行,降低事故发生概率,预测它的
藏文现代印刷物是藏文化资源的重要组成部分,藏文现代印刷物的版面中文本行包含了许多重要的信息,有效的检测出藏文版面中的文本行区域是实现藏文化资源数字化保护的重要一步
近年来,随着虚拟技术的发展,人们对数字化、可视化提出了更高的要求,三维花朵模型在场景设计与计算机游戏等方面都有着非常重要的应用。花朵因为其复杂多变的结构面临更多的