大规模分散式存储系统的关键技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wwxxzz123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用集群廉价的设备构建昂贵的企业级高端计算机系统一直以来都是分布式系统领域中的重要研究课题。在存储系统领域中也正发生着类似的转变。由磁盘阵列控制器、光纤通道和磁带库所构成的大规模存储系统都是非常复杂的,并且相当昂贵。随着磁盘容量的不断增大和价格的不断下降以及网络带宽的不断提高,通过廉价的设备和高速互连网络搭建大规模分散式的存储系统就成为网络存储系统的一个重要研究课题。容错性、自管理性、数据一致性、以及数据访问的低延时性是需要解决的几个关键问题。本文提出了一种分散式存储系统的结构,研究了以上极富挑战性的问题,并且实现了一个分散式可靠共享文件存储系统的实验原型。  研究的内容具体包括以下几个方面:  提出了一种分散式存储系统结构。各个存储节点通过高速局域网相互连接,存储、缓存、以及数据和元数据的管理功能分布在各个存储节点中,每个存储节点的本地存储资源构成一个全局的虚拟存储空间,各个存储节点相互协作实现一个统一的文件名字空间,向客户端提供文件接口。  在数据爆炸的信息时代,数据的价值越来越高。存储系统的首要任务就是提供数据保护功能,即使在设备发生故障以及发生一些意外事故时,仍然能够提供良好的数据可用性。数据冗余机制是最简单有效的提高数据可用性的技术。本文对分散式存储系统的数据可用性进行了探讨,对影响数据可用性的关键因素进行了定量分析,并且描述了维护动态存储系统的可用性所需的网络带宽开销,导出了计算公式。  随着计算机性能的不断提高和系统硬件成本的不断下降,系统管理在系统的总体拥有成本和用户的满意程度上已经日益成为决定性的因素。本文描述了一种针对分散式存储系统的自管理的数据存储机制,它通过分布式数据结构实现了数据的自管理,提供了良好的动态可扩展性、高可用性以及数据一致性控制。  由于复制机制不可避免地要依靠网络通信环境,所以在系统的整体性能、可用性和数据副本的一致性这三者之间进行综合考虑是非常有必要的。本文分析了系统的总消息速率、系统的总更新延时、以及发生故障时能够接收最多的更新请求的个数这三种不同优化目标下的最优配置和最优值。实现数据复制的一个主要问题是保持各个副本的一致性,本文深入探讨了复制数据一致性的真正含义,并且提出了一种适用于分散式存储系统的具有灵活的数据放置策略和表决分配策略的数据/元数据一致性管理机制,保证了安全的数据/元数据的交叉存取,使系统的自优化成为可能。  存储虚拟化提供从物理设备到基于策略的存储管理软件的一个抽象,极大地简化了存储管理。然而,目前的存储虚拟化仅仅只是停留在存储容量的虚拟化上,并没有考虑数据访问的性能。本文描述了一个针对高速网络构成的分散式存储系统的I/O请求分布协议,它能够动态选择最快响应用户读请求数据所在的存储节点;同时实现了一种全局协作缓存机制,它在存储系统中不同的存储节点中共享全局的聚合cache资源,构成一个由不同存储节点相互协作的缓存到磁盘(cache-to-disk)的访问策略。  在以上研究的基础之上,最后实现了一种分散式可靠共享文件存储系统的实验原型。它利用局域网中PC机的空闲磁盘空间构成了一个全局的可扩展的存储空间,实现了高度可靠的,分散式管理的共享文件系统。相对于传统的分布式文件系统而言,DRSFSS文件存储系统由于元数据的分散,一方面提供了高得多的可用性,另一方面消除了传统单一元数据节点的瓶颈,可以提高性能。实验结果证明分散式存储系统在结构上有很大的潜力。
其他文献
民自动化是一个新的技术领域,该论文主要介绍了配电自动化(DMSA)的重要组成部分-变电站综合自动化(ISA)的设计与实现.其主要设计原测为:结合网络技术及Internet/Intranet标准
汉语自动分词是目前中文信息处理中的重要环节,它是中文自然语言理解、机器翻译中基本的步骤.汉语自动分词的难点在于歧义字段的切分.该文从考查现有的几种主要的分词方法入
混合记录是实现超高密度存储的重要途径之一,是当前国际超高密度存储研究的热点。该技术利用高矫顽力的磁记录材料进行热辅助写入,在常温下读出和保存,可克服超顺磁极限实现超高
序列模式挖掘由于其能发现同一个记录内数据项间的关联,同时还能揭露不同记录间数据项间的关联,因而具有广泛的应用领域。近年来已成为数据挖掘领域继关联规则挖掘之后的又一个
该文提出一种新的互连网络结构--扭立方体连接网络,并应用图论对该网络的网络参数、拓扑性质、通信算法、图的嵌入和容错性能等进行较全面的研究.第一章首先概述所要研究内容
该文介绍了基于Web技术的商业银行信贷管理信息系统的整体设计方案与实现过程. 文中首先介绍了管理信息系统(MIS)的基本概念、Web技术原理,接着详细讨论了Web技术与MIS集统集
为了提高服务器系统的可靠性、可用性和性能,并改变目前非对称式服务器集九资源利用率低的状况,工作人员提出了一种新的服务器集群实现方案--基于并行容错网的对等服务器集群
该文主要介绍了大直径测量仪的软硬件总体设计,大直径测量仪与用户接口(LED显示、打印输出、语音输出)的实现,重点论述了光电传感器的设计,如何通过传感器中的距离微调机构、
软件构件化是软件重用技术的重要内容,在分布式计算环境的支持下,基于构件的分布式实时应用系统构造技术是目前软件重用方向的研究热点与难点。分布式实时应用系统的开发既要求
该论文结合济南将军集团的一个信息管理系统--考勤检测系统的实现,讨论了一种在Intranet网络上实现工业控制检测和信息管理的解决方案.在该方案中,首先讨论了在该集团具有ATM