基于集中式存储的机群网络文件系统关键技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:aptxkid2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机群系统已经成为高性能计算机的主流,其中又以中小规模机群应用得最广泛。机群文件系统为机群应用提供数据存储、数据共享、数据访问等服务。高效、易管理、低成本、高可靠性是用户对机群文件系统提出的基本要求。当前NFS以其易使用、易管理、低成本等优势被用户广泛使用,尤其在中小规模的机群中。然而随着I/O密集型应用对性能需求的不断提高,NFS常常成为机群环境高性能计算应用的性能瓶颈。   随着多核CPU、大内存、高性能I/O通道等硬件技术的发展,集中式大存储节点成为中小规模机群文件服务器的主要形式。这种集中式高性能存储节点给机群网络文件系统在数据存储布局、并发I/O请求处理、元数据处理等方面带来了新的挑战。因此研究优于传统NFS的机群网络文件系统具有重要的学术意义和实用价值。   本文的主要创新性工作如下:   (1)提出了一种基于二叉决策图的数据放置方法。机群文件服务器接收到的I/O负载具有各种不同的特征,不同的存储系统(如物理文件系统、存储介质)也有各自的特点。本文通过对I/O负载类型及多种存储系统特征的分析,提出一种基于二叉决策图的数据放置方法。该方法能够根据负载及存储状态通过二叉决策图的决策为I/O请求选择一种合适的放置策略,打破了传统的存储系统通常采用的全局统一的数据放置方法。实验结果表明,该方法能够提高文件系统的整体I/O吞吐率。   (2)提出了一种基于Hint信息的I/O机制。由于机群环境多用户共享一个集中的文件服务器在高并发访问的情况下会产生严重的负载相互干扰现象,针对这个问题本文提出了基于Hint信息的I/O机制。该机制利用文件系统获得的丰富的语义信息来指导调度。其中顶层分发器主要负责将请求派发到集中式的文件服务器上多个存储部件的调度队列上;底层调度负责单个存储部件内部不同应用之间性能隔离的调度。实验结果表明,该机制不仅提高了多个存储设备的并发性,而且提高了单个存储设备的I/O性能,同时还能支持根据用户优先级分配带宽。   (3)提出了一种高效的元数据管理机制。在元数据与数据分离存储架构的文件系统中,以文件的形式存储数据布局信息的方法会导致元数据访问产生较大延迟,而机群环境极其频繁的元数据操作会导致元数据访问成为性能瓶颈。针对这一问题,本文通过元数据布局信息与元数据属性信息拆分存储、元数据信息按照用户ID进行缓存及替换、以及按照目录粒度预取目录项元数据等方法来隐藏元数据访问延迟。实验表明,该机制能够有效地提高元数据吞吐率。   (4)应用以上研究成果,设计并实现了一个面向中小规模机群的网络文件系统United-FS。该文件系统实质上是一个虚拟的文件系统,它建立在多种物理文件系统之上,提供了单一文件系统映像;该文件系统支持NFS协议,NFS客户端可以不修改接口即可使用;它采用了元数据与数据分离存储的体系结构,能够充分利用多个I/O通道的并发特性,解决了NFS扩展性问题。
其他文献
门户中间件作为构建、管理、运行企业信息门户的支撑系统,提供了面向表示层的开放集成框架,能很好的集成现有应用,消除信息孤岛,同时具有强大的用户个性化功能。门户开发人员在门
目前DeepWeb是数据库领域研究的热点,开放存取期刊OA(Open Access)作为DeepWeb资源,以其优秀的学术共享理念得以迅速发展。但是OA期刊遍布互联网,“孤岛”现状日益严重,而传
基因组测序技术的发展和质谱技术的进步,使得能够快速地产生大量的蛋白质序列数据,然而相比之下,经典的蛋白质结构测定方法速度却很慢。因此,为弥补测定蛋白质序列和蛋白质结构之
P2P(Peer—to—Peer,对等)文件共享系统从1999年正式出现以来一直在经历着飞速的发展,现在这些系统已经吸引了大量的Internet用户以及占据了大量的Internet流量。最近的测量结
基于生物特征识别的身份鉴别技术提供了一种高可靠性、高稳定性的身份鉴别方式。在各种生物特征识别技术中,人脸识别是一项极具发展潜力的生物特征识别技术,在信息安全、公共安
学位
随着过去几十年勘探技术的发展和油气田大规模的开采,一些较易发现、较简单的油气田已几乎开发殆尽。人们的目标开始转向复杂油气藏。由于复杂油气藏在地质形态上表现为倾角较
二进制翻译技术通过软件手段将一种指令集体系结构(ISA)上的可执行程序翻译到另一种ISA上执行。该项技术可以应用于代码移植、动态优化、错误监测、系统安全等多个领域。  
近年来,由于计算机和互联网的高速发展,信息资源呈现出爆炸式增长,数量上越来越丰富,但同时也给知识获取增加了难度。如何能够对信息进行有效的组织和管理,使之转化为知识,成为知识
图像分割是图像分析、识别和理解的基础。图像分割主要是将图像分成各具特性的区域并可提取出感兴趣的目标的技术,其研究多年来一直受到了人们的高度重视,由于不同待分割图像的
随着虚拟化和云化等技术的发展,计算存储分离架构应运而生,计算存储分离具有很好的扩展性和可管理性。计算存储分离之后,资源按需扩容,使得总体成本降低。同时云化大规模并行处理