论文部分内容阅读
机群系统已经成为高性能计算机的主流,其中又以中小规模机群应用得最广泛。机群文件系统为机群应用提供数据存储、数据共享、数据访问等服务。高效、易管理、低成本、高可靠性是用户对机群文件系统提出的基本要求。当前NFS以其易使用、易管理、低成本等优势被用户广泛使用,尤其在中小规模的机群中。然而随着I/O密集型应用对性能需求的不断提高,NFS常常成为机群环境高性能计算应用的性能瓶颈。
随着多核CPU、大内存、高性能I/O通道等硬件技术的发展,集中式大存储节点成为中小规模机群文件服务器的主要形式。这种集中式高性能存储节点给机群网络文件系统在数据存储布局、并发I/O请求处理、元数据处理等方面带来了新的挑战。因此研究优于传统NFS的机群网络文件系统具有重要的学术意义和实用价值。
本文的主要创新性工作如下:
(1)提出了一种基于二叉决策图的数据放置方法。机群文件服务器接收到的I/O负载具有各种不同的特征,不同的存储系统(如物理文件系统、存储介质)也有各自的特点。本文通过对I/O负载类型及多种存储系统特征的分析,提出一种基于二叉决策图的数据放置方法。该方法能够根据负载及存储状态通过二叉决策图的决策为I/O请求选择一种合适的放置策略,打破了传统的存储系统通常采用的全局统一的数据放置方法。实验结果表明,该方法能够提高文件系统的整体I/O吞吐率。
(2)提出了一种基于Hint信息的I/O机制。由于机群环境多用户共享一个集中的文件服务器在高并发访问的情况下会产生严重的负载相互干扰现象,针对这个问题本文提出了基于Hint信息的I/O机制。该机制利用文件系统获得的丰富的语义信息来指导调度。其中顶层分发器主要负责将请求派发到集中式的文件服务器上多个存储部件的调度队列上;底层调度负责单个存储部件内部不同应用之间性能隔离的调度。实验结果表明,该机制不仅提高了多个存储设备的并发性,而且提高了单个存储设备的I/O性能,同时还能支持根据用户优先级分配带宽。
(3)提出了一种高效的元数据管理机制。在元数据与数据分离存储架构的文件系统中,以文件的形式存储数据布局信息的方法会导致元数据访问产生较大延迟,而机群环境极其频繁的元数据操作会导致元数据访问成为性能瓶颈。针对这一问题,本文通过元数据布局信息与元数据属性信息拆分存储、元数据信息按照用户ID进行缓存及替换、以及按照目录粒度预取目录项元数据等方法来隐藏元数据访问延迟。实验表明,该机制能够有效地提高元数据吞吐率。
(4)应用以上研究成果,设计并实现了一个面向中小规模机群的网络文件系统United-FS。该文件系统实质上是一个虚拟的文件系统,它建立在多种物理文件系统之上,提供了单一文件系统映像;该文件系统支持NFS协议,NFS客户端可以不修改接口即可使用;它采用了元数据与数据分离存储的体系结构,能够充分利用多个I/O通道的并发特性,解决了NFS扩展性问题。