论文部分内容阅读
机群系统凭借良好的可扩展性、可用性以及极高的性价比成为高性能计算机和超级服务器的主流结构。现阶段许多数据密集型应用需要海量存储以及高数据传输带宽的支持,在这种环境下,数据高速访问和数据可用性成为关键。高速网络像InfiniBand等逐渐成为高性能计算领域服务器互联网络的主流,它们提供低延迟和高带宽,有助于减轻主机CPU和内存总线的负担。网络可用性是文件系统实现容错的基础,分离并独立处理文件系统的网络故障,有助于提升系统整体容错的效率和可扩展性。
文件系统通过通用协议支持高速网络,这些协议内部存在多级拷贝,并且与文件系统的传输模式没有紧密吻合,从而使得文件系统不能完全利用高速网络的传输带宽。通常的网络协议作为多数系统的默认支持提供了基本的网络容错功能,但是对于提供更高可用性的机群文件系统而言,需要额外的网络可用性支持。
本文主要研究机群文件系统的网络高性能和网络高可用两个方面的问题:
第一,研究机群文件系统高效利用高速网络的方法。对于文件系统元数据访问,提出快速消息传输技术,包括优化一般元数据操作的快速发送技术和优化读目录操作的快速写技术;对于文件系统数据访问,提出异步多页传输技术和双边内存注册技术,双边内存注册技术包括快速内存注册、全局导向标志和缓存注册表等技术的组合。
第二,研究机群文件系统网络传输的高可用技术。提出了隐式重构网络高可用技术以及通道选择网络高可用技术,后者包括通道切换技术和通道负载平衡技术。
第三,基于以上研究成果,设计了混合型RDMA文件传输协议AMP/RDMA,包括文件系统的数据访问协议和元数据访问协议,设计充分考虑了文件系统的性能,安全性以及可扩展性;设计了互补式文件传输高可用协议AMP/TLFT,该协议和上层文件系统紧密结合,并有效利用底层传输协议;并在机群文件系统DCFS3中对上述协议进行了实现和实验分析。
性能测试表明,综合使用上述高速网络性能优化技术,比较通用的InfiniBand协议SDP,文件系统数据访问的性能提升10%以上,文件系统元数据访问的性能提升3倍以上;综合使用上述网络高可用技术将增强文件系统消息传输的可靠性,相应的故障恢复的开销较低,文件系统恢复的性能损失不超过10%。