机群文件系统的数据放置策略研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:sd2009shandong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来机群系统凭借其良好的扩展性、可用性以及高性价比成为当前高性能计算机的主流体系结构。而由于磁盘性能的提升速度远远落后于CPU、内存以及通信网络带宽的发展速度,从而使得I/O子系统越来越成为机群系统的性能瓶颈。设计高性能的机群文件系统是缓解这一问题的重要手段。实际应用中所产生的数据可能在系统中不同的存储节点之间造成访问和存储的不均衡,从而导致某个节点成为系统的性能瓶颈,降低了系统的整体性能。高效的数据放置策略通过将数据在系统中所有存储节点之间合理有效地分布存放,充分利用所有节点的聚合带宽,提高系统的吞吐量,从而成为缓解或者消除I/O子系统性能瓶颈的重要技术。本文总结了影响机群文件系统I/O性能的数据放置的几个关键问题,并结合国内外相关研究工作,提出了有效的解决方案。主要研究内容及结果如下:   ⑴提出了适用于目前机群系统中衡量节点负载的二元组方法及负载均衡机制。这种方法主要考虑节点的I/O访问负载,其次考虑节点的磁盘空间利用率。对节点的I/O访问负载失衡和磁盘空间利用饱和的情况进行区分,采取不同的数据迁移策略,使系统中的负载处于动态近似均衡状态,从而可以充分利用系统中所有节点的带宽,提高系统的I/O性能。   ⑵提出了存放文件时基于负载的概率选择法。在选择文件的存放位置时,首先考虑节点的I/O访问负载。当访问负载不均衡时,以节点的访问负载大小所占比重的概率选择该节点进行存放;当访问负载近似均衡时,以节点的磁盘空间利用率所占比重的概率选择该节点进行存放。这种方法可以有效地支持多复本机制,同时还支持single、stripe两种不同的文件模式。实验测试表明,通过这种方法选择文件的存放位置,可以提高系统的吞吐量。   ⑶提出了机群系统发生伸缩时的数据迁移策略。对节点失效的情况,首先基于负载进行快速的数据恢复,然后再进行负载均衡的数据迁移操作。对节点加入的情况,首先进行负载均衡的数据迁移操作,再将新节点投入到创建文件时的使用。通过采取不同的数据迁移机制,在保证系统数据可靠性的同时,又能尽量减小数据迁移对系统I/O性能的影响。通过这种方法进行节点伸缩时的数据迁移,可以提升节点动态变化时系统的吞吐量。
其他文献
IPv6是在IPv4运行基础上发展起来的更为完善的Internet协议,是下一代互联网络的基础通信协议。IPv6协议栈涉及大量的协议规范,且相当一部分仍在讨论中。由于Internet应用在很大
目前,我国还没有提出完整的RFID(Radio Frequency Identification,无线射频识别)应用架构,相关的RFID支撑技术、产业发展的基础设施、测试认证、政策环境都还没有建立起来,关于编码
随着计算机网络、通信和控制技术的发展,以太网技术在工业控制领域中的应用倍受关注。但控制系统对高可用性和稳定性的要求限制了工业以太网的发展。同时面对国内工业生产的安
如今Web服务广泛分布于互联网中,它们通过彼此之间的交互实现对问题的协作求解。然而,在交互过程中,一些非预期、“不正常”的信息交互时有发生,严重影响了系统的质量及健壮
射频识别(Radio Frequency Identification,RFID)是一种利用射频信号自动识别目标对象并获取相关信息的技术。由于传统的定位技术不能满足室内定位环境和精度的要求,而RFID技术所
近年来,人们意识到保存Web的重要性,国内外有了保存历史网页的系统,其中北京大学网络实验室研发的Web InfoMall系统已经存储了从2002年至今的中国互联网上超过30亿的网页,在这个
嵌入式SoC有效地降低了系统的功耗、体积和成本,提高了产品的性能价格比和竞争力,是当今嵌入式系统设计技术发展的主流。PCI总线是计算机中普遍使用的通用局部总线,嵌入式SoC中
汉语-盲文转换在盲文出版、盲人教育等领域有重要应用,但当前主要基于人工完成,其过程效率低、成本高,导致盲文读物匮乏,盲人获取信息困难。已有的汉盲自动转换系统在盲文自动分
产品数据管理(Product Data Management,PDM)是一项对产品相关的数据和过程进行集成化管理的技术。随着PDM系统在众多制造企业的实施应用,PDM系统的数据安全也备受关注。用户
最近几年,由于国内教育需求的不断扩大以及教育资源的有限供应使得依托网络的远程教育市场迅速蓬勃发展了起来。而随着参与网络教育学员人数的不断增加,市场竞争的不断加剧,使得