蓝鲸集群文件系统日志性能优化研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:hegang520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展和广泛应用,数据量呈爆炸式增长,网络存储系统越来越受到人们的关注。作为网络存储系统核心部件的集群文件系统,如何提供高吞吐率、高带宽、低延迟、高可用的文件共享服务成为亟待解决的问题。文件访问包括数据访问和元数据访问。虽然元数据量在整个文件系统中所占比例较小,但其访问频率较高,因此元数据访问的性能对文件系统整体性能有着重要影响,如何提高元数据访问的性能成为当前集群文件系统的研究热点之一。本文结合蓝鲸集群文件系统的特点,研究了日志模块对元数据访问性能的影响,分析了日志在文件系统同步导出语义下以及现有检查点机制的性能瓶颈,并针对性地采用了一些方法进行优化。测试结果表明,同步导出语义下元数据访问性能最多提高了2倍,此外,还有效地削弱了检查点操作对前端文件系统元数据访问的影响。主要研究内容及结果如下:   ⑴提出一种日志并行提交机制。在同步导出语义下,文件系统事务提交非常频繁,单一的日志提交线程可能引发事务提交拥塞,使事务提交成为系统性能瓶颈。在分析并行提交相对串行提交具有优势的必要条件之后,本文设计并实现了一种日志并行提交机制,采用多个提交线程避免事务提交拥塞;此外,对并行提交下不同IO调度算法对日志设备IO性能的影响进行了研究,进一步提出并实现了多设备日志结构。   ⑵设计并实现了日志主动检查点机制和异步恢复机制。现有的日志检查点机制使用Pdflush系统线程作为元数据回刷线程,使用遍历尝试的策略释放内存和日志空间,精确性低、在同步导出时开销大、对于回刷时机的选择不能很好地满足日志的需求。本文一方面通过探测日志空间使用状态主动触发元数据回刷,另一方面通过建立回刷链表实现内存和日志空间的精准释放。大容量日志带来日志恢复耗时较长的问题,在高可用环境中将引起系统中断服务时间过长,本文提出并实现了日志异步恢复机制,Postmark测试表明,主从元数据服务器切换时文件系统上线时间缩短了17.5%~29.6%,模拟测试的缩短幅度达到了51.7%~83.2%。
其他文献
党中央、国务院历来高度重视安全生产工作,安全生产不仅关系人民群众的生命财产安全,还关系着改革、发展和稳定的大局。目前,我国经济和社会发展水平决定了我国在一段相当长的时
工业产品的快速开发要求采用“V”字形开发。作为“V”字形开发不可或缺的重要组成部分,快速控制原型能大大缩短产品的开发周期。在线调参是快速控制原型开发的关键技术。在线
当前,蛋白质序列数据库以很快的速度增长,而蛋白质结构测定的实验技术却很慢,因此使用计算方法来预测蛋白质结构成为缩小序列测定和结构测定之间速度鸿沟的重要方法。蛋白质结构
随着网络技术的发展,电子商务渗透到贸易活动的各个阶段包括信息交换、售前售后服务、电子支付、运输等等。电子商务协议就是为了完成电子商务活动而设计的协议。作为一类特殊
学位
随着科技的发展,特别是传感器网络、互联网等技术的广泛应用,数据流出现在越来越多的应用系统中,于是,数据流管理系统的构建、优化等技术得到密切关注。并且,由于应用系统对数据流
随着现代外科手术的发展,手术门类越来越丰富,在手术训练中需要掌握的技巧和知识越来越多,从而导致尸源和实习机会的相对减少,医学院学生在解剖室或手术室中的训练相对不足。另一
随着全球汽车产量的逐年提高,相应地轮毂市场需求也在迅猛增长,国内80%的汽车轮毂是由铸造而成,铸造而成的轮毂需要进行精加工,而由混流生产线生产的轮毂在再加工时若对其类型进行
软件工程发展到今天,仍然有很多因素无法控制。如何有效的保证软件质量仍然是软件工程的重大难题,同时这也是决定项目成功与否的关键因素之一。对软件质量进行量化管理并客观的
学位
离散傅立叶DFT变换作为数字信号处理中最基本的运算之一,在很多领域中发挥着重要的作用,而快速傅立叶变换FFT作为DFT的快速算法使得傅立叶变换的运算量大大减少,且实现起来更方
随着分布式应用的迅速发展,不同硬件平台和网络环境,特别是不同数据库之间的互操作问题越来越复杂,为解决这一问题,业界提出了中间件的概念,如今已成为当前研究课题的一个重要方向