基于RDMA和NVM的内存键值数据库优化研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:eboy120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着物联网、人工智能、云计算产业和移动互联网的快速发展,数据规模呈现爆发式增长。这一现象给数据管理带来了巨大的挑战,而内存键值数据库是支撑数据中心和众多数据密集型应用的关键技术,广泛应用于网页检索、电子商务、云存储、社交网络等领域。大数据时代下,应用会时刻产生海量用户数据,对内存键值数据库的系统性能和高可用性提出了极高的要求。内存键值数据库的发展除了受应用驱动外,其实现方式也要随着新型硬件的发展做相应优化以获得最佳的访问性能。支持远程直接内存访问(Remote Direct Memeory Access,RDMA)的高速网络和非易失内存(Non-volatile Memory,NVM)存储设备的出现为进一步提升和优化内存键值数据库带来了新的机遇和挑战。本文的研究工作围绕利用新型RDMA和NVM硬件对现有内存键值数据库的优化展开。RDMA是一种高带宽、低时延的网络通信技术,可以加速内存键值数据库的远程通信。NVM能够明显提升键值访问效率,兼具传统硬盘的持久性和接近内存的存取速率。但是,直接将现有的内存键值数据库迁移到RDMA和NVM硬件上,无法充分发挥新型硬件的潜力,因为现有内存键值数据库面向传统硬件设计的软件技术不适合新型硬件的特性。因此,如何充分发挥新型硬件的潜能,设计出高性能、高可用的内存键值数据库,是一个值得深入研究的问题。本文分别针对高性能和高可用这两个目标,分析了内存键值数据库存在的瓶颈问题和结合新型硬件存在的挑战,提出了基于事件驱动通信框架的内存键值数据库优化方案、基于远端日志持久化技术的主备复制优化方案和基于跟随者驱动的共识协议优化方案,通过这三个优化方案来讨论如何利用RDMA和NVM来提升内存键值数据库的性能和可用性,本文的主要工作和贡献如下:(1)基于事件驱动通信框架的内存键值数据库优化:RDMA高速网络是提升内存键值数据库性能的有力保障,但其低层级的网络API集成进现有内存键值数据库,需要大量的代码修改和架构重新设计,而且现有系统针对传统以太网的设计如序列化协议,不适合RDMA访问方式。因此,为了高效发挥RDMA网络性能,充分利用RDMA硬件特性,本文选用了最佳的RDMA原语,构建了基于事件驱动的RDMA通信框架,替换了轮询获取请求的方式,以减少请求发现的处理器开销。该框架提供通用的网络接口,易集成到现有内存键值数据库。本文还提出了优化的序列化协议,能最小化序列化和反序列化的内存拷贝开销。此外,本文提出了一个基于乐观并发控制的并行处理引擎,对读密集负载友好,能更好地提升内存键值数据库性能。(2)基于远端日志持久化技术的主备复制优化:内存键值数据库常采用主备复制技术来支持高可用,而高速的RDMA网络和具有高效读写能力的NVM存储,能有效消除主备复制中的慢速网络和存储I/O瓶颈。但是,因为DDIO优化技术的存在,RDMA网卡会直接将数据写入远程节点的CPU缓存,而不是远端NVM中。一旦节点发生故障,就造成数据不一致问题。而且真实的NVM设备存在读写放大问题。为了保证远端数据持久化,本文提出了一个高效的远端日志持久化技术,充分考虑RDMA特性,最小化网络往返和持久化开销。为了缓解NVM写放大问题,本文设计了基于日志结构的存储架构,并支持流水线批处理机制和并行日志回放策略,从而使主备复制对主节点处理性能的影响尽量小。此外,本文进一步提出了一个热度感知的差异化哈希索引,以提供良好的读性能。(3)基于跟随者驱动的共识协议优化:基于共识协议的高可用架构不仅能保证数据强一致,而且可以在领导者发生故障时自动选举新的领导者接管服务,因此被许多商用内存键值数据库使用。但是单点领导者不仅需要处理大量客户端请求,而且需要将日志复制给所有跟随者,往往容易成为性能瓶颈。针对这一问题,本文提出了一个跟随者驱动的优化的Raft协议,采用混合RDMA原语将领导者日志复制中关键路径上的任务卸载到跟随者,有效减少领导者的处理器和网络开销。进一步,该协议利用NVM可字节寻址的特性,支持跟随者主动拉取的日志追赶策略。此外,本文还提出了一个跟随者多数派的跟随者读方法,利用跟随者间的多数派投票和远程直接读取提交索引的方式,让跟随者直接处理读请求,无需领导者的直接参与,进一步减轻领导者的资源开销。综上所述,本文结合新型的RDMA和NVM硬件,并从通信框架优化,主备复制优化,共识协议优化三个方面阐述了如何通过充分发掘新型硬件的特性来优化内存键值数据库系统,以达到高性能和高可用的目标。首先,本文构建了高性能、低延迟的RDMA通信框架,以加速内存键值数据库的客户端和服务端间的网络通信。然后,本文为了解决远端数据持久化问题和NVM写放大问题,提出了高效的远端日志持久化技术和NVM友好的存储结构,用以优化主备部署的内存键值数据库。最后,本文提出了一个跟随者驱动的优化的Raft协议为内存键值数据库提供高可用服务。大量的实验结果验证了本文提出的优化方案的有效性。
其他文献
刘湛恩是中国近代著名的教育家、社会活动家、杰出的民主爱国人士。他一生坚持“教育救国”的理想,在服务基督教青年会期间,他组织参与平民教育、公民教育、职业教育中国近代三大教育运动,同时也被卷入了非基督教运动的漩涡。1928年,刘湛恩出任沪江大学首位华人校长,旨在打破教会大学封闭的藩篱,引导基督教教育中国化改革。他不仅调整沪大迅速适应中国社会,而且使沪大为中国社会发展和抗日救亡培养了许多杰出的人才,成为
学位
维数灾难(The curse of dimensionality),最早是由理查德·贝尔曼在1996年提出的,是指不同学科领域中由于数据维数的增加导致计算量呈指数增长趋势而造成的各种问题。在不丢失信息的前提下将高维数据映射到低维空间是一种用来应对维数灾难行之有效的方法。充分降维正是在这样的理念框架下展开的,通过寻找自变量的线性组合来完成数据降维,得益于其不依赖模型假定和结合了统计量充分性概念的特征
学位
网络舆情具有强烈的两面性,一方面,它能在一定程度上促进整个社会经济、文化的发展与进步,另一方面,谣言或偏激言论的广泛传播会影响到社会的正常秩序。“危险”舆情信息一旦没有被第一时间抓取、处理,错失舆情干预的最佳期,会导致负面网络舆情的产生,造成谣言肆虐、社会恐慌、次生隐形风险等难以控制的后果。预警是网络舆情治理的第一防线,通过建立一套科学合理的网络舆情预警机制能够推动舆情预警工作的精准化、高效化和科
学位
过氧化氢(H2O2)是一种通用且环境友好的氧化剂,被广泛应用于工业、农业、医药、能源和环境保护等领域。蒽醌氧化法是目前工业上制备H2O2的主流工艺,但存在操作复杂及污染严重等问题。以O2或H2O为原料,电能为能量来源的两电子氧还原(2e-ORR)和两电子水氧化(2e-WOR)电催化策略是新兴的H2O2制备技术,具有绿色安全、经济高效等特点。现阶段该领域面临的关键挑战在于如何设计兼具高选择性、高活性
学位
近几十年来,风能的发展在减少碳排放以满足缓解气候变化日益增长的需求方面发挥了关键作用。尽管风能通常被视为一种环境友好的替代能源,但风电场数量的持续增长可能会对周边鸟类的群落结构与种群特征产生长期和复杂的影响。繁殖生活史对于野生动物的种群维系至关重要,而当前缺乏研究关注风电场周边鸟类繁殖生活史变化及其相关机制,为了找到证据来证明风电场对鸟类影响程度,以及这些影响背后的作用机理,本研究结合当地风电场所
学位
膀胱癌是泌尿系统常见的恶性肿瘤之一,符合手术指征的膀胱癌患者的治疗方案目前主要是以手术治疗联合术后膀胱灌注治疗为主。对于晚期不可切除或转移性膀胱癌目前的治疗手段无法令人满意。膀胱癌中有较高比例的患者存在肿瘤的成纤维细胞生长因子受体3(Fibroblast growth factor receptor 3,FGFR3)的激活突变,这种突变使得膀胱癌的FGFR3信号通路被异常激活。针对这类FGFR3异
学位
本博士论文分为两部分。在第一部分中,我们证明了阿贝尔范畴的短正合列可以诱导复形范畴,同伦范畴和无界导出范畴的短正合列,从而推广Miyachi的结果.第二部分的目的是使用To(?)n和Brav-Dyckerhoff的相对Calabi-Yau结构理论来对具有系数的丛代数进行范畴化.丛范畴由Buan-Marsh-Reineke-Reiten-Todorov于2006年引入,以便对不带系数的丛代数进行范畴
学位
准晶作为涂层(薄膜)等表面改性材料已经广泛使用.由于压电效应,准晶在智能结构和系统设计中具有更好的传感器和执行器功能.随着压电准晶(PEQCs)制备技术的成熟和抗接触(摩擦)损伤的实际需求,开展对PEQCs涂层和功能梯度压电准晶(FG PEQCs)材料摩擦接触力学行为的研究既有理论价值,又有实际意义.一方面,不仅为现有弹性接触理论研究提供补充,将经典积分变换及势函数等方法的应用范围推广到更宽更新的
学位
时间约束规约语言(Clock Constraint Specification Language,CCSL)被越来越多的应用于嵌入式实时系统的建模和时间行为的分析。在系统设计过程中,需求工程师往往需要从自然语言撰写的需求文档中总结求解CCSL规约。然而随着系统复杂性的日益增高,需求工程师难以完整且准确的求解CCSL规约,这是因为需要工程师往往缺乏专业的形式化建模知识与经验。由于目前缺乏相关的自动化
学位
存储模型是线上系统稳定运行的基础,为各种关键性应用业务提供了高效存储和检索功能,是数据库管理系统中不可或缺的组成部分。而随着移动互联网、云计算产业、物联网等行业的快速迭代,数据存储正以指数级增长。这一现象给数据库系统中的存储模型带来了巨大的挑战。基于日志结构合并树(Log-Structured Merge-Tree,LSM-tree)实现的存储模型采用了异步更新(Out-of-place Upda
学位