面向事件流机群数据库系统的设计研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:easelin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机群数据库系统成为大容量数据处理密集系统的有效载体,其应用范围越来越广、系统规模越来越大。本文以国家网络安全监测系统中对大规模机群数据库系统的需求出发,总结了其对机群数据库系统的容量需求、功能需求和性能需求,在国家关键应用的驱动下,提出了机群数据库中间件系统——DBroker。论文全面介绍了DBroker系统结构及其主要技术,进行了详细的性能评价,并与其他机群数据库系统进行了比较和分析。目前.DBroker系统已经成功部署并运行于国家网络安全监测系统中,为国家网络安全发挥着不可替代的作用。 本文的主要贡献是: ■事件流应用的特征分析。以国家网络安全监控系统的应用场景出发,阐述了事件流应用的大容量、时序高速写入、数据密集查询的典型特点,描述了这类系统的典型操作。同时,对比广泛认可的OLTP和DSS负载特征,总结了事件流应用中的两大类数据——配置数据和事件数据的特点。对比Hot-Spot和局部性数据访问模型,论文提出了符合事件流应用特点的随时间递减的热点数据访问模型——b-c.f(t),f(t)<0,应用对数据的访问符合随数据在系统中存在时间而单调递减的规律。 ■ DBroker系统结构设计。详细论述了DBroker的系统结构,节点角色和对象节点域的定义,描述了DBroker系统中服务管理节点(SMServer)、数据库节点(DBNode)和服务节点 (Lserver、Qserver、CCServer)三者之间的工作关系,以及其中的负载均衡、消息发布、请求服务的主要功能和执行流程。比较目前常用的机群数据库系统,DBroker的突出特点是:既支持数据的复制存储也支持分片存储、支持节点间查询内的并行、专用可扩展的请求服务以及灵活的负载均衡和数据均衡策略。因此,DBroker系统在支持100TB大容量数据、高并发用户请求以及系统多层次可扩展上,具有其他机群数据库系统所不具备的优势。 ■高速均衡的数据加载策略。在上述DBroker系统结构设计基础上,面向国家网络安全事件流高速写入的要求,提出并实现了写入请求预处理和广播策略,预处理语句的存储和发布保证了数据可以被快速、批量的写入数据库节点,此写入策略尤其适用于类似事件流的数据写入方式,其特点是:预处理语句类型少,在进行语句预处理和广播后,语句复用率高.。另外,提出并实现了基于周期计数的数据均衡策略,保证了无共享机群数据库各数据库节点之间的数据均衡。 ■并行查询的设计、性能和可扩展性分析。设计并实现了 DBroker OServer查询服务,介绍了其结构、两阶段工作原理、语义解析器和中间结果集存储的处理方法。并以事件流应用中的四类典型语句为例,介绍了语义解析器的具体实现,分析了并行查询中的不同流水线并行执行序列。从DBNode数据库节点规模扩展和QServer查询服务节点扩展两个角度,分析了不同请求对规模扩展的变化趋势。另外,面向并行查询中的同步区过长问题,提出了置信同步区的概念,对于部分请求,使用置信同步区可以显著降低请求执行时间。 ■ DBroker系统的应用及性能评价。DBroker系统已经成功部署并运行于国家网络安全监测系统中,本文从数据需求、功能需求和性能需求三方面描述了国家关键应用对DBroker系统的要求,并给出了最终的硬件方案和软件方案。以用户实际业务请求为测试用例,从负载均衡、加载服务、查询服务三方面全面评价了系统。最后从应用的角度,将DBroker系统与目前较常用的Oracle RAC进行了同规模的性能比较。测试表明,对于类似网络安全事件流应用的大规模机群数据库系统而言,使用无共享数据库系统,加以集中式可扩展的请求服务管理,是一个行之有效的技术方案。
其他文献
在电子商务(E—Commerce)领域,个性化(Personalizatoin)服务技术和推荐系统(RecommenderSystem)的应用已经越来越广泛。电子商务站点通过推荐系统向在线顾客推荐诸如书籍、音
随着网络技术和信息产业的飞速发展,数字信息资源已经成为人们主要的交流介质之一。数字信息资源安全使用、合法使用等方面的威胁也日益明显。数字信息资源的安全性和合法性,已
学位
随着经济体制改革的深化,经营管理模式发生了根本地变化。竞争的焦点也从资金、物质资源的竞争转为人才资源的竞争。人事管理已成为经营管理的重要内容。 在传统的人事管理
USB接口具有高速稳定、支持热插拔、功耗小的优点。其实用性使得USB接口得到了广泛应用。但是USB协议的复杂性使得USB接口的设计具有相当的难度。本文给出的基于EZ-USB FX2LP
随着计算机科学和通信技术的飞速发展,传统PSTN(Public Switch Telephone Network公共电话交换网)网络上的语音业务将逐步迁移到IP网络上。VoIP技术为基于IP网络的语音通信提
干涉合成孔径雷达(Interferometric Synthetic Aperture Radar,简称InSAR)获取地表的高程信息和形变信息己经在地形测绘、地震火山监测、地表沉降和冰川移动等多个领域得到了
学位
面向服务的体系架构(Service-OrientedArchitecture,SOA)已经成为计算机软件的主要发展趋势。Web服务(Web Service)是目前SOA的主要实现方式。它定义了松散耦合的软件框架以及
学位
当前的互联网络路由算法主要针对尽力发送(best-effort)和基于服务质量(Quality ofService Based)两种数据传输模型,路由的设计正是基于现有的网络数据传输模型来考虑,以如何保
近四十年来,基于生物特征的身份识别技术得到了研究者们的广泛关注和深入研究。综合考虑可识别性和易采集性,目前在实际中被广泛应用的生物特征识别技术主要包括虹膜识别技术、
随着Web2.0的发展,微博、社交网站、博客等社交类网络应用已融人人们社会生活的方方面面。社交网络的一个突出特点是个体间相对静态的网络结构和具有动态性、时效性的个体信息