【摘 要】
:
随着互联网数据规模的指数级增长,如何有效存储和分析这些数据成为非常有挑战的一个问题。为了应对大数据的挑战,涌现出了各种分布式存储和计算系统。其中分布式非关系型数据
论文部分内容阅读
随着互联网数据规模的指数级增长,如何有效存储和分析这些数据成为非常有挑战的一个问题。为了应对大数据的挑战,涌现出了各种分布式存储和计算系统。其中分布式非关系型数据库利用分布式系统的特点和非关系型数据库天然的水平伸缩能力,成为大数据存储系统的典范。它们在一致性和可用性上做了折衷,通过牺牲部分一致性,来获得整体性能的提升;并能通过简单累加节点的方式进行性能的水平扩展。为了节省网络传输,分布式非关系型数据库采用批量的方式处理客户端的请求。不过当前典型的分布式非关系型数据库在批量处理方面都存在着一定的问题。为保证数据更新的原子性而引入的加锁操作导致False Conflict现象比较严重,使得批量处理的性能不高。并且由于后台线程对网络等I/O资源的竞争,使得服务端性能出现明显的波动。针对上述问题,本文提出一套优化服务端处理性能并减少性能波动的解决方案:利用两个改进的批量处理算法来加快服务端处理写操作的流程,提升服务端的吞吐量;利用VLog来并行化处理对WAL的写入,减少工作线程的等待时间;利用自适应Flush模型有效监控网络资源状况,合理调度后台工作线程的执行流程,有效减少各流程之间的资源访问冲突,减少服务端出现的性能波动,提升服务质量。本文在HBase系统的基础上实现了原型系统EnhBase。实验表明,EnhBase系统相比基准系统有明显的性能提升。并且能在短时间内做到抗性能抖动。
其他文献
在部署了传统的“尾部丢弃”算法的路由器上,当队列长度达到队列缓冲区最大值以后,接下来到达的分组就会被拒绝进入队列,直到队列缓冲区能够容纳新到达的分组。这种算法存在
本文首先详细阐述工作流的基本概念、工作流管理系统的概念及分类,并在此基础上描述了工作流的体系架构及参考模型,工作流管理系统的各个组成部分功能以及相互之间的逻辑联系
本论文首先介绍了企业门户的概念,探讨了企业门户对企业信息化的作用。 在接下来的部分,详细分析了企业联合门户的特点和优势,以及相关的技术和标准;探讨了引入WSRP之后的
本文论述了网络搜索技术在企业竞争情报系统中的应用,并根据理论研究的成果,设计并实现了基于网页探测技术的企业竞争情报系统.全文分三个部分,第一部分(第1章)是文章的绪论
随着计算机网络的日益普及和不断发展,网络结构变得越发复杂,网络设备呈现出多样化的特点。同时,网络还要满足服务质量和安全等方面的需要。传统的SNMP网络管理已经不能适应网络
“软件复用”和“软件体系结构的深入研究”是现代软件开发的重要特点。这标志着架构与微架构已经得到了人们的高度重视。框架的选择或构建就是系统的微架构。框架是面向对象
本论文从单纯的技术层面转向依托技术从人的层面、文化的层面,基于网络环境,从一个可行的、并且有现实意义的维度对学习软件的跨文化可移性进行研究,构建一个真正有效的支持
本文主要是对城域网中一种新型的数据传输技术—弹性分组环(RPR),进行了详细地探讨和深入地研究。文章首先全面地介绍了弹性分组环背景知识,协议模型以及网络与节点结构,然后
信息隐藏(Steganography)是一种用于秘密通讯的技术。这种技术的特点是在信息中隐藏信息,把要通讯的信息嵌入到正常的信道中,隐藏了实际要通讯的信息,它的这种隐蔽性增强了通讯
组件式智能空间信息平台是一个综合的信息系统,涉及到地理信息系统、智能系统和组件化等相关内容,它的建设也是一个复杂的过程。本文主要探讨组件式智能空间信息平台研发与应