基于MongoDB的集团门户系统的关键技术分析及应用

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:gloria_yan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过去25年的商业DBMS发展用一个短语来概括:一刀切,即传统的关系型数据库架构适用于大部分以数据为中心的应用。随着大规模Web2.0网站的飞速发展,关系型数据库在满足高并发读写,海量数据高效率存储及高可扩展性和可用性等方面遇到了性能瓶颈,有人指出,“关系数据库正在消亡,它已经过时,满足不了时代的需求。”NoSQL数据库的兴起是解决海量数据,高访问量,高扩展性,高可用性等问题的希望所在。NoSQL打破了传统关系型数据库的瓶颈,满足了大数据时代高性能读写,高可扩展,高伸缩性等需求。NoSQL采用模式自由,结构松散的可扩展类型对数据建模,方便存储海量数据;部署集群架构,将数据采用DHT方式冗余保存在多个服务节点上,扩大服务节点失效的容错容灾能力。   在百花争艳的NoSQL领域,涌现了一大批优秀的NoSQL数据库,优秀的代表之作有Google的BigTable和Amazon的Dynamo。本论文以MongoDB为例,旨在研究存储海量数据的优化方案,针对HR集团门户数据存储需求,将NoSQL理论应用于实践,具体工作和创新点主要如下:   首先介绍课题的研究背景和选题意义。针对传统关系型数据库在大型web2.0网站所遇到的瓶颈,提出了NoSQL的解决方案,分析部分主流NoSQL数据库的特性,合理将NoSQL数据库引入系统架构。   其次介绍MongoDB基本理论知识,了解面向文档的半结构化数据存储模式和GridFS文件系统,重点分析分布式集群存储机制,高效存储海量数据。对比关系型数据库,针对MongoDB中存在的不足并改进,最后给出数据优化方案。   然后研究高可扩展性的集群架构搭建和数据分布负载均衡算法,了解MongoDB的Auto-Sharding机制和consistent hashing算法的实现原理和机制,并对理论的可行性进行了验证。结合两者优势,在分布均衡的基础上,提出了读写均衡的思想,探讨了基于动态反馈的hash sharding算法的可行性。   最后将MongoDB与应用相结合,理论联系实际,将MongoDB引入到HR集团门户系统。针对系统大规模数据存储及高效响应需求,提出了MongoDB与MySQL相结合的解决方案以实现读写分离。整个开发过程在公司内部实现的WKE框架下进行,系统各部分运行良好,并保证高效的响应速度。
其他文献
Linux内核代码量大、逻辑关系复杂,因此对内核中的错误进行追溯和调试一直以来都是一件既耗费时间又耗费精力的事情。已有的错误追溯方法和技术种类繁多、效果各异,但几乎都
最小独立支配集问题是图论中经典的NP完全问题之一,要求在给定的图中找到一组顶点D,D的顶点互不相邻(独立),且D之外的每个顶点都有相邻的顶点包含于D(支配)。最小独立支配集问题在很
用听觉系统在彼此之间以及与周围环境进行实时的交互是人和其他哺乳动物所具备的一种最自然、最有效的交互方式之一。因此要想实现友好的人机交互,机器人的听觉系统便是一个不
GPU作为一种新兴的体系结构在高性能计算领域中使用愈来愈广泛,其高带宽和计算吞吐量以及低功耗的特点能够提升应用程序的性能。然而,在GPU编程中,需要有效管理大量线程中内存层
模型驱动体系结构(Model-Driven Architecture,MDA),是由模型管理组织(Object Management Group,OMG)提出的一种软件系统的开发方法,而模型转换是MDA的核心技术之一。利用模型转
随着IT技术的高速发展,以GIS为代表的空间信息技术在各领域得到了应用,同时遥感等空间数据获取技术不断进步,现代社会对位置服务和分析决策的需要也日益迫切。此外,Google、Micro
目前监控摄像头在我们的生活中得到了广泛的应用,随之产生的一项挑战便是如何自动地在监控视频中检测感兴趣的事件。一方面,我们希望从过往的海量监控视频中快速地找到发生特定
随着传感器技术的飞速发展,多传感器系统在各个领域都得到了越来越广泛的应用。不同的图像传感器有着不同的成像原理、不同的感应波长范围和不同的应用环境及硬件要求。然而,单
当前,计算机应用软件越来越复杂,或多或少的都会有一些漏洞,比如缓冲区溢出。黑客可以使用病毒和特洛伊木马利用这些安全漏洞侵入计算机系统和获得他们的权限,然后访问敏感信息或
近年来人们提出了一种新的以内容为中心的网络架构——Named DataNetworking(NDN)。NDN网络架构取消了现有网络架构中位置的概念,直接使用名字访问数据,这种以内容为中心的设计