基于Hadoop平台的数据迁移系统的设计与实现

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:jw____
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术、互联网技术的飞速发展,大数据时代已经到来,而在数据应用管理中,提高数据管理系统的高效性十分重要。但是在数据类型不断丰富、数据规模不断扩大、非结构化数据逐渐发展成为处理与存储对象等原因的影响下,传统的数据库已经失去了原有的控制与主导地位,无法切实解决数据管理中存在的现实问题,无法经济有效的开展数据访问、数据分析、数据存储等项工作。Hadoop的应用,能够提高并行处理、底层存储的透明化,使得数据库拥有高性能的存储能力与集群计算能力,随之,在大量数据处理与分布式计算中,Hadoop的重要性日益显现。同时,将Hadoop应用于数据迁移中,还需要对此平台与关系型数据库之间的关系进行探索,了解如何在提高查询效率、处理海量数据的过程中实现数据迁移,将数据导入至Hadoop之后进行专业的数据分析与处理,此为开展本研究的关键目标。通过收集、分析大量的国内外参考文献,掌握现有关于数据迁移系统的研究现状与应用状态。为保证本研究的开展具有坚实的理论基础,本研究重点分析了Hadoop、云计算、数据迁移的概念,并从HDFS文件系统与MapReduce模型两方面介绍了Hadoop技术体系,之后对Hadoop数据查询技术与数据迁移的关键技术进行了探索,诸如Sqoop技术、ETL技术等。为优化基于Hadoop平台的数据迁移系统,本研究设计了该系统的总体框架与数据块模型。随之从数据划分与迁移方式两方面研究完善数据迁移系统的步骤。在实现与测试数据迁移系统的过程中,对硬件配置条件、平台搭建流程、实验过程等均进行了调整,且对数据迁移系统进行了测试。通过基于Hadoop平台的数据迁移系统的实现与测试,验证了该系统的构建与应用可以完整的对数据查询、数据迁移等进行同时处理。其中,数据迁移过程中完善了调度算法,并由此改善了数据迁移的基本性能。另外,将Hadoop平台与数据迁移系统相结合,利用Hadoop平台处理大数据,可充分发挥其自身在查询方面的效率。由此可见,本研究在大数据迁移与处理上具有明显的参考价值。
其他文献
随着我国林业产业体系不断完善,林业经济在我国经济体系中发挥的作用越来越重要,尤其是果林产业成为农村经济的支柱性产业之一,当前果林业发展面临的首要问题就是如何优化果树栽
本文以中国上市公司2002-2004年度的高管人员报酬数据为基础,对高管人员的报酬业绩敏感度与风险之间的关系进行了实证分析。结果表明,中国上市公司高管人员的报酬与公司绩效
目前学界既成的文化软实力概念,主要是对文化外显力量的形式指称,对文化内在力量的关涉极少。建设文化软实力的相应举措,也几乎都是从文化软实力概念的要求入手,是偏重于文化
在20世纪80年代,英国的哮喘死亡率持续上升,1988年达到了高峰,而在90年代则呈下降趋势。但急性重症哮喘的住院率并未下降,有关哮喘死亡、潜在性致死性哮喘及哮喘住院情况的研究表
在马克思的经典著作中,虽未直接提出历史唯物主义的概念,但是这些经典著作却蕴含着丰富的历史唯物主义创新思想。相较于传统哲学思想,马克思的历史唯物主义具有理论的创新性