时空数据分布式存储研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:zuozqzq7013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时空数据是一种多维数据。它的结构异常复杂,具有空间和时态特性。它能够详细的记录事物空间状态和时空变化,并能正确显示对象过去、现在、未来的状态。在科技快速发展的时代,采集数据的设备种类越来越多,数据的数量也快速增大,从而导致数据存储管理困难。而时空数据存储管理模块设计实现的优劣决定着整个数据管理系统的工作能力。因此又会影响到其它上层的应用系统运行效率。随着分布式框架的提出,它的高效并行计算能力、大容量存储、高扩展、高稳定等优点吸引着我们。本文在前人研究的基础上对时空数据分布式存储进行了探索研究。本文先从时空数据和分布式理论着手,研究相关部分的技术及原理,提出一种基于R树的时空索引,然后以开源云平台Hadoop的HBase为数据库载体,利用Map Reduce高效计算能力对时空数据进行管理,最后通过一些实验验证索引性能。主要研究内容如下:1)深入地分析了经典时空数据模型及时空索引的优缺点;简要分析了分布式平台的特点及相关技术,为论文研究提供理论和技术支撑。2)系统分析了开源云平台Hadoop的核心组件Map Reduce并行计算框架、HDFS分布式文件存储系统、以HDFS为载体的列式键值数据库HBase的数据模型。针对时空数据数据量大等特点,提出了利用HBase大表来存储管理时空数据。结合时空数据与HBase的特性,详细阐述了建表过程以及如何设计行键、定义列族。3)根据当前出现的时空数据索引,提出了一种在R树的基础上构建时空数据索引,该索引将过去和现在时间的数据分别存储,在各自的树中分别管理着起始及结束时间,提高树的利用率来提高查询效率。最后进行了对比实验,测试本文提出时空索引的插入及查询效率。4)最后通过GPS模拟器生成实验数据,然后存储在HBase进行管理。
其他文献
<正>判断家具尺寸是否合适,最好的方法是多试、多问,也可根据个人情况,找厂家定做。沙发沙发座前宽不小于480mm,座面深度应在480~600 mm间,座面高度应在360~420mm的范围内。如
量子信息学是以量子力学为基础的信息理论,是信息理论和量子理论的交叉学科,它为信息科学的发展提供了崭新的原理、方法和途径。量子信息远程传输是量子信息领域研究的主要课
采用滚筒式间接加热设备,在50~450℃加热温度和30 min停留时间实验条件下,测试了焦化厂污染场地低含量(S1)和高含量(S2)PAHs污染土壤中16种PAHs的热脱附效率和残留量的变化,
目的:探讨影响南宁市孕产妇死亡率的主要因素,提出降低孕产妇死亡率的干预措施及对策。方法:对南宁市2012—2016年孕产妇死亡监测资料进行回顾性分析。结果:2012—2016南宁市
火灾是现在社会中最为常见的一种灾害现象,它具有极强的杀伤力和破坏力,可以对人民群众的生命和财产安全造成巨大的威胁。火灾的发生,不仅会为社会或个人带来巨大的经济损失,
<正> 赌博起源于人类的嬉戏娱乐。吴地的博戏,可追溯到春秋时期吴王夫差与美女西施在宫中的斗草游戏,但因为这种博戏只有胜负之分,而没有将输赢与利益、财富、金钱挂钩,故只
宛梆作为一种濒临失传的稀有剧种,其唱腔之委婉,细腻,高亢,激越令听者为之动情,尤其是它的花腔陡峭并具有光彩,本文对宛梆进行技术上的分析和心理上的阐释,试图对这一濒灭剧
[目的]通过对体外培养的SD大鼠颅底蝶枕软骨联合细胞(cranical base spheno-occipital synchondrosis chongdrocyte)进行牵张应力刺激,观察不同大小及不同作用时长张应力刺激
电化学传感器因其响应快速、高效、便捷、实用等优点被广泛应于环境监测。本文利用多种增敏材料和具有特异选择性的分子印迹聚合物制备了四溴双酚A(TBBPA)分子印迹电化学传感器,并探究了用于TBBPA特异性检测的分析方法,其具体内容如下:采用电聚合的方法合成分子印迹聚合物(MIPs)和金纳米粒子-多壁碳纳米管(AuNPs-MWCNTs)纳米复合材料共同修饰玻碳电极(GCE),制备出了高灵敏度、低检测限、
《岁月无声——瑶都江华系列》水彩画创作题材,源于自己对家乡的一种眷念之情。在经济和社会科技快速发展的今天,文化趋向多元化,瑶都少数民族地区从生活到精神文化上都面临