空间数据仓库关键技术的研究与实现

被引量 : 35次 | 上传用户:qf125228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着空间数据获取手段的不断丰富,已经有越来越多的空间数据存储在空间数据库、地理信息系统或其它面向对象数据库中。如何有效地利用和组织管理这些空间数据以支持空间分析和决策是一项迫切的研究任务。 传统数据仓库在处理空间数据时有很大局限,首先由于空间信息数据量比较大而且空间层次的划分比较复杂,如果将空间信息引入到维中,传统数据仓库将无法灵活地处理空间维;其次传统空间数据仓库只支持数值型度量,无法支持空间类型度量,通常把它们泛化为非空间数据进行处理,丢失了很多空间特性。 根据数据仓库的成功经验,无疑构建空间数据仓库可以解决很多传统数据仓库无法解决的难题,有效支持对空间对象的深层利用和分析,提供更加全面的决策支持。本文以大连市工商管理空间数据仓库系统和大连市基础空间信息交换平台为实际应用背景,围绕着空间数据仓库具备的特点,对空间ETL、空间区域聚集查询索引结构以及系统平台的构建及行业应用角度,对空间数据仓库进行了深入的研究。重点研究了以下内容: 1) 提出了基于地理编码和动态规划技术实现空间ETL的新方法,有效实现了空间ETL过程中空间数据和非空间数据的关联。设计了基于地理编码的空间ETL模块结构。为了提高地理编码中地址匹配的效率,引入了动态规划技术,将地址匹配问题转换为两个序列的全局匹配问题,根据初始条件和递归条件可以计算出两个字符串序列的相似分值,构造一个相似度矩阵或动态规划矩阵,根据此矩阵,通过动态规划回溯(Traceback)的方法获得字符串序列的最优匹配序列。并根据地址匹配的特点,对动态规划罚分方法进行了改进,实验证明了该方法的有效性。该方法在工商管理空间数据仓库建设中取得了较好的应用效果,并为自身系统中不包含空间数据的应用领域构建空间数据仓库,探索了可行的数据获取方法。 2) 提出了一个有效支持空间区域聚集查询的索引结构。构建空间数据仓库的代价明显高于传统数据仓库,研究有效的空间索引结构和相应算法以处理不同需求的空间查询和分析已经成为了空间数据仓库领域中的研究重点。本文借鉴aRB-tree结构在处理空间维和时间维的思想,基于aR-tree和aggregate cubetree构建了aCR-tree,实现空间维和非空间混合的区域聚集查询。其中,aggregate cubetree存储了非空间维的索引结构,aR-tree存储了空间维的索引结构,存储在aggregate cubetree节点中的指向aR-tree的指针确定了两者的关系。分析了本文提出的aCR-tree和aR-tree在时间渐进性能上的差异。通过实验,将该索引结构与基于传统技术实现的a3DR-tl℃e进行了比较,证明了该索引结构在存储空间和区域聚集查询方面的优势。 3)设计并实现了一个空间数据仓库系统原型,应用到了工商管理领域,并探索了在城市基础空间信息交换平台中的应用。在系统的实现中,基于组件GIS实现了数据仓库的空间功能扩展,其中主要包括地理编码组件、空间计算分析组件、地图展现组件;以分布式存储模式存储空间数据,将空间框架数据引入到了源数据范畴中,根据不同的需求分别存储在空间数据仓库和前端联机分析客户端中;采用数据立方体和空间聚集索引结构相互协作模式实现各类空间联机分析,充分利用了传统数据仓库成熟的建模和联机分析技术,以及空间聚集索引结构在空间层次结构上的灵活特性。同时在介绍本研究室数据仓库和GIS研究成果的基础上,介绍了空间数据仓库系统各主要模块的设计与实现方法。本文研究对其它领域的空间数据仓库建设也具有一定的借鉴意义。 综上所述,本文分别从空间ETL、空间区域聚集查询索引结构、空间数据仓库系统体系结构等方面对空间数据仓库进行了研究,在此基础上,设计并实现了一个空间数据仓库系统原型并成功应用于工商管理空间数据仓库系统和城市基础空间信息交换平台,为这些领域的决策分析和数据共享提供了有效的实现方式。关键词:空间数据仓库;空间联机分析处理;空间ETL;动态规划;地理编码
其他文献
总结157例胃镜下取病理活检术的护理经验,包括术前进行完善的术前准备及心理护理,术中进行熟练的护理配合,术后进行护理指导等.认为通过胃镜检查术全程精心护理,可以消除病人
通过对近几十年边界扫描技术文献的总结,本文首先阐述了该技术产生的背景以及发展现状。随着大规模集成电路的发展,纳米级制造工艺的使用,集成电路的封装变得越来越小。这些
本文系统研究了十三种金属离子掺杂TiO2粉末的掺杂机理,提出了掺杂离子和二氧化钛粉末之间的相互作用模型,从化学性质(掺杂离子的种类、掺杂浓度、离子半径、离子价态、离子电
关于宋词流派的论争由来已久,宋词在发展历程中是否形成流派,如果有,是在怎样一种层面上如何排列组合;如果没有,又该如何去理解历史上的种种流派理论,学人众说纷纭.解决这些
在教育教学工作中,中小学教师不断经历着身心疲惫、心力交瘁的感觉,不断感受到工作热情的减退以及自我评价的降低。这些问题源自于哪里?心理学界对此问题从“职业倦怠”的角
"初中生速读四级训练法"采用"四级训练,拾级而上"的流程运作,与中语教学同轨同步,并将速读训练置于"大语文观"统率下进行,始于课内,完成于课外。"四级训练"中,心理素质训练和
<正>己丑岁暮,雨窗展读唐韩《五牛图》(图1)。传世巨制,何人不知晓!然其深意须从画外探求。此图曾经元赵孟藏,赵题有三跋。其一(图2)云:"右唐韩晋公《五牛图》,神气磊落,希世
本文运用文献资料法、问卷调查法、数据统计法等研究方法,对宁波市11家壁球馆的经营现状进行调查研究。结果显示,壁球场地少、专职教练不足等因素制约壁球运动发展。
本文立足于丙烯聚合用催化剂的研究,系统地研究了氯化镁负载四氯化钛催化剂中内外给电子体、助催化剂和聚合温度对聚合行为,聚合机理,以及聚丙烯微观结构的影响。并采用高温凝胶
宋词流派的划分问题是词学界长期论争而至今圆未尚满解决的一个基本理论问题,自从明代提出婉约、豪放之分后,不同的说法纷纷出现.宋词流派研究总的趋势是走向精细化,但在某些