论文部分内容阅读
随着空间数据获取手段的不断丰富,已经有越来越多的空间数据存储在空间数据库、地理信息系统或其它面向对象数据库中。如何有效地利用和组织管理这些空间数据以支持空间分析和决策是一项迫切的研究任务。 传统数据仓库在处理空间数据时有很大局限,首先由于空间信息数据量比较大而且空间层次的划分比较复杂,如果将空间信息引入到维中,传统数据仓库将无法灵活地处理空间维;其次传统空间数据仓库只支持数值型度量,无法支持空间类型度量,通常把它们泛化为非空间数据进行处理,丢失了很多空间特性。 根据数据仓库的成功经验,无疑构建空间数据仓库可以解决很多传统数据仓库无法解决的难题,有效支持对空间对象的深层利用和分析,提供更加全面的决策支持。本文以大连市工商管理空间数据仓库系统和大连市基础空间信息交换平台为实际应用背景,围绕着空间数据仓库具备的特点,对空间ETL、空间区域聚集查询索引结构以及系统平台的构建及行业应用角度,对空间数据仓库进行了深入的研究。重点研究了以下内容: 1) 提出了基于地理编码和动态规划技术实现空间ETL的新方法,有效实现了空间ETL过程中空间数据和非空间数据的关联。设计了基于地理编码的空间ETL模块结构。为了提高地理编码中地址匹配的效率,引入了动态规划技术,将地址匹配问题转换为两个序列的全局匹配问题,根据初始条件和递归条件可以计算出两个字符串序列的相似分值,构造一个相似度矩阵或动态规划矩阵,根据此矩阵,通过动态规划回溯(Traceback)的方法获得字符串序列的最优匹配序列。并根据地址匹配的特点,对动态规划罚分方法进行了改进,实验证明了该方法的有效性。该方法在工商管理空间数据仓库建设中取得了较好的应用效果,并为自身系统中不包含空间数据的应用领域构建空间数据仓库,探索了可行的数据获取方法。 2) 提出了一个有效支持空间区域聚集查询的索引结构。构建空间数据仓库的代价明显高于传统数据仓库,研究有效的空间索引结构和相应算法以处理不同需求的空间查询和分析已经成为了空间数据仓库领域中的研究重点。本文借鉴aRB-tree结构在处理空间维和时间维的思想,基于aR-tree和aggregate cubetree构建了aCR-tree,实现空间维和非空间混合的区域聚集查询。其中,aggregate cubetree存储了非空间维的索引结构,aR-tree存储了空间维的索引结构,存储在aggregate cubetree节点中的指向aR-tree的指针确定了两者的关系。分析了本文提出的aCR-tree和aR-tree在时间渐进性能上的差异。通过实验,将该索引结构与基于传统技术实现的a3DR-tl℃e进行了比较,证明了该索引结构在存储空间和区域聚集查询方面的优势。 3)设计并实现了一个空间数据仓库系统原型,应用到了工商管理领域,并探索了在城市基础空间信息交换平台中的应用。在系统的实现中,基于组件GIS实现了数据仓库的空间功能扩展,其中主要包括地理编码组件、空间计算分析组件、地图展现组件;以分布式存储模式存储空间数据,将空间框架数据引入到了源数据范畴中,根据不同的需求分别存储在空间数据仓库和前端联机分析客户端中;采用数据立方体和空间聚集索引结构相互协作模式实现各类空间联机分析,充分利用了传统数据仓库成熟的建模和联机分析技术,以及空间聚集索引结构在空间层次结构上的灵活特性。同时在介绍本研究室数据仓库和GIS研究成果的基础上,介绍了空间数据仓库系统各主要模块的设计与实现方法。本文研究对其它领域的空间数据仓库建设也具有一定的借鉴意义。 综上所述,本文分别从空间ETL、空间区域聚集查询索引结构、空间数据仓库系统体系结构等方面对空间数据仓库进行了研究,在此基础上,设计并实现了一个空间数据仓库系统原型并成功应用于工商管理空间数据仓库系统和城市基础空间信息交换平台,为这些领域的决策分析和数据共享提供了有效的实现方式。关键词:空间数据仓库;空间联机分析处理;空间ETL;动态规划;地理编码