论文部分内容阅读
随着空间信息获取技术的不断发展以及地理信息需求的快速增加,促进了空间数据库技术的进一步发展。在不同领域的地理信息系统(GIS)应用中,空间数据的共享与集成仍然是当前的热点问题。网络要素服务(WFS)作为开放地理空间信息联盟(OGC)发布的标准之一,对空间数据共享的发展有重要意义,蕴含着巨大的发展前景。在分布式WFS条件下,环境的独特性、空间连接操作的复杂性、网络环境的限制性,是产生空间连接查询操作代价和网络传输代价的主要原因,严重影响了基于WFS的多路空间连接查询性能,制约了分布式WFS空间查询的发展与应用。如何有效降低多路空间连接操作代价、网络传输代价,从而提升多路空间连接查询的效率,是本文的主要研究内容。 二路空间连接查询作为多路空间连接查询的基础,其核心问题在于选择率和过滤率的估算,而估算的精度直接影响空间连接查询代价的估算。目前,直方图法是估算选择率常用的手段之一。在空间查询连接操作中,根据参与运算的空间数据集是否存在索引一般分为三种情况,对非索引的空间数据集,通常使用空间划分方法处理。本文对四叉树直方图法进行了改进,并结合DSJ(直接下载法)策略和SQ(结构四叉树)策略各自的优势,对空间划分后的子区域进行自适应下载。实验结果表明,选择率和过滤率的估算精度有了一定提高,并随着估算精度的提高,空间查询操作响应时间也随之加快。 解决多路空间连接查询效率问题的关键在于确定一个合适的执行次序。本文针对分布式 WFS服务的多路空间连接查询,提出了一种基于最高过滤率的多路空间连接查询优化策略。该策略的主要思想是优先执行过滤率最高的连接,将查询图分解成多个二路空间连接的级联,以寻求最佳的执行计划。本文以链型的四路空间连接查询图为例进行实验设计,详细介绍了优化策略的执行过程,并与直接下载策略和顺序下载策略作比较。实验结果表明,随着参与运算的空间匹配对数量的增加,整体的执行时间也在增加,但是优化效果也越明显,即只有当查询区域的空间要素总数大于一定数量时,优化策略起到的作用才比较明显。将三种策略的实验结果作比较,结果显示大多数情况下优化策略消耗下载时间最短,直接下载策略消耗时间最长,在75次测试试验中,该策略起到优化效果的比例达到了88%。总体而言,本文提出的优化策略在多大数情况下能够提高多路空间连接查询的执行效率。