论文部分内容阅读
聚合k最近邻查询处理技术是近年来数据库领域的一个研究重点与热点,传统的聚合k最近邻查询主要关注欧式空间,并用欧式距离来度量对象之间的邻近关系。路网中的邻近关系不能简单地用欧式距离来度量,所以,现有欧式空间中的查询处理技术不能直接用来解决路网环境中的查询处理问题。另外,在高度动态的路网环境下,对象的位置会随着时间发生改变,要求连续地监控聚合最近邻的情况。为了应对上述挑战,本文研究了路网环境下聚合k最近邻查询及变体处理技术,在给定一组查询点和一组兴趣点的条件下,实时地返回离查询点聚合距离最近的k个兴趣点。当前最好的路网环境下聚合k最近邻查询算法是BUA算法,然而该算法在查询过程中需要遍历整个路网,导致了庞大的CPU时间消耗。另外,在实际应用中,传统的路网环境下聚合k最近邻查询已不能满足一些需求,这些新的应用需求为传统的路网环境下聚合k最近邻查询带来了新的挑战。 鉴于此,本文着重研究了路网环境下聚合k最近邻查询及其变体处理技术,主要包括以下几个方面: 1.首次提出了安全区域的概念,为解决路网环境下连续聚合最近邻查询这类问题开创了一种新的思路,极大地提高了这类查询的效率。 2.利用新颖的剪枝策略和高效的聚合距离计算方法,提出了SR-CAkNN算法,有效地解决了路网环境下聚合k最近邻查询问题。 3.首次引入了路网环境下聚合k最近邻监控问题,并给出其形式化定义及其特性;提出了案SR-CAkNNM算法有效解决了这类查询问题。 4.分析了提出算法的正确性和时间复杂度,并通过在真实数据集上的大量实验评价了所提出算法的性能。