论文部分内容阅读
随着多种定位设备的普及,基于位置的服务(Location Based Services,LBS)已经广泛存在。尽管有了一些关于频繁模式挖掘的理论,但是还没有研究室内环境的。因此,针对室内移动对象轨迹频繁模式挖掘的研究工作显得尤为重要和迫切,以更好地为用户提供更加优质的位置服务。
本文借鉴参考现有的经验,同时考虑到室内空间与室外空间的差异性,针对室内环境下的移动对象,对其做如下研究:
(1)为改善传统的频繁模式挖掘算法存在的时间效率低下的缺陷,本文提出了基于字典树的改进算法IAA-DT。该方法首先遍历数据库中的所有轨迹并将其添加到字典树中,同时维护所有链接列表;然后,利用字典树的高度可压缩性,通过被维护的链表直接在字典树上完成修剪和计数操作;最后,为保证评价的客观性和有效性,在相同条件下,对所提新算法与现有的相似算法进行比较和分析。实验结果表明,IAA-DT不仅具有更高的时间效率,而且体现了更好的性能。
(2)室内空间是介于欧式空间和道路网络之间的,这给近似位置的表示带来了一定的困难。网格划分法是解决这一问题的一种可行方法,但它会导致一个尖锐的问题——网格边界。针对室内轨迹频繁模式挖掘,本文提出了基于垂直投影距离的网格划分方法VGS和基于模糊网格序列的轨迹频繁模式挖掘算法VGS-PrefixSpan。首先,根据垂直投影距离的值将每个网格分成准确的区域和模糊的区域;然后,将轨迹转化为模糊网格序列;最后,轨迹频繁模式是根据VGS-PrefixSpan从模糊网格序列中挖掘出来的。实验结果表明,在相同的准确区域和模糊区域的面积比下,本文所提的VGS-PrefixSpan算法具有更好的性能和更高的挖掘效率,并且在任何最小支持度下,该算法的挖掘效果始终更胜一筹。
(3)在室内移动对象轨迹频繁模式挖掘的基础上,本文提出了一种新颖的基于稳定性值的停留区域发现算法SV%DSA。首先,由两点间的距离和速度计算出稳定性值,通过比较稳定性值与阈值的大小,判断这两点是否处于稳定状态;然后对处于稳定状态的点进行扩展,从而识别出移动轨迹中的停留区域;最后,增加时间属性,引入差距值这一概念,提出一个改进的算法T-状PTICS (Time-%ased状PTICS),在已发现的停留区域中检测出异常位置点。考虑到轨迹中的异常现象可能会导致用户的私密性降低,本文又提出了基于频繁模式的假轨迹隐私保护法DTPP-TFP来保护室内移动对象的轨迹隐私。利用生成工具Vita,证实了本文所提算法的有效性。
本文借鉴参考现有的经验,同时考虑到室内空间与室外空间的差异性,针对室内环境下的移动对象,对其做如下研究:
(1)为改善传统的频繁模式挖掘算法存在的时间效率低下的缺陷,本文提出了基于字典树的改进算法IAA-DT。该方法首先遍历数据库中的所有轨迹并将其添加到字典树中,同时维护所有链接列表;然后,利用字典树的高度可压缩性,通过被维护的链表直接在字典树上完成修剪和计数操作;最后,为保证评价的客观性和有效性,在相同条件下,对所提新算法与现有的相似算法进行比较和分析。实验结果表明,IAA-DT不仅具有更高的时间效率,而且体现了更好的性能。
(2)室内空间是介于欧式空间和道路网络之间的,这给近似位置的表示带来了一定的困难。网格划分法是解决这一问题的一种可行方法,但它会导致一个尖锐的问题——网格边界。针对室内轨迹频繁模式挖掘,本文提出了基于垂直投影距离的网格划分方法VGS和基于模糊网格序列的轨迹频繁模式挖掘算法VGS-PrefixSpan。首先,根据垂直投影距离的值将每个网格分成准确的区域和模糊的区域;然后,将轨迹转化为模糊网格序列;最后,轨迹频繁模式是根据VGS-PrefixSpan从模糊网格序列中挖掘出来的。实验结果表明,在相同的准确区域和模糊区域的面积比下,本文所提的VGS-PrefixSpan算法具有更好的性能和更高的挖掘效率,并且在任何最小支持度下,该算法的挖掘效果始终更胜一筹。
(3)在室内移动对象轨迹频繁模式挖掘的基础上,本文提出了一种新颖的基于稳定性值的停留区域发现算法SV%DSA。首先,由两点间的距离和速度计算出稳定性值,通过比较稳定性值与阈值的大小,判断这两点是否处于稳定状态;然后对处于稳定状态的点进行扩展,从而识别出移动轨迹中的停留区域;最后,增加时间属性,引入差距值这一概念,提出一个改进的算法T-状PTICS (Time-%ased状PTICS),在已发现的停留区域中检测出异常位置点。考虑到轨迹中的异常现象可能会导致用户的私密性降低,本文又提出了基于频繁模式的假轨迹隐私保护法DTPP-TFP来保护室内移动对象的轨迹隐私。利用生成工具Vita,证实了本文所提算法的有效性。