论文部分内容阅读
随着移动互联网的兴起,位置信息的价值也愈发突显,利用海量位置数据分析用户的行为,解释人们的活动规律,挖掘顾客的潜在价值越来越受到人们的关注。得益于卫星定位和测绘技术的发展,室外定位已经有了较为稳定成熟的解决方案,关于用户在室外的行为研究也日臻成熟。而由于室内环境复杂,目前还没有统一稳定的技术手段,获取到的室内行为知识也有限。另一方面有数据表明,人们有80~90%的时间在室内环境中度过,在室内留下了大量的足迹。因此,近年来许多公司看中了室内定位数据的巨大市场,在其中投入了大量的研究,使得室内定位和相关的数据分析如雨后春笋般涌现。 针对室内定位数据中存在的问题,本文研究了提取语义轨迹的理论和方法,能够在减少错误、压缩原始轨迹的同时,增强轨迹的表达能力,使得更深入的轨迹数据挖掘成为可能。具体来说,本文的主要研究内容和创新成果包括: (1)利用现有的IFC几何模型,实现了室内空间模型的自动化构建,扩充了模型的输入来源,同时提出了空间索引和离线距离矩阵组合的混合索引方法,优化了最小室内移动距离的计算。 (2)利用轨迹的时空特性,在DBSCAN的基础上,提出了基于时空密度的事件提取算法,并引入了区间调度算法解决了聚簇中存在的事件冲突问题,能够有效提取轨迹中发生的主要事件。 (3)开发了一套室内定位数据分析工具集,能够以可视化的方式调整语义轨迹提取算法,并在真实数据集合模拟数据集上验证了算法的有效性。