论文部分内容阅读
随着基于地理位置信息的服务技术的发展,与此相关的服务也在迅速发展,如基于位置信息的广告推送、外出旅游的路径导航、交通堵塞车辆管理等。这些服务普遍基于对未来位置的预测技术,目前的研究多集中在对于轨迹数据的挖掘和分析,及对于轨迹数据中带有的信息内容进行研究,对于位置预测相关的技术仍需深入探索,对于提升基于位置信息的服务具有重要意义。 本课题开展基于地理位置信息的用户出行方式及未来位置预测的分析与研究,研究相关算法,使其对用户日常出行方式进行识别,同时挖掘位置轨迹与语义轨迹的频繁模式,并结合两者对将来位置进行预测。主要贡献如下: 1.调研了用户日常外出行为活动中出行方式识别的算法,分析了现有算法的局限性,提出了一种适应大数据量、高精度的轻量级分类识别方法EasiTMC,该方法利用GPS数据和三轴加速度数据,并结合粗细分类两阶段模型,对走路、跑步、骑自行车、坐公交车、坐汽车5种模式进行识别。实验表明,EasiTMC精确度能达到92%。同时本模型在对不同用户进行模式识别和在日常生活中进行识别的两种不同场景下,平均精确度达90%,可知模型不仅有较高的精确度,同时还具有较强的泛化能力。 2.为了对相似习惯用户进行行为活动挖掘和分析,本文提出了一种结合语义及位置轨迹的频繁模式挖掘算法,将位置轨迹语义化,并根据语义轨迹集合挖掘频繁模式集合并建立语义模式树,同时对相似用户的位置轨迹也建立频繁模式集合和位置模式树,最后对两种集合进行加权并对目标轨迹进行位置预测来验证模型的有效性。在实验中,我们得到当结合语义信息和位置信息时,平均精确度能达85%,而没有结合语义信息时的精确度为81%,因此结合语义轨迹可提高模型精确度。 3.基于位置信息的服务技术都与位置预测相关,因此本文在未来位置预测方法方面,提出了一种结合出行方式和频繁模式的位置预测算法,该算法将对未来出行方式进行识别,同时结合历史出行方式和历史位置轨迹,建立隐马尔可夫模型对未来位置进行预测。实验表明,对结合出行方式和不结合出行方式的两种算法的分析结果进行比较可得,本模型精确度能够达到86%,高于没有结合出行方式的精度。同时,本模型在不同的频繁模式支持度下都比另一方法精确度要平均高出5%,因此本模型对位置预测结果的提高具有有效性。