面向大规模GPS轨迹数据的并行化地图匹配方法研究

来源 :长安大学 | 被引量 : 4次 | 上传用户:tonghuasong00000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
轨迹数据挖掘是当前智能交通领域的一个研究热点,其中路径导航、交通出行行为分析等研究需要含有路段信息的轨迹数据。而出租车车载GPS装置采集到的GPS轨迹数据中无车辆所属路段信息,且轨迹点的经纬度坐标有误差。地图匹配算法可以在路网数据中匹配到轨迹点所属的路段,从而对该轨迹点的经纬度坐标进行校正。因此,地图匹配方法研究是轨迹数据挖掘中一项必要的基础研究内容。传统的面向GPS轨迹数据的地图匹配方法通常主要考虑匹配结果的准确度,而忽视了匹配效率。而随着机动车数量的快速增长,轨迹数据呈现出爆炸式增长的趋势。在此情况下,传统地图匹配方法匹配效率低下,大规模轨迹数据的地图匹配效率问题亟待解决。因此,本文提出一种面向大规模GPS轨迹数据的并行化地图匹配方法。本文的主要研究内容如下:(1)大部分地图匹配算法根据当前轨迹点在各路段的投影距离是否小于预设的距离阈值来判断该路段是否属于当前候选路段集合,在面对大规模轨迹数据集和大范围路网时,上述候选路段集合选取方法比较低效。提出一种基于GeoHash编码的分布式网格地图索引方法,该方法能够有效提升候选路段集合选取的效率。(2)面对海量的车辆轨迹数据,传统的地图匹配算法的计算效率已经无法满足相关研究工作的需要。为改善这一问题,提出了一种并行化地图匹配方法。并提出了一种基于时间标签的分区策略,有效改善了并行地图匹配中的数据倾斜问题。实验结果表明,所提方法在保证较高准确度的条件下,匹配吞吐率可达到8.54万条/秒。相对于文献中提出的一种基于Hadoop的并行化地图匹配算法,其运算速度提高了约33倍。(3)研究内容2所提的并行化地图匹配算法不能解决实时轨迹数据流的地图匹配问题,基于Structured Streaming计算模型,进一步提出了一种面向大规模轨迹数据的在线式地图匹配方法,在保证具有一定实时性的条件下,实现了地图匹配的流式处理。(4)提出了一种基于集成学习的出租车乘客候车路段推荐方法。首先,统计一定时间间隔内西安市各个路段上空载出租车的分布数量;然后,利用集成学习方法对西安市各路段未来一个时隙内空载出租车的数量进行预测;最后,根据预测结果为即将出行的乘客推荐最佳候车路段。
其他文献
调查研究$$2018年2月12日,习近平总书记在成都市郫都区战旗村考察时强调,要把发展现代农业作为实施乡村振兴战略的重中之重,把生活富裕作为实施乡村振兴战略的中心任务,扎扎实实
报纸
根据煤气化装置中最重要的设备--气化关键设备压力容器的制造实践,综合论述了该设备的主要制造工艺、检验和试验的要点.
用低粘度环氧树脂、不同稀释剂、填料、流平剂、消泡剂及不同类别的固化剂配制的固化物,经43%硫酸溶液30℃/120小时及60℃/120小时浸泡,考察质量变化率,选择合适的稀释剂品种
本文比较了日、美、中三国有关环境权司法保障的理论与实践,指出各国对环境权的保障属于间接保障模式。文章认为,在环境时代的背景下,应当实现从间接保障向直接保障模式的转
7种含益母草中成药中水苏碱的含量测定山东省中医药研究所250014张玲,于宗渊,李宝国,时延增,李岽益母草为唇形科植物益母草(LeonurushelerophyllusSweet)的干燥全草,是中医妇科的常用中药。据文献报道,益母草主要有效成
讨论了中国数学史的分期,认为元中叶以前的数学发展分成四个阶段:原始社会到西周时期的数学为中国数学的兴起;春秋至东汉中期的数学为中国传统数学框架的确立;东汉末至唐中叶
前不久,美国空军正式批准对其先进极高频卫星通信系统进行通信测试,并向盟国开放数据终端,加拿大成为首个使用该卫星进行通信的国际合作伙伴。这标志着历时多年的建设,先进极高频
期刊
“我们的工作靠的就是‘脑力风暴’,但是待在这种内部空间犹如格子间的集装箱里工作,既无阳光,也缺少对流,容易头晕目眩,很难有灵感和创意。”在某传统写字楼从事动漫制作公
目的探讨白细胞介素34(interleukin-34,IL-34)在类风湿关节炎(rheumatoid arthritis,RA)发病中的作用及可能机制。方法重组鼠(recombination mouse,rm)IL-34刺激胶原诱导的关