论文部分内容阅读
GPS终端会定时地向出租车的调度中心发送一些实时状态信息,比如出租车的经度、纬度、出租车的行驶方向和是否载客等信息。随着时间的推移,出租车公司收集并保存了海量的出租车轨迹数据。现如今,越来越多的人投入到挖掘这些数据的行列之中,使其成为了当前城市交通大数据的研究热点之一。出租车轨迹数据的挖掘、分析与利用,为发现和解决城市问题提供了新方法和新思路。本文以北京市出租车轨迹数据为基础,挖掘载客热点区域,分析上下客点的时空分布特征,结合居民出行需求研究载客热点区域的居民出行规律,以及热点区域之间具有相同起止点的轨迹分析。具体包括:第一,出租车轨迹数据预处理。运用SQL Loader方法将轨迹数据导入Oracle数据库,通过设定轨迹的提取规则和方法,对轨迹中存在的冗余数据、无效数据、漂移点进行过滤并编写了轨迹点与道路的匹配算法,对实验中的数据进行了道路匹配使每个轨迹点都有与之对应的道路信息。第二,一次载客模型的提出与建立。根据本文的研究目标提出了一次载客模型,认为上客-载客行驶-下客这一过程为完整的一次载客,去除出租车空车行驶的部分,只保留出租车载客运营的部分。针对一次载客模型进行了数据组织结构设计和形式化表达,并以此模型为基础对原始轨迹数据进行提取和整理,建立了针对分析和应用目标的一次载客模型轨迹数据库,为轨迹数据的挖掘奠定了基础。第三,基于DBSCAN聚类的热点提取与可视化。首先提取了出租车上下客点数据,并根据网络上的统计信息预先建立热点库,接着按照日出行总次数以及各小时出行次数对日出行总量进行统计,在此基础上运用DBSCAN聚类算法生成不同时间段的上下客热点。采用ArcGIS软件中的核密度聚类分析对热点区域进行了二维热力图及三维热力图的可视化展示。第四,相同起止点的轨迹分析与可视化。首先根据一次载客模型提取具有相同起止点的轨迹并编写了轨迹化简算法对轨迹进行了化简,再以轨迹片段的匹配距离作为度量轨迹相似性的基础,对提取出来的轨迹进行相似性分析,得出从西直门商圈到金融街商圈的热点路径:西直门→西二环→金融街商圈,并对热点区域之间的热点路径进行了动态可视化展示。