论文部分内容阅读
随着城市化进程日益加剧,机动车数量激增,早晚高峰道路拥堵已成为困扰我国大中小城市交通出行的首要顽疾,严重降低了居民的幸福指数。通勤人群作为城市早晚高峰出行的主力军,深入挖掘和分析公交通勤出行的特征规律和时空特性,感知通勤出行环境特点,对提升公交通勤服务水平,诱导客流转移,缓解高峰拥堵具有重要意义。目前公交通勤出行研究多借助调查问卷数据,无法掌握真实的通勤出行特征与客流规律,而基于刷卡数据的通勤研究,通勤识别方法简单,提取结果不准确,特征分析不深入。为此本文以多源公交数据为数据基础,提出了两种新颖、高效、准确的通勤识别方法,对通勤出行特征和出行环境进行深入分析。具体研究内容如下:(1)多源公交数据处理层面,针对GPS报站数据缺失和IC卡刷卡系统与GPS系统时钟不一致等问题分别给出相应解决方法,然后利用数据融合技术,给出上车站点匹配、下车站点推断、换乘站点识别的具体步骤和方法,还原得到乘客公交出行轨迹的OTD数据,为之后通勤识别和特征分析打下基础。(2)基于机器学习算法通勤识别模型,首先进行特征工程,选择最佳识别特征并给出各属性特征值处理方法,然后据此制定调查问卷获取训练数据,选择与之最佳的机器学习算法,利用改进代的价敏感性GBDT(梯度提升决策树)算法训练分类模型,最后从真实刷卡数据中提取相应特征,代入模型完成通勤识别。(3)基于闭合出行链的通勤出行提取,首先给出闭合公交出行链的定义,构建基于OTD的出行拓扑图,然后进行深度优先的闭合环路搜索和相似性关联,从不完全、片段化出行轨迹信息中完成闭合出行链的提取,并从通勤出行时间和空间规律出发,制定筛选规则完成通勤提取。最后对两种通勤提取结果和方法优缺点进行综合对比分析。(4)通勤出行特征研究层面,首先基于提取的公交通勤结果,从出行链角度分析其特征规律,并对其出行时间和空间特性进行分析,然后针对出行主要考虑因素—通勤时间,建立通勤时间影响模型,对选取各因素影响程度进行分析,给出具体改善意见。论文以珠海市源公交数据为基础,利用Python、Mysql数据库、ArcGIS、Spss等工具,从真实刷卡数据中完成了公交通勤的精确提取和特征的多层次分析,为公交通勤出行的研究提供了新思路。