论文部分内容阅读
交通出行信息是现代复杂背景下进行交通规划、交通管理等的重要准备和必要前提。传统方法通常采用几年一次的采样率在5%以内的抽样调查来获取数据,后来出现了线圈、RFID、视频等定点采集手段。前者调查周期长、成本高,且依赖于被调查者记忆的准确性,不够准确。后者需要安装设备,成本高、损毁率高,且数据质量依赖于设备布设情况,难以反映全网出行情况。随着互联网时代的到来和智能手机的普及,手机数据(信令数据、账单数据和三角定位数据)体现出了巨大的优势。一方面,4G技术使得手机数据的质量有了大幅提升,手机数据原本就具有的全时空覆盖特性更为明显,可以轻松得到全时段全区域的用户信息;另一方面,手机数据来源于移动通信运营商的日常运营数据,无需额外布设设备,在手机普及率越来越高的今天优势明显。基于上述考量,本论文充分利用手机数据的全时空特性,对苏州市全市的出行需求和出行模式进行了提取。首先,本论文充分调研了目前城市交通现状和手机终端使用情况,在研究了现有交通数据采集技术、OD估计和出行模式提取方法的基础上,总结了现有研究的不足,并提出了本次研究的方向,基于4G信令数据和三角定位数据提取城市层面的出行生成、出行分布和出行模式。其次,在回顾了移动通信的发展后,简要介绍了移动通信技术与定位技术的特性,为手机数据的优势和存在的问题做了铺垫。随后详细陈述了4G信令数据、三角定位数据和地图等数据的特点。在第三章的最后部分,重点介绍了本次研究的必要前期处理方法:基站与交通小区映射方法和空间索引构建方法。在划分基站服务范围时,本文采用了泰森多边形方法,之后通过交通小区与泰森多边形的重叠关系确定分配比例。考虑到Hive平台数据操作的计算效率,本论文采用了网格加R树的混合空间索引方法,对研究区域划分等距网格并建立多级索引,从而极大降低了后续算法的时间复杂度。之后,通过对苏州市两个交通小区早高峰期间交通吸发量提取的示例,介绍了利用4G信令数据提取出行生成信息的方法。该方法和传统的交通调查和人工计数方法相比,极大地降低了人力和物力,可以得到更准确全面的信息,优势明显。随后,基于4G手机信令数据,采用阈值法估计手机用户出行OD。采用试错法尝试不同基站停留时长阈值-基站切换时长阈值组合下得到的人均日出行量,将结果与同年苏州市进行的出行调查的结果进行对比,从而确定最佳阈值。在此基础上进行延伸,将该方法应用于苏州市职住分析,对用户居住地和工作地进行了研究,并统计了各行政区之间的通勤出行量。该结果可以指导区域交通规划,对于改善干道拥堵等问题可以起到指导作用。接着,利用三角定位数据位置精度高的特点,研究了出行模式提取方法。首先对漂移数据、乒乓数据和冗余数据进行了清洗,通过数据来源基站判断是否是地铁模式出行。随后,设定非直线阈值和慢行阈值,判定慢行交通、公共交通和小汽车出行,并判定用户每天主要出行模式。用户高频使用手机的现状可以在一定程度上弥补三角定位数据时空覆盖率低的缺陷,且地铁模式的精准识别也可以给此类研究带来一些新的思路。最后,对本论文的主要研究成果和创新点进行了总结,并提出了一些可以提高的方向。本文利用手机数据全时空覆盖的特性,提出了城市交通出行需求估计和出行模式识别方法,对于全面把握城市交通现状,准确刻画区域间交通联系有重要意义。