论文部分内容阅读
随着传感器技术进步和物联网的发展,各行各业信息系统产生的数据量急速增加,处理、分析数据的要求不断提高,大数据成为了当前研究的热点内容。交通领域是大数据产生的一个优良平台,大量交通信息系统积累了海量数据。车联网的出现及应用更是加快了数据产生的速度、丰富了数据的内容,加快了交通大数据的行成。在交通大数据快速发展的今天,如何利用交通大数据来解决交通管理中的问题,对交通信息系统提出了挑战。 伴随车辆检测是城市机动车管理中一个重要的问题。由于机动性强,机动车常常被犯罪分子作为作案工具和逃逸工具,成为威胁社会安定的重要因素。通过对涉案车辆行驶轨迹的分析,人们发现,嫌疑车辆在作案前后通常会出现伴随现象,即嫌疑车辆和多次伴随目标车辆经过多个卡口,或多台嫌疑车辆多次相互伴随经过多个卡口。虽然国内外学者针对此问题提出了一些解决方法,但尚未提出一个较为系统、完善的伴随车辆检测方法。 本文基于深圳市公安局机动车智能感知和防控系统要求,对大数据环境下的伴随车辆检测问题进行了分析和研究,将电子车证数据和视频采集数据作为基本数据来源,辅助以嫌疑人信息库,提出了一个基于数据挖掘方法的伴随车辆检测方案,并采用2011年深圳大运会电子车证的实际数据,对所提出的伴随车辆检测方案进行了验证。 本文的主要内容有以下几点: (1)分析了伴随车辆的特点,将伴随车辆检测问题划分为基于车牌和基于时间两种,提出了伴随车辆检测中存在的交叉伴随问题,并分别对这三种伴随进行了分析; (2)根据交通大数据的数据结构和伴随现象中车辆的行为特点,提出了利用数据挖掘中经典算法Apriori,使用频繁项集方法在历史数据中进行伴随车辆检测的方法; (3)根据交通大数据的数据更新特点和数据流特点,提出了在历史数据挖掘的基础上加入实时检测触发函数的伴随车辆检测方法。这样,新的交通数据可以实时加入到原有数据中,当数据变化满足触发条件,实时检测伴随车辆; (4)在交通大数据分布式环境下,基于MapReduce计算模型对伴随车辆检测算法进行了分布式改进,使得算法在分布式环境下也能处理伴随车辆检测问题; (5)实现了所提出的伴随车辆检测算法,利用真实数据对算法进行了检验。结果表明所提出的算法可以有效地解决交通大数据中伴随车辆检测问题。