论文部分内容阅读
车联网利用智能交通、移动互联网、物联网等多个领域的技术,对车辆与交通状况进行监测,实现了车、路、人三者之间的信息交互,极大地提高了交通效率和交通安全。在车与路、车与车、车与人的交互过程中会产生大量的数据,因此需要对车联网海量数据进行分析,过滤其中无效的数据并从中提炼出有价值的信息。数据分析过程包括异常检测、关联挖掘等,由于车联网工作环境复杂且不稳定导致采集到的数据中存在着大量的异常数据,因此本课题重点研究车联网的异常数据检测。本文首先研究了车联网的交通数据采集技术,在车联网各式各样的数据采集技术中,基于GPS的数据采集技术因具有实时、全天候采集数据的优势而被广泛地应用于车联网中,然而该数据采集技术需要用户在车辆上装载GPS设备,导致系统的投入与维护成本较大。随着智能设备的发展与普及,目前绝大多数的智能手机都配备了各种传感器,本文设计了一种数据采集方法,通过对Android系统、手机传感器与百度地图SDK的运用,以较低的成本实现了车辆实时交通数据采集与数据上传功能。其次针对车联网的数据质量问题,传统的异常数据检测算法需要数据样本满足正态分布。而在实际生活中,由于驾驶行为和车辆性能的随机性,车联网的数据并不一定服从正态分布。在此情景下,若仍采用传统的异常数据检测算法,检测效果较差。核密度估计能直接从数据样本中估计概率密度,而不依赖对数据分布的任何假设,因此本文提出了一种基于核密度估计的异常检测算法。然而在实际的仿真过程中,核密度估计存在着边界效应问题,针对此问题本文对算法进行了改进,使其能在指定区间范围内对数据的概率密度分布进行有效的估计,并将改进的核密度估计算法应用于车联网的异常数据检测中。最后,结合实际采集到的交通数据利用Matlab软件对算法的检测率和误检率性能进行仿真分析,仿真结果表明该算法能够较好的解决基于拉依达准则的异常数据检测算法存在的误检率偏高和检测率不稳定的问题,具有较好的检测效果。