车联网海量数据分析方法的研究

来源 :福州大学 | 被引量 : 1次 | 上传用户:sddhyyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车联网利用智能交通、移动互联网、物联网等多个领域的技术,对车辆与交通状况进行监测,实现了车、路、人三者之间的信息交互,极大地提高了交通效率和交通安全。在车与路、车与车、车与人的交互过程中会产生大量的数据,因此需要对车联网海量数据进行分析,过滤其中无效的数据并从中提炼出有价值的信息。数据分析过程包括异常检测、关联挖掘等,由于车联网工作环境复杂且不稳定导致采集到的数据中存在着大量的异常数据,因此本课题重点研究车联网的异常数据检测。本文首先研究了车联网的交通数据采集技术,在车联网各式各样的数据采集技术中,基于GPS的数据采集技术因具有实时、全天候采集数据的优势而被广泛地应用于车联网中,然而该数据采集技术需要用户在车辆上装载GPS设备,导致系统的投入与维护成本较大。随着智能设备的发展与普及,目前绝大多数的智能手机都配备了各种传感器,本文设计了一种数据采集方法,通过对Android系统、手机传感器与百度地图SDK的运用,以较低的成本实现了车辆实时交通数据采集与数据上传功能。其次针对车联网的数据质量问题,传统的异常数据检测算法需要数据样本满足正态分布。而在实际生活中,由于驾驶行为和车辆性能的随机性,车联网的数据并不一定服从正态分布。在此情景下,若仍采用传统的异常数据检测算法,检测效果较差。核密度估计能直接从数据样本中估计概率密度,而不依赖对数据分布的任何假设,因此本文提出了一种基于核密度估计的异常检测算法。然而在实际的仿真过程中,核密度估计存在着边界效应问题,针对此问题本文对算法进行了改进,使其能在指定区间范围内对数据的概率密度分布进行有效的估计,并将改进的核密度估计算法应用于车联网的异常数据检测中。最后,结合实际采集到的交通数据利用Matlab软件对算法的检测率和误检率性能进行仿真分析,仿真结果表明该算法能够较好的解决基于拉依达准则的异常数据检测算法存在的误检率偏高和检测率不稳定的问题,具有较好的检测效果。
其他文献
中国人民银行新一轮非对称降息对我国商业银行产生的影响包括:存款利率定价差异化进一步加剧,存款流失加速,银行净息差被挤压,引发敏感性缺口。基于预期收入理论对商业银行盈
目的:为临床合理应用类风湿关节炎(RA)常用药物提供参考。方法:检索关于RA常用药物及其不良反应的文献,进行归纳、总结。结果与结论:治疗RA的常用药物主要包括化学药、中药及
在线材生产中,配模的合理与否对产品质量、模具寿命、拉丝轮磨损有着重要影响。本文主要介绍滑动式拉丝机的配模原则和计算方法。
对催化裂化汽油色谱模拟蒸馏方法进行了改进,用改进前后的方法做了大量的对比实验,结果表明:改进后的方法用于催化裂化汽油模拟蒸馏分析,不仅减小了对色谱仪的损耗、延长了色
随着电子商务的快速发展,"海淘"一族悄然兴起,其大多为年轻且乐于追求高品质的生活的中产白领。"海淘"一族在享受国外高品质商品的同时也促进了中国跨境电商企业的发展,中国
浙东抗日根据地,是抗日战争时期中国共产党领导的19个抗日根据地之一,对坚持华中敌后乃至全国抗日战争的胜利,具有战略支点的意义。一、新四军离浙的经过1935年2月,党中央电
<正>2006年,南通蓝印花布博物馆申报的"南通蓝印花布印染技艺"被列入"首批国家级非物质文化遗产名录",馆内的明清染坊,继承着这一古老的印染工艺,南通也被命名为"中国蓝印花
分析和预测了中国天然气市场特征和发展前景。根据中国国情以及天然气工业与市场的不断发展,积极分析了中国天然气市场在将来发展过程中的策略。
氧化钼是一种n型半导体金属氧化物,具有优良的物理及化学性质,已广泛的应用在超级电容器、催化剂、气体传感器、锂离子电池等研究领域。目前,氧化钼纳米材料的研究多集中在低
为进一步厘清山西煤中有害微量元素的分布与富集规律,在综合前人研究的基础上,分析了山西煤中4种常见有害元素氟、氯、砷、汞的分布特征和富集规律。研究发现,山西煤中有害元