交通视频中物体定位与识别的泛型技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:pangpanghai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频图像上的物体检测与识别技术通常都依赖于目标物体在形状、外观特征上的先验知识。对于这些先验知识,我们可以进行人为分析来建立具体特征上的判别规则,而这样得到的判别规则往往缺乏扩展性。在现代应用中更可行的方案是使用机器学习技术在已知的数据上对物体特征进行归纳,以此对未知数据做出判断。而在图像内容分析上的另一难点则是基础图像数据与高层物体对象之间的“语义鸿沟”问题,尤其在交通视频的处理上,我们的目标不仅仅是处理图像上的边缘或纹理,而是对图像中的物体进行判定和识别。针对这些问题,本文对图像特征提取、物体模型表达、机器学习分类方法以及图像物体搜索等领域进行了多方面的研究,分析了适应不同需求的方法,并提出自己的改进。   在图像特征提取上,本文首先回顾了灰度直方图、梯度等基础图像处理技术的特点及其在物体检测应用中的缺陷,在此基础上详细分析了以SIFT为代表的图像特征点检测和特征点描述方法。局部特征点描述符能够更好地适应视角、光照等条件改变引起的物体外观变化。得到更为稳定的图像特征后,我们使用矢量量化方法在这些特征上生成标准特征字典,并以标准特征构造BOF物体表达模型。BOF模型不依赖于物体的具体形状或外观特征,是一种通用的物体表达模型,同时还具有良好的扩展性。本文提出在BOF框架中加入特征点空间信息的方法,以此来更准确地表达结构化物体。   本文对数据驱动的机器学习方法进行了深入研究,总结了监督学习方法和无监督学习方法、以及生成模型和判别模型之间的差异,并以典型的聚类、分类算法为例分析了不同方法的使用范围。针对图像上物体识别这一具体应用,本文详细分析了最近邻搜索、朴素贝叶斯、支持向量机等当前普遍采用的方法,并以这些高效的分类算法为基础,结合滑动窗口搜索提出了通用的图像物体定位解决方案。通过引入分支定界搜索技术,我们进一步解决了穷尽式搜索中时间复杂度过高的问题。   最后,本文通过具体实验对上述研究结论进行了验证。在Pascal VOC、实际交通视频数据、字符识别等多个不同应用上对我们的原型系统进行了测试,并进行了在真实交通视频中检测识别多类物体的应用测试。出色的实验结果充分肯定了本文所提出方法的有效性与可行性。
其他文献
人类在日常的工作和生活中需要借助大量的知识来解决面临的各种各样的问题,但毕竟个人所掌握的知识有限,需要实时查阅和获取知识。目前,人们常常借助搜索引擎通过互联网实现这一
信息技术与课程整合已经成为新课程改革的一个重要课题,探索并实现信息技术与课程整合也是一项长期而艰巨的任务。当前,我国积极倡导、推进教育的现代化和信息化,探索并实现信息
金融业近些年的蓬勃发展,对信息技术的依赖越来越强烈,更多的系统开始它们的信息化之路。在金融领域尤其是债券基金,基金经理通过观察信息发布系统进行交易,成交金额达到千万
压缩感知是一种全新的采样模式,它已经在很多领域得到研究应用。压缩感知是针对稀疏信号或可压缩信号提出来的。压缩感知理论表明:可以在采样数量远少于传统采样数量情况下精
随着移动通信技术的发展以及智能终端的普及,人们正逐步走向更加追求效率和速度的移动办公时代,尤其是云服务模式日趋成熟后,许多企业选择将电子文档存放在云端,只要有网络,
医保基金风险防控平台本质是通过数据仓库面向主题的、集成的、与时间相关的、非可变等方面的特性来存储和管理从医保各业务子系统中采集来的高质量的、表达致的、规范化的数
随着互联网的发展,人与人之间的联系越来越密切,所形成的网络也越错综繁杂。直接对其进行分析往往具有一定难度,而社团作为它的一个重要属性,能帮助我们认识网络的拓扑和层次
21世纪的今天是科技的时代,随着互联网的迅猛发展及其技术的不断深入探索,涌现出了许多大型的互联网公司以及电子商务网站,如百度、腾讯、淘宝网、京东、Amazon等,从而导致一
模糊测试是一种自动或半自动的发现软件故障的方法,具有可用性好、自动化程度高、误报率低、对目标程序源码没有依赖的优点。模糊测试如今已经成为漏洞挖掘的一门相当有效的
本论文的主要工作是在分析TI ZigBee2006协议栈结构和实现流程的基础上,根据ZigBee无线传感器网络项目的要求,设计并实现了基于树状网络的ZigBee协议栈。   论文讨论了无线