论文部分内容阅读
目标检测是数字视频处理和计算机视觉领域的各种应用中一个重要的,也是最基本的任务。本文研究的是目标检测的特例——行人检测问题。行人的检测与定位是行人跟踪和理解行人行为的基础。这一课题在智能视频系统、驾驶辅助系统、虚拟现实等方面具有广阔的应用前景。
然而,相对于刚性物体,如人脸,车辆等,行人具有的非刚体特性,使其难以用统一的模型进行表征,同时实际的行人检测中还受到行人衣着、光线、遮挡等因素的影响,因此行人检测被普遍认为是计算机视觉中最难的问题之一。本文在分析目前国际上行人检测的主流方法的基础上,结合实际情况,研究并改进了基于梯度向量直方图(Histograms of Oriented Gradients)的检测算法,并且成功应用于静止图片中的行人检测,取得了较好的效果。
本文从HOG特征出发,结合AdaBoost算法,分别从特征提取,特征训练,行人检测三个环节进行研究和优化。
首先,根据经典 AdaBoost算法原理和梯度向量直方图特征实现上述三个环节。其次,通过对HOG特征环节中的梯度向量计算进行了改进,提升了检测效果。然后,鉴于HOG特征计算时间过长,本文提出了直方图积分法,使得特征提取的时间大大减少。再次在特征训练环节中,对用以构建HOG特征的线性支持向量机,采用序贯最小优化算法来提升训练的速度。最后,通过引入随机子集定理,在AdaBoost算法的每轮训练过程中只是随机从3807个梯度向量直方图特征中选取400个特征来进行弱分类器构建,使得训练速度得到进一步提升。实验结果表明,本文的行人检测算法能有效地降低训练时间,同时取得了较好的检测效果。