论文部分内容阅读
行人检测是目标检测领域的一个重要分支,因其在车辆辅助驾驶等方面的应用而得到了广泛的关注。行人检测作为计算机视觉、传感器技术、信息融合、机器学习等多学科交叉的热门研究课题,同样也具备重要的科研价值。然而,行人检测的研究仍存在极大的挑战,主要体现在行人衣着、姿态的多样性以及背景、光照、拍摄视角的不同和遮挡问题等。 本文对行人检测技术的现状进行了总结,确定了基于静态图片的行人检测为研究方向,在此基础上研究了基于统计分类的行人检测方法。该方法的一般步骤是提取样本中能够有效表征行人的特征,利用机器学习的方法训练得到一个目标分类器后利用该分类器进行目标检测。本文详细研究了行人检测的特征提取阶段,提出了将方向梯度直方图(Histogram of Oriented Gradient,HOG)特征和改进后的韦伯局部描述子(Weber LocalDescriptor,WLD)特征融合起来进行行人检测的方法,并在INRIA数据库上将其性能与其他算法进行比较来验证本文算法的有效性。 本论文的研究工作主要在于以下几个方面: 1.基于改进的WLD特征的行人检测方法 WLD描述子最早是用于人脸识别并取得了很好的效果,但是传统的WLD特征直接用在行人检测上效果并不理想。通过对WLD特征的提取过程进行分析并受HOG特征提取的启发,提出了基于分块归一化的WLD改进方法,压缩WLD特征范围以克服一些噪声的影响,提高鲁棒性。通过在INRIA数据库上的实验表明,改进后的WLD特征比传统的WLD特征的检测精度有显著的提升,与经典的基于HOG特征的行人检测算法性能相当。 2.基于HOG和改进WLD特征融合的行人检测方法 针对单一特征对图像目标表征的局限性以及对光照、噪声鲁棒性不足的缺点,本文首次提出将HOG特征和改进后的WLD特征融合的行人检测方法,并详细分析了WLD特征中的归一化方式、分块方式和加权系数对融合结果的影响。在此基础上,利用支持向量机(Support Vector Machine,SVM)训练了分类器,实现了行人检测。实验表明,本文提出的HOG和WLD融合的方法具有很好的行人表征能力,实现了较好的检测效果。 3.实现了多尺度的行人检测方法,并设计开发了用于演示的软件平台 实际中的待测样本大小不固定,而行人的检测窗口一般固定大小的64×128,因而采用多尺度的行人检测方法。首先对待测样本构建图像金字塔,利用滑动窗口在图像各个尺度上进行密集扫描和检测,然后对检测结果进行融合,完成多尺度的行人检测。另外,为方便测试与统计分析及后期的应用开发,本文还设计一个行人检测的演示软件,该软件集成了本文所涉及的不同特征分类器的训练、测试及多尺度检测。