论文部分内容阅读
基于机器学习的行人检测是一个很重要而又很有发展前景的研究领域,有着广泛的应用价值,其涉及多个领域比如人机交互、车辆辅助驾驶、视频搜索和安全监控等方面。但是由于行人外观着装的非刚性以及复杂背景的干扰且在实际应用中要求极高的在线检测,所有的这些限制因素最终导致行人检测成为一项艰难的研究课题。目前有很多公开发表的行人检测的算法,比如模板匹配方法和基于统计学习方法,模板匹配是一种比较容易实现且很早就应用了的方法,是经过时间考验的经典性算法,人的头部轮廓有很好的不变性,在这样的情况下,模板匹配能够较好的描述目标。基于学习的方法有两个很重要的方面,一个是表征目标的特征描述算子,另一个是采用的学习算法。本课题仔细地研究和分析了行人目标检测研究领域中当前十分流行且受很多研究人员关注的检测算法,比如特征提取算法和机器学习算法,Dalal提出了用于表征行人的特征算子的梯度方向直方图近些年来受到很大的关注和研究改进,该算法主要是基于行人轮廓形状信息的分析,本文正是利用这一特性,对梯度方向直方图特征进行改进使其能够提取出包含更多行人轮廓信息。采用支持向量机算法训练得到分类器模型测试结果表明,在INRIA(?)人数据库上这种改进的特征提取算法能够取得很好的检测效果。在分类器训练框架上采用了cascade级联Adaboost分类器训练方法,但是根据本文算法的特点做了一些改进,用线性SVM代替二叉树成为弱分类器,和单个SVM训练得到分类器模型相比,实验结果表明该检测框架训练得到的强分类器具有压倒性的分类判别优势。在检测阶段,通过检测窗口在图片中滑动提取特征然后进行判别,而且有的行人目标在图片中占据的位置偏大或者偏小,另外还会有多个检测窗口同时框住同一个行人目标,怎么样合并这些检测窗口,本文采用多尺度检测技术和非极大值抑制能够精确地合并检测窗口以及定位行人在图像中的具体位置。对行人特征样本进行训练学习和检测是在VC6++口OpenCVl.0的软件开发环境中实现的并且使用的行人测试库是INRIA。实验结果证明本文所采用的改进的特征提取算法和训练框架能够生产检测性能更好的分类器模型。