论文部分内容阅读
计算机视觉是一门研究如何让计算机模拟生物的大脑去感知视觉信息的学科。目标检测是计算机视觉领域里面的基本任务之一,目的是为了在静态图像或视频帧中判断是否存在待检测的目标,如果存在还需要将其所在的位置标记出来。行人检测是目标检测里面一个特定的研究课题。人作为非刚性的物体,在图像中可能以不同外形和姿态存在,再加上复杂的背景、光照变化和遮挡等因素的干扰,人体目标的检测就变得十分困难。但是,对人体目标的检测具有十分广泛的应用前景。通过在图像中检测出行人,能够接着对其进行行人跟踪、行人识别和行人行为分析的研究工作。另外,行人检测技术在视频监控系统、智能交通系统等领域潜还藏着巨大的商业价值。由于这些原因导致了行人检测成为目标检测里面的热点研究课题。
行人检测的过程分为候选窗口生成、特征提取和分类器分类三个主要的部分。其中,传统检测方法使用的是滑动窗口法来生成候选窗口。该方法使用穷举的策略,通过设置不同尺寸和长宽比来对整幅图像进行遍历。尽管这种方法能够穷举出目标可能出现的所有位置,但是由于产生的冗余窗口数量过多严重的影响了检测速度。在特征提取环节,传统方法使用人工设计特征来提取特征向量。常用的行人描述符有 HOG特征、Haar特征和LBP特征等。人工特征的设计需要依靠专业领域中丰富的先验知识,才能从训练数据中抽取出有用的特征。为解决以上问题,本文考虑了视频图像里的上下文信息,通过前景检测来生成候选窗口,再结合深度卷积神经网络模型自动地学习和提取人体特征,最终提出一种面向视频图像的行人检测方法。本文主要完成的研究工作具体如下:
(1)针对传统方法生成候选窗口时,冗余窗口过多且质量不高的问题。本文对视频图像序列进行背景建模,利用前景检测划分出背景区域和前景区域,接着对前景图像进行形态学处理,通过腐蚀操作消除噪声点,膨胀操作联通相邻区域成为一个整体。最后,利用轮廓查找定位出所有运动目标的轮廓,并计算每一个轮廓的最小外接矩形构成候选窗口集合。该方法利用视频图像中的上下文信息过滤掉大量无关的背景区域从而缩小了整幅图像中需要搜索的范围。
(2)针对传统方法中所采取的人工设计的特征无法充分有效描述行人目标的问题,本文选用深度卷积神经网络模型来自动学习并提取人体特征。通过优化网络的模型结构,增加全连接层神经元的个数,划分全连接层神经元为两个部分,分别与两个卷积层提取到的特征图相连,巧妙融合CNN学习到的浅层特征和深层特征,最终组成联合特征向量来完成人体的检测工作。
(3)基于上述研究,利用校园内楼栋中的监控摄像头拍摄到连续的视频图像作为检测系统输入源,再结合上述方法进行检测实验。实验结果表明,本文所提出的方法能够准确的监控室内场景中的人体目标,对于解决校园安防问题具有良好的实用价值。
本文所做的研究工作主要集中在行人检测流程中候选窗口生成和人体特征提取两个环节。在INRIA数据集和CAVIAR数据集两种公开数据集上的实验结果表明,本文所提出的方法不仅能够提高整体检测速度,同时还能利用深度卷积神经网络准确进行窗口分类,降低误检的概率,具有较好的实用价值。
行人检测的过程分为候选窗口生成、特征提取和分类器分类三个主要的部分。其中,传统检测方法使用的是滑动窗口法来生成候选窗口。该方法使用穷举的策略,通过设置不同尺寸和长宽比来对整幅图像进行遍历。尽管这种方法能够穷举出目标可能出现的所有位置,但是由于产生的冗余窗口数量过多严重的影响了检测速度。在特征提取环节,传统方法使用人工设计特征来提取特征向量。常用的行人描述符有 HOG特征、Haar特征和LBP特征等。人工特征的设计需要依靠专业领域中丰富的先验知识,才能从训练数据中抽取出有用的特征。为解决以上问题,本文考虑了视频图像里的上下文信息,通过前景检测来生成候选窗口,再结合深度卷积神经网络模型自动地学习和提取人体特征,最终提出一种面向视频图像的行人检测方法。本文主要完成的研究工作具体如下:
(1)针对传统方法生成候选窗口时,冗余窗口过多且质量不高的问题。本文对视频图像序列进行背景建模,利用前景检测划分出背景区域和前景区域,接着对前景图像进行形态学处理,通过腐蚀操作消除噪声点,膨胀操作联通相邻区域成为一个整体。最后,利用轮廓查找定位出所有运动目标的轮廓,并计算每一个轮廓的最小外接矩形构成候选窗口集合。该方法利用视频图像中的上下文信息过滤掉大量无关的背景区域从而缩小了整幅图像中需要搜索的范围。
(2)针对传统方法中所采取的人工设计的特征无法充分有效描述行人目标的问题,本文选用深度卷积神经网络模型来自动学习并提取人体特征。通过优化网络的模型结构,增加全连接层神经元的个数,划分全连接层神经元为两个部分,分别与两个卷积层提取到的特征图相连,巧妙融合CNN学习到的浅层特征和深层特征,最终组成联合特征向量来完成人体的检测工作。
(3)基于上述研究,利用校园内楼栋中的监控摄像头拍摄到连续的视频图像作为检测系统输入源,再结合上述方法进行检测实验。实验结果表明,本文所提出的方法能够准确的监控室内场景中的人体目标,对于解决校园安防问题具有良好的实用价值。
本文所做的研究工作主要集中在行人检测流程中候选窗口生成和人体特征提取两个环节。在INRIA数据集和CAVIAR数据集两种公开数据集上的实验结果表明,本文所提出的方法不仅能够提高整体检测速度,同时还能利用深度卷积神经网络准确进行窗口分类,降低误检的概率,具有较好的实用价值。