论文部分内容阅读
行人检测和跟踪是视频监控领域中一个最基本最重要的任务,它是场景分析、语义理解等诸多后续工作的基础。除视频监控外,行人检测与跟踪技术也在智能交通、人机交互、机器人视觉导航、虚拟现实、军事侦察等各方面有着广泛的应用。尽管行人的检测和跟踪技术已经研究了数十年,但目前还没有一个健壮、精确和实时的行人检测和跟踪算法,其根本原因在于行人自身的多变性以及环境的复杂性。行人检测和跟踪仍是计算机视觉研究领域中的一个巨大挑战。为了丰富这一研究领域,本文对基于红外图像的行人检测与跟踪方法进行了深入研究,主要内容包括:(1)提出了一种基于半监督学习的红外行人检测方法,该方法在兴趣区域提取基础上使用梯度方向直方图特征作为行人鉴别特征,联合多个支持向量机作为行人检测器,并构建了Tri-Training学习框架,针对具体环境获得较可靠的训练样本,在线提升检测器性能,因而只需较少的初始标记样本,且具有一定的场景自适应性,实验证明了本文算法的有效性;(2)设计了一种复杂环境下的自适应行人跟踪算法。采用粒子滤波实时跟踪目标运动状态,利用Mean-Shift算法对各个粒子进行优化,并依据运动信息和目标统计分布相似度共同获得各个粒子的观测概率,避免了复杂背景的干扰;根据运动分割结果,相应调整Mean-Shift核窗口的大小,有效地适应目标的尺度变化,并给出了有效的模式更新和遮挡处理方法。实验证明,本文算法减少了行人跟踪失败的机率,对目标的尺度变化,不规则运动和遮挡具有较高的适应能力。(3)设计了一套红外行人检测与跟踪系统。对系统框架、功能模块和软硬件组成做了详细介绍,基于C++和MFC设计了红外行人检测和跟踪软件,并将提出的行人检测和跟踪算法作了合理的优化后应用到系统中以满足工程应用的需求。