论文部分内容阅读
在机器视觉领域中,视频序列分析是一个关键性问题,在运动分析、图像压缩、行为识别等领域中扮演重要的角色。虽然,在过去几十年中对视频序列的研究已经取得了长足的进步,但如何正确地表示视觉目标的外观及目标的外观内在变化(如姿态变化和形状变形)和外在变化(如光照变化、摄像头抖动和遮挡)仍存在一定的差距。因此,研究鲁棒的在线目标检测和跟踪仍然是一个具有挑战性的研究课题。本文针对上述存在的问题,利用视频图像的可压缩性和稀疏性特点,研究基于稀疏表示(Sparse Representation)的运动目标检测与跟踪方法,主要研究内容包括: (1)基于稀疏表示的目标检测方法:首先,利用1-SVM的稀疏性,即最优超平面只取决于支持向量的加权平均值,并且利用在线学习构建尽可能少的支持向量,使得检测器能够快速地将背景样本与前景样本进行区分;然后,为了加强相邻像素间的空间相关性,利用基于最大后验概率-马尔科夫随机场(Maximum APosteriori-Markov Random Field,MAP-MRF)的图割(Graph Cuts)代替阈值化操作,最后,在GPUs(Graphics Processing Units)中加速。通过“fall”视频序列的实验,结果证明,基于稀疏表示的目标检测方法不仅能够提高检测的精度,而且能够满足实时性的要求。 (2)基于粒子预滤波的目标跟踪研究:首先,为了提高跟踪的速度,利用L2正则化是L1正则化的上界的原理,得到观测概率的上界;然后,通过观测概率上界的序列化进行粒子预滤波,以减少稀疏系数求解次数;最后,在“caviar1”视频序列的实验表明,基于粒子预滤波的目标跟踪能够在保证跟踪精度不降低的同时大大提高跟踪速度。 (3)基于噪声抑制的正则化模型的目标跟踪研究:首先,利用琐碎模板表示噪声的机理,并且根据琐碎模板大小与噪声强度正相关的原理,构造琐碎稀疏系数的L2范数惩罚函数,从而可以抑制和检测噪声;然后,提出一种自适应启停L2惩罚函数机制,该机制能够显式地利用琐碎模板系数构造连通区域大小表征遮挡程度,进而决定模板更新;最后,利用加速近端梯度法(Accelerated ProximalGradient,APG)加速正则化求解。实验结果证明,基于噪声抑制的正则化模型的目标跟踪方法不仅能提高跟踪的速度,而且能够有效地解决严重遮挡的问题。 (4)基于正交子空间的实时目标跟踪方法:首先,利用主成分分析(PrincipalComponent Analysis,PCA)基向量的压缩性创建紧凑的模板集,并将其引入到稀疏表示中,构造具有强表征能力的模板集;然后,利用模板间的正交性,提出了一个正交子空间的加速L1正则求解算法,从而构造实时性强、鲁棒性高的跟踪器。实验结果表明,基于正交子空间的实时目标跟踪方法不仅能处理目标的姿态变化,而且能够处理严重遮挡的问题。