论文部分内容阅读
目标跟踪是通过对摄像机所拍摄的视频图像序列进行处理,找出连续图像帧间的对应关系,实现对图像和图像序列中的运动目标进行跟踪,给出其运动轨迹。目标跟踪在目标运动的视觉分析中占有重要的地位,属于视觉的中层部分。利用目标的跟踪,可以方便地获得目标的运动、姿态、行为参数,为后续高层的行为理解和识别奠定基础。目标跟踪虽然是计算机视觉领域一个重要的研究方向和研究热点,但是目前仍然有很多理论与技术问题有待解决,特别是跟踪过程中噪音干扰、运动模糊、光照变化、遮挡等复杂问题的解决。
视频中的运动轨迹包含了丰富的时空信息。它们不仅表现了物体的空间位置,由于帧间固定时间采样的关系,轨迹上的采样点还可以表示物体运动的速度和加速度。如果和场景信息相结合,轨迹还可以表现较高层次的语义内容。因此,轨迹模式学习在目标运动的视觉分析中属于高层部分。它可以简单地被认为是对时变轨迹数据进行无监督学习,从而得到一系列具有代表性的轨迹模式。
本文的工作以运动目标的鲁棒跟踪和轨迹模式学习为目标,分别对以下两个问题进行了深入的探讨和分析:(1)基于目标表观建模的视觉跟踪;(2)运动目标轨迹模式学习。实验证明了我们方法的有效性和鲁棒性。论文的主要工作和贡献如下:①我们提出了一个基于金字塔表观建模的目标跟踪方法。在增量子空间学习的基础上,引入多尺度分析的思想,对目标进行三层空间金字塔分割,用增量PCA的方法,对金字塔每层子块进行子空间表观建模,并分别计算重构误差,在粒子滤波的框架下对目标进行后验状态估计,确定跟踪结果。另外,我们充分利用金字塔结构,在像素特征的基础上,进一步融合了类Haar特征和PHOG特征,加入了目标的纹理信息和形状信息,对目标进行更加有效地描述,使跟踪结果更加鲁棒。②我们提出了一个基于图的半监督轨迹学习框架,它不仅可以利用已标记轨迹之间、已标记轨迹与未标记轨迹之间的相似性信息,还可以利用未标记轨迹之间的结构信息,使标签信息沿图传播,在训练轨迹样本极少的情况下,实现有效的轨迹模式学习。在这个框架中,我们还提出了一种基于多尺度关键点的轨迹描述子,该描述子不仅对轨迹长度十分鲁棒,而且在多尺度下能充分反映整条轨迹的结构信息和细节信息,有效地重构整条轨迹。