论文部分内容阅读
计算机视觉领域在过去数十年中得到了充分重视和极大发展,该领域的众多的研究之中,多目标跟踪为最具挑战性的研究主题之一。一方面,对于一个有效的监控系统,多目标跟踪需要处理遮挡、目标对应、目标切换及目标同时进出场景等问题,使得目标跟踪任务具有挑战性;另一方面,对于实时目标跟踪而言,研究准确检测和跟踪视野中目标且高效率的算法是非常必要的,在由低层至高层的视觉信息处理过程中,每一步执行算法的可靠与成熟为多目标跟踪任务成功的关键。因此,本文提出了一种包含目标检测和跟踪双层次的多目标跟踪方法,旨在实现离线的多目标跟踪系统,并可通过改进用于实时多目标跟踪。本文的主要工作如下: (1)结合基于可变部分模型(DPM)的检测和超像素分割进行精细化检测。在第一个层次,使用基于可变部分模型的检测器检测视频中所有帧中的目标。由于复杂背景、表观及遮挡可能导致DPM检测缺失,为提高DPM检测的精确性,在此基础上,使用超像素分割的方法提取更精细的检测结果。基于超像素的方法增加了姿势变化的静态模型,提高了表观检测的稳定性。上述方法克服了DPM中由于阈值过低而产生的过量误检测。 (2)引入基于RANSAC的稳定性处理。在第二层次,提出一种基于图逼近的数据关联方法。根据目标的数量,视频序列被分割为较小的分块,对每个分块,根据检测到的表观特征建立了无向图。通过基于迭代的图逼近和数据关联算法在小的视频分块中找到小的跟踪轨迹,并不断重复以连接每个目标相关的tracklets。除了整个视频序列的运动代价模型,同时对每个目标,利用表观和位置特征进行稳定性处理,有效解决了遮挡、漏检、误检,及目标切换的问题。通过对tracklet施以前向和后向稳定操作,应对目标同时进出场景的问题。在公开的包含遮挡的挑战性测试视频序列上的实验结果验证了图像逼近和数据关联算法的有效性。 (3)提出对帧率进行下采样的概念,用于降低无向图估计的计算复杂度。实验中选择了不同的下采样尺度,实验结果说明对于长时平滑运动,下采样操作能够充分保证跟踪效果并显著降低计算量。