论文部分内容阅读
视觉目标跟踪技术因其广泛的应用场景和基础性的研究意义而成为计算机视觉领域的研究热点,同时又因为该视觉感知任务中目标对象的任意性和视频场景的复杂性,目标跟踪研究富有挑战性。相关滤波跟踪算法兼具速度与性能双优点,是视觉跟踪领域的重要研究方向。本文主要研究现有相关滤波跟踪算法存在的一些缺点和未解决的难题。相关滤波跟踪建立于样本循环周期性的假设之上,其在线学习模型存在着一个被称为边缘效应的严重缺陷:训练样本和测试样本均通过对基础样本的逐步循环偏移而产生,该采样方式导致较高比例的样本发生了严重的扭曲失真,进而约束了模型的学习和预测能力。在模型训练阶段,失真样本影响到模型对真实视频内容的感知;在模型推理阶段,扭曲失真的边缘样本的检测分数并不可靠,无法反映边缘区的目标置信分布。本文主要的研究内容和贡献分三个方面:第一,深入剖析相关滤波跟踪的边缘效应并指其衍生的两个重要问题。第一个问题是被严重约束的模型感知范围和目标搜索范围,这导致算法在快速运动、相机晃动等多种场景下的跟踪结果不理想;此外,当由于不可控因素而暂时跟踪失败时,过小的搜索窗使得模型难以再次检索回目标,进而演变为无法恢复的跟踪失败。第二个问题是,循环偏移采样加剧了训练样本和测试样本之间数据分布非对齐性。在测试样本和训练样本远不能满足近似独立同分布情况下,我们难以建立高质量的跟踪模型。第二,分别提出多锚点检测策略和干扰物感知滤波器来拓展搜索区和感知区。本文利用像素级特征的贝叶斯决策模型或离线训练的孪生网络,高效地发掘上下文内的目标类似物,并提取多组循环偏移样本组。在检测过程中,样本组用于多锚点检测以实现大范围的目标搜索。在模型更新阶段,样本组用于干扰物感知学习。通过训练集的拓展和优化,滤波器增强了背景感知能力并有针对性地抑制干扰物的滤波响应,从而减少在多锚点检测时模型预测漂移至目标干扰区的风险。第三,在拓展模型感知范围和搜索范围的基础上,本文通过“候选区集-初步定位-精确回归”的渐进式目标搜索策略,构建一种新的跟踪框架(DAMA)。DAMA在大范围搜索空间内获取候选区集并进行干扰物感知的滤波检测,最后使用位置回归器精确定位。渐进式目标搜索策略能够逐步对齐测试样本和训练样本之间的数据分布,从而减轻了边缘效应的影响。此外,DAMA框架下的位置精调器还能减少误差累积和防止模型漂移。本文在OTB2013、OTB2015、TC128和VOT2017共四个数据集上对DAMA进行了综合测评。实验结果表明,第一,DAMA总体跟踪能力达到与前沿深度学习跟踪算法一致的水平,同时还能保持实时的跟踪速度;第二,DAMA面对快速运动、相机晃动、严重遮挡和目标离开视野等多种挑战性因素时具有较优的鲁棒性。