论文部分内容阅读
目标跟踪技术是图像处理和计算机视觉领域的一个重要研究方向,无论在军事领域还是人们的日常生活中都有着广泛的应用,例如在军事领域中的武器精确制导、侦查预警、无人机飞行器等,以及民用方面的智能交通、机器人视觉导航、医疗影像诊断等众多领域都有目标跟踪技术的身影。目标跟踪是在连续的视频序列中随着场景的不断变化对某一特定目标实现状态估计的过程。在实际的跟踪环境中,由于成像条件的复杂性和场景的多样性,使得实现稳定有效的目标跟踪仍然面临一系列的困难和挑战。本文针对目标跟踪过程中的技术难点,围绕目标外观建模对目标跟踪技术进行了深入的研究,提出了两种基于卷积神经网络的目标跟踪算法。本文针对传统目标跟踪算法中的人工构造特征表达能力不足、难以提取涉及语义信息的问题,提出了一种基于卷积神经网络多尺度表达的目标跟踪算法。该方法利用卷积神经网络可以自动学习图像中的深层语义信息的特点,结合拉普拉斯金字塔构建多个尺度的卷积网络结构。使用视频跟踪数据集对网络模型以参数共享的方式进行由粗到细的训练,从而获取对尺度变化更具鲁棒性的目标多尺度外观表达。最后结合多示例学习算法的优势,构建基于多尺度表达的多示例分类器来实现目标的在线跟踪,并针对多示例算法易饱和的问题,对多示例算法进行改进。该方法使得目标的外观模型对目标变化以及尺度变化更加鲁棒,可以实现更加稳定的跟踪效果,提高了算法的准确率和成功率。本文针对目标跟踪过程中的目标变化导致的漂移现象,提出了一种基于Attention机制的目标跟踪算法。该方法将视频序列的初始帧内容作为记忆单元,使得网络学习始终保持对初始帧目标特征的记忆,并根据视频帧之间的内容关联,利用初始帧设计Attention层次结构,构建基于Attention机制的卷积网络模型,通过学习使得网络自动关注目标中的关键位置。从网络的不同层中提取特征并进行金字塔空间池化处理,构建多专家分类器实现目标的在线跟踪。实验结果表明,该方法可以充分考虑目标的初始帧信息以及关键位置,有效缓解在跟踪过程中由于目标变化出现的漂移现象,实现在多种场景下进行稳定有效的跟踪。