论文部分内容阅读
随着高像素成像设备和计算机数据处理的快速发展,计算机视觉领域取得了长足的进步。视觉目标跟踪是计算机视觉和图像处理的重要分支,它在人机交互、自动驾驶、军事、图像目标识别领域中具有广泛的应用。深度学习的出现,解决了很多计算机视觉领域中复杂的问题,在目标检测、图像分割与分类等方面都获得了较好的成绩,而近些年,许多基于深度学习的目标跟踪算法被提出,加快了目标跟踪领域的发展,大大提升了跟踪精度和速度。本文主要对基于卷积神经网络的目标跟踪算法进行分析和研究,利用其优势对现有的算法进行优化和改进,主要的研究内容和创新点如下:本文对目标跟踪算法研究现状进行了一个全面的回顾,了解当前目标跟踪领域所面临的一些挑战,并详细介绍了神经网络,基于卷积特征和相关滤波的目标跟踪方法,基于端到端网络模型的目标跟踪方法,发现了丰富的特征表达以及降低复杂的计算量会使目标跟踪的性能更加鲁棒。(1)为了能够充分提取目标的卷积特征,利用其语义信息,在较为复杂的场景变化中更好的进行跟踪,本文提出了一种基于时空上下文分层响应融合的目标跟踪算法。该算法利用卷积神经网络的分层特征,在卷积层上学习时空上下文感知相关滤波器,通过融合三个卷积层上滤波器的响应值来定位目标位置。在尺度估计方面,学习一个尺度判别相关滤波器,从最理想的响应值中来估计目标的尺度大小。为了更好地解决跟踪失败的情况,提出了一种重检测激活判别方法来提高目标跟踪的鲁棒性。另外,为了使得模型质量更高,提出了一种自适应模型更新方法,一定程度上减少了由噪声更新引起的跟踪漂移。大量的实验验证了所提出的算法具有较高的精确度和成功率,而且对于背景混乱、遮挡、尺度变化、光照变化、平面内旋转等复杂场景下都具有较好的表现。(2)为了更好的提升目标跟踪的性能,平衡其跟踪精度和跟踪速度,在孪生网络框架的基础上,本文提出了一种基于孪生网络的自适应学习目标跟踪算法,该算法将传统特征和深度卷积特征进行融合,提出了一种特征自适应融合方法来提高特征表达的有效性。为了进一步提高模型的泛化能力,通过学习到的目标外观变化因子和背景信息变化因子来更新前一帧的跟踪模型,并提出了一种模型更新策略,在跟踪失败、遮挡或者背景混乱等情况下减少了跟踪漂移。该算法在公开基准数据集上进行了大量实验,实验结果表明了所提出的算法具有较高的精确度和成功率,并且在速度上也有了较大的提升,总体表现要领先于目前主流的一些跟踪算法。