论文部分内容阅读
视频目标的跟踪是计算机视觉领域的研究热点,与目标分割相结合,可实现研究目标与背景的分离以及目标运动轨迹的跟随。在某些应用领域,将目标与背景细致分离开,即确定目标的轮廓信息,可实现对目标更精确的跟踪。该技术被广泛应用于视频交通检测、无人驾驶、工业自动化、医疗诊断、军事侦察等领域。然而现存的视频目标跟踪与分割算法针对光线变化、目标尺度变化、目标遮挡、目标形变、目标快速移动、背景存在杂波等复杂场景会出现分割不精确导致跟踪漂移等状况。针对以上问题,本文提出了改进的目标跟踪算法,利用单摄像机解决在复杂场景下单目标跟踪漂移问题,提高跟踪的准确性与鲁棒性。本文主要的研究内容和创新点如下:(1)提出了改进的目标分割算法,用来处理初始帧图像,该算法不仅能确定目标的位置,还能确定目标的准确轮廓,实现非监督学习,无须手工处理初始帧,仅需将摄像头对准跟踪目标即可实现对预跟踪目标的分割定位,保证跟踪的实时性。使用基于卷积神经网络的语义分割,从像素级别上处理图像,实现更为准确鲁棒的分割定位,为后续的跟踪打下了坚实的基础,同时亦可用于解决其他领域的分割问题。(2)提出了改进的基于神经网络和相关滤波的目标跟踪算法。将基于神经网络的目标跟踪算法高准确性与基于相关滤波的目标跟踪算法的快速性相结合,从模板更新、目标尺寸、图像处理三方面进行优化,实现准确性与速度性的统一。(3)改进目标跟踪算法中的相关滤波器。经典的核相关滤波算法(Kernelized Correction Filters,KCF)在目标尺度改变、发生刚性形变、快速移动等情况下,跟踪效果不佳。基于此算法进行改进,提出了核化的岭回归模型,采用神经网络求解此模型,并且提取浅层和深层特征,以此提高分类和图像定位的准确性。(4)将空间正则化核引入完全卷积神经网络网络。通过对核滤波器施加空间约束,强制卷积层的每个输出通道对特定的局部区域有响应,并利用距离变换池层确定卷积层输出的有效性。相对基于神经网络的跟踪算法(Learning Multi-Domain Convolutional Neural Networks,MDNET),本算法速度提高了6倍。通过上述四方面的研究以及以人物为跟踪目标的实验验证,精确度提高了2.6%,召回率提高了9.6%。表明本文提出的基于神经网络和相关滤波的目标跟踪算法能够在复杂场景下实现对目标跟踪的准确性与鲁棒性。