论文部分内容阅读
人工智能在近几年出现了突飞猛进的发展,特别是在计算机视觉领域。其中,视频目标跟踪是一个重要的研究方向,可以广泛地应用于人机交互,无人驾驶,视频监控等许多领域。在过去的几十年中,视频目标跟踪领域取得了很大的进步,特别是最近利用相关滤波技术的单目标跟踪方法取得了良好的跟踪效果。本文详细描述了相关滤波跟踪算法的细节,并分析出其中亟待解决的问题。针对实际应用中复杂场景下的目标跟踪问题,本文提出了三种基于核化相关滤波跟踪器的算法。主要工作如下:
(1)提出了一种基于互补特征自适应选择的视频目标跟踪算法。目标特征提取是跟踪框架中非常重要的部分。本文分析了CSK(CirculantStructurewith Kernels)跟踪器中仅使用了单通道的灰度特征的缺点。FHOG(Fast Histogram of Oriented Gradients)特征对图像光照和颜色的变化以及运动模糊等挑战具有鲁棒性,但是难以应对目标形变和快速运动。相反,CN(ColorNames)特征对目标形变和尺度等具有鲁棒性。所以,FHOG特征和CN特征属于互补特征。因此,本文在KCF(Kernelized Correlation Filter)和CN跟踪器的基础上,提出了一种自适应选择两种特征的视频目标跟踪器,以更好地处理复杂场景中光照或颜色变化、目标形变等属性下的跟踪问题。
(2)提出了一种基于快速尺度相关滤波和重定位组件的视频目标跟踪算法。传统的相关滤波跟踪器无法准确、快速地处理多尺度问题,本文在原始跟踪框架上结合了一个尺度相关滤波器以估计目标尺度变化,提升了目标跟踪的准确度。此外,在特征提取模块,特征表示仍然比较单一,需要研究出更有效的特征表示。本文将FHOG特征和CN特征融合,并提出了一个新颖的手工设计特征来增强图像的特征表示,从而提升分类器的判别性能。最后,相关滤波跟踪框架一直存在由目标遮挡等因素导致的模型漂移问题。为此,本文引入了跟踪置信度指标和重定位组件,在一定程度上缓解了遮挡和模型漂移问题。
(3)提出了一种基于背景建模和自适应模型更新的视频目标跟踪算法。在相关滤波器的训练过程中,可以利用的背景信息本身非常有限。而且,为了解决边界效应问题引入了余弦窗,进一步减少了背景信息。本文在DCF(Discriminative Correlation Filter)跟踪框架的基础上引入全局背景信息以提升分类器的判别能力。此外,已有的相关滤波框架均采用了线性插值的模型更新方式,难以适应目标的变化,容易造成模型污染和跟踪丢失的情况。本文引入了一种自适应的模型更新策略以适应目标的变化,提升了跟踪器的鲁棒性。
(1)提出了一种基于互补特征自适应选择的视频目标跟踪算法。目标特征提取是跟踪框架中非常重要的部分。本文分析了CSK(CirculantStructurewith Kernels)跟踪器中仅使用了单通道的灰度特征的缺点。FHOG(Fast Histogram of Oriented Gradients)特征对图像光照和颜色的变化以及运动模糊等挑战具有鲁棒性,但是难以应对目标形变和快速运动。相反,CN(ColorNames)特征对目标形变和尺度等具有鲁棒性。所以,FHOG特征和CN特征属于互补特征。因此,本文在KCF(Kernelized Correlation Filter)和CN跟踪器的基础上,提出了一种自适应选择两种特征的视频目标跟踪器,以更好地处理复杂场景中光照或颜色变化、目标形变等属性下的跟踪问题。
(2)提出了一种基于快速尺度相关滤波和重定位组件的视频目标跟踪算法。传统的相关滤波跟踪器无法准确、快速地处理多尺度问题,本文在原始跟踪框架上结合了一个尺度相关滤波器以估计目标尺度变化,提升了目标跟踪的准确度。此外,在特征提取模块,特征表示仍然比较单一,需要研究出更有效的特征表示。本文将FHOG特征和CN特征融合,并提出了一个新颖的手工设计特征来增强图像的特征表示,从而提升分类器的判别性能。最后,相关滤波跟踪框架一直存在由目标遮挡等因素导致的模型漂移问题。为此,本文引入了跟踪置信度指标和重定位组件,在一定程度上缓解了遮挡和模型漂移问题。
(3)提出了一种基于背景建模和自适应模型更新的视频目标跟踪算法。在相关滤波器的训练过程中,可以利用的背景信息本身非常有限。而且,为了解决边界效应问题引入了余弦窗,进一步减少了背景信息。本文在DCF(Discriminative Correlation Filter)跟踪框架的基础上引入全局背景信息以提升分类器的判别能力。此外,已有的相关滤波框架均采用了线性插值的模型更新方式,难以适应目标的变化,容易造成模型污染和跟踪丢失的情况。本文引入了一种自适应的模型更新策略以适应目标的变化,提升了跟踪器的鲁棒性。