论文部分内容阅读
随着视频采集技术的发展以及人们对公共安全的日益关注,视频监控系统在通信、安全、交通等行业得到了广泛的应用。海量的监控视频在给人们生活带来便利的同时,也对传统的人工处理方法提出了挑战。为了获得更好的服务,人们对监控系统提出了更高的要求,其具体要求监控系统具有一定的智能,能够自动识别物体,并监测视频画面中的异常情况,及时的发出警报提供有用的信息,从而协助安全人员处理危机,成为有力的辅助工具。相比于传统的人工处理方法,计算机处理方法具有经济、高效、准确度高的优点,因此利用计算机技术和多摄像机网络实现视频监控系统的智能化,是未来视频监控系统的发展方向之一。海量的监控视频为计算机视觉技术提供了大量数据。同时,图像处理、模式识别以及机器学习等领域的迅速发展,使得监控系统的智能化成为可能。目前,视频监控系统的智能化正处于初步研究阶段,研究如何利用计算机视觉技术实现监控系统的智能化成为迫切需要解决的难题。在这种需求背景下,行人再识别技术应运而生,并成为计算机视觉领域中的热门话题,其在维护公共安全中起到重要作用。 行人再识别旨在多摄像机网络中找到相同的感兴趣目标。由于行人在不同镜头下的时间信息是不确定的,因此现有的行人再识别方法都是基于表观模型的方法。行人再识别技术的主要难点在于行人在不同镜头下,由于光照、视角、姿势以及背景变化,相同目标的外观会发生剧烈的变化。同时由于有限样本、低分辨率等难题,目前的行人再识别方法精度仍然较低。因此,行人再识别技术仍是一个开放性问题,亟待更多的研究。尽管最近5年大量的行人再识别研究方法被提出,但是现有方法仍有两点不足:1)行人再识别方法易受到类内差异性和类间相似性的影响。行人再识别数据存在剧烈的类内差异性和类间相似性,在一些情况下不同目标比相同目标更相似,传统方法很难克服相似目标对识别的干扰。2)行人再识别方法依赖视觉特征。基于表观模型的行人再识别方法,其模型建立在底层的局部描述子基础上,而局部描述子的视觉特征会影响到算法的最终结果。然而这些特征表达性、判别性弱,并含有大量冗余信息。 为了解决以上难题,本文从度量学习以及特征学习的角度,分别提出了基于弹性双映射模型的方法以及潜在特征学习的方法。弹性双映射方法根据原始数据的不同属性,将原始数据分别映射到不同的子空间,通过约束同类目标更相似,异类目标更不同求得判别性子空间。潜在特征学习方法假设存在一个低维潜在特征空间,其能够表达目标的固有属性以及关联性。本文提出一种基于矩阵分解的方法来获得不同镜头下目标的潜在特征表达。由于相同目标的巨大外观变化,其潜在特征间可能存在语义表达鸿沟。因此,本方法在矩阵分解的基础上,利用一个映射矩阵来连接相同目标其潜在特征间的表达鸿沟,来构建相同目标间其潜在特征的关联性。 为了验证本文提出方法的有效性,分别在三个行人再识别数据库(VIPeR,GRID,CUHK)上对上述方法进行了实验,并和最先进的方法进行了比较。实验结果证明了本文提出方法的可靠性与有效性。