论文部分内容阅读
行人重识别是用于匹配无交叠摄像区域的行人是否为同一行人的任务。在智能安防领域,它有着广阔的应用前景,最典型的是国家大力开展的“天网行动”与“天眼工程”。对行人重识别系统输入一张预查询嫌疑犯行人图片,将预查询行人图片与摄像头收集到的行人图片库进行对比,计算机就能快速找到行人库中嫌疑犯行人图片,这样能够减少大量的人力。但是,受光照强弱、姿态变化、遮挡因素、视角转换以及摄像头本身等因素的影响,摄像头捕捉的行人图片往往千差万别,摄像头捕捉的行人图片往往千差万别,这样给识别带来了很大的难度。对于这样复杂的识别任务,传统手工提取特征的方法已经很难胜任。近年来随着卷积神经网络方法的提出,凭借其在信号处理尤其是图像识别领域的突破性进展,许多研究者开始将卷积神经网络应用于行人重识别当中来,取得了比传统特征提取方法更好的识别效果。但是目前用于行人重识别的卷积神经网络还存在很多问题,最大的问题就是对视角朝向信息的忽略。为了进一步提升行人重识别算法的识别率,本文提出一种基于视角朝向信息的行人重识别模型,更好地完成行人重识别任务。同时针对目前行人重识别数据集数据量小会导致模型容易产生过拟合的问题,本文采用分离式GAN半监督学习方法用于行人重识别,提升模型的泛化能力。本课题的主要研究内容有以下两个方面:(1)针对目前行人重识别方法在视角朝向信息方法利用的不足,提出一种基于视角朝向信息的行人重识别模型。目前行人重识别方法都只是在利用图片二维层面的信息进行直接匹配,忽视视角朝向对匹配的影响,这样的做法会造成行人由于旋转面不同造成的匹配错位。目前最好的方法也同样是如此。为了纠正这种错位的匹配,同时提高行人重识别的识别率,本文提出一种基于视角朝向信息的行人重识别模型。在骨架网络基础上设计了视角朝向预测模块用于减少视角引起的匹配错位,引入深度可分离模块用于防止模型过拟合,引入挤压与激励模块用于减少图片噪声的干扰。实验证明,本文基于视角朝向信息的行人重识别有效的提高的行人重识别的识别率,在目前通用的公开数据集取得比以往更好的识别效果。(2)针对实际情况中无法获得大量人工标注数据的问题,本文采用分离式GAN半监督学习方法用于行人重识别。目前基于GAN半监督学习方法在判别器模型复杂分类数多情况下的难以训练以及简单判别器无法适应行人重识别任务的问题。为了解决上述问题,本文提出分离式GAN半监督学习方法。分离式GAN半监督学习方法通过将样本的生成与训练分离开,先训练一个采用简单判别器的GAN模型,取出GAN中的生成器,用生成器进行无标签数据生成,再将无标签数据与原始训练数据合并成为新训练集,将新训练集用于行人重识别模型的训练,其中无标签数据单独分成一类进行训练,最后完成训练。这样避免由于行人重识别模型复杂造成的GAN半监督学习难以训练问题。利用GAN生成无标签样本进行半监督学习,一定程度解决了实际情况中难以获取大量标注数据的问题。本文提出的分离式GAN半监督学习方法有效的提升了模型的泛化能力,提升了行人重识别模型的性能。