论文部分内容阅读
近年来,行人再识别(Person Re-Identification,Person ReID)技术在小区安防、身份验证等应用中逐渐发挥出巨大的作用。而在现实世界中,行人再识别的准确度受诸多因素地影响,如环境光照、摄像头的分辨率、行人的行为、遮挡物等。为了提高准确度、克服这些挑战,目前主要采用基于深度学习的端到端模型进行行人再识别框架(简称端到端行人再识别模型)的搭建,并且在构建数据集、特征提取、分类及检索等方面进行相关技术地研究。端到端行人再识别模型因其实施步骤简单,识别准确度高等诸多优点备受研究者的青睐。然而,影响其准确度进一步提升最重要的因素是训练数据集的大小。目前,主流行人再识别数据集的规模依然较小,因此,如何灵活地扩大数据集是本领域中重要的研究方向。现阶段,研究者偏于使用成本较低的无标签图片扩大训练数据集,旨通过半监督学习提高行人再识别的准确度。本文基于此背景,使用生成对抗网络(Generative Adversarial Net,GAN)生成无标签图片,将原始图片和生成图片合并作为训练数据集,参与到用于特征提取的基于深度学习的端到端模型训练过程中,并提出合理的分类算法判断行人类别,最后完成检索任务,进一步提升端到端行人再识别的准确度。本文的主要工作如下:(1)无标签图片扩充训练数据集。将原始数据集中的图片输入到生成对抗网络中,通过调节网络中的参数以及使用模型融合算法,生成不同数据增强效果的无标签图片用于扩充训练数据集。(2)提出基于谱聚类的行人再识别分类算法。在模型训练过程中,需要计算针对生成图片的损失。本文通过使用谱聚类算法将生成图片聚类成和原始图片类别数相同的簇,通过计算聚类中心和原始图片之间的距离决定生成图片和原始图片的相似度,随后根据相似度和不同数量的生成图片得到半监督学习中每张生成图片的损失,并且有效控制模型的欠拟合和过拟合程度,在不采用复杂传统的特征提取算法的情况下,提高端到端行人再识别的准确度。本文的重点研究内容是使用生成对抗网络生成不同数据增强效果的无标签图片,以及在模型训练过程中计算针对生成图片的损失,在主流数据集上提高行人再识别的准确度,并且优于当今主流算法。