论文部分内容阅读
行人重识别对公众安全监督有着重大的意义,目前仍处于实验研究阶段,而过拟合问题是制约行人重识别技术应用的重要因素之一。目前有效的解决方法主要是数据增强和正则化。前者通常利用简单的翻转,擦除,多尺度输入等操作,实现网络性能的有限提升;以Dropout为代表的正则化方法,利用对特征随机置零策略来加强各特征之间的独立性,但是随机置零操作忽视了各特征对网络识别性能贡献的差异性。针对以上两个问题,本文从精确干预网络训练以及数据风格转换的角度出发,提出新的正则化和数据增强来更有效地提升网络的泛化性。具体研究工作和成果如下所示:(1)提出了一种基于易分丢弃(Drop Easy)策略的行人重识别方法。本文将特征分为易分特征和难分特征。首先在全连接层中提出了Drop Easy1d方法,主要思路是通过计算正负样本对特征向量间的距离,将容易区分的特征置零,而将难以区分的特征保留,仅利用难分特征对网络的学习进行约束;接着考虑到在离散置零特征的情况下,网络容易通过非零特征进行信息补全,从而失去正则化作用。因此本文进一步提出了能有效用于卷积层的Drop Easy2d方法,通过滑窗方式寻找特征图上的易分特征区域将其置零,保留难分特征区域,有效约束了网络学习。实验结果显示上述方法能有效提升网络的特征提取能力和泛化性能。(2)提出了一种基于感兴趣区域擦除(ROIErase)的行人重识别方法。首先根据注意力机制,在网络第一次前向传播时利用CAM(Class Activation Mapping)算法找到感兴趣区域,然后采用双线性插值算法将特征图扩展到与输入图片一致大小,接着根据感兴趣区域的位置,逐像素地对输入图片进行擦除,最后再次进行前向传播和反向梯度传播过程以更新权值。实验结果表明,对图片进行精确擦除比随机擦除更有效果,上述方法潜在地驱使网络深入挖掘可能被忽略的辨别性的细节,提高了干预效果和干预强度,最终提升了网络的辨别能力和泛化性能。(3)提出了一种基于多风格转换的数据扩充方法。首先构建生成对抗网络(GAN),将补充数据集按训练数据集的多种风格进行转换,旨在减轻不同数据集之间的特征空间分布的偏差,从而达到扩充数据集的目的;然后提出了一种数据筛选的概念,构建一个筛选器用于滤除转化质量不高的图片,用于剔除冗余的转化图片,提高网络的训练效率;最后建立行人重识别网络,将扩充后的数据集用于训练。实验结果表明上述方法能有效抓取数据的各种风格并进行有效转换,从而有效减轻不同域之间的特征空间分布的偏差,以达到扩充数据,解决网络的过拟合问题。