基于卷积神经网络的行人重识别方法研究

来源 :武汉大学 | 被引量 : 1次 | 上传用户:bartech
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别(Person Re-identification,Person Re-ID)问题是要判断两张分别从视场无交叠的两个摄像头下检测到的行人图像是否对应于同一个人(行人ID)。行人重识别在刑事侦查领域的智能视频监控中有极高的应用价值。利用行人重识别技术还可以计算公共场所的人流数据,以此帮助优化交通系统的设计和改进,或者帮助商场优化商品布局。由于摄像头光照条件差异、摄像头视角差异、行人姿态差异、遮挡等因素的影响,不同摄像头下的行人图像往往存在较大差异,即使这两张图像属于同一个人。随着深度学习技术在行人重识别领域的应用,多个大规模行人重识别数据集上的最好测试分数得到了极大提升,但当前各种行人重识别算法的性能还远不能满足应用需求。本文设计了一种通过特征图匹配进行行人重识别的卷积神经网络模型,主要贡献如下。1.在使用基于特征图匹配的思路进行行人重识别时,存在摄像头光照差异问题和待匹配行人图像间的不对齐问题,如果使用简单的欧氏距离或L2距离这种逐元素对称性相似性度量方法来进行匹配分数计算,会导致不理想的行人重识别效果。为解决上述问题,本文提出了一种新颖的行人重识别卷积神经网络模型:“辫状网络”(BraidNet)。辫状网络包含一种特殊的“W型卷积层”(WConvLayer),W型卷积层有两个相同尺寸的输入特征图和两个相同尺寸的输出特征图。在一个辫状网络中,由特征提取子网络分别提取两张输入行人图像的特征图,再将这两张特征图送入级联的W型卷积结构(包含ReLU激活层和池化层)中,输出的两张特征图逐元素相加后送入后续的子网络中,得到用以指示两张输入行人图像是不是对应于同一个人(行人ID)的匹配分数。理论上,单个W型卷积层或级联的W型卷积结构可以在待匹配行人图像间存在不对齐情形和色彩差异情形的情况时,从上述情形中挖掘有利于后续匹配的证据。2.当卷积神经网络使用ReLU激活函数时,网络训练过程中会出现“零梯度问题”(ZeroGradientProblem)。“零梯度问题”是指一些通道上的响应值永远为负数,且计算这些通道响应的权值参数永远得不到训练,进而使得卷积神经网络的拟合能力降低。为了解决这一问题,本文提出了一种简单的“通道放缩层”(Channel Scaling Layer),对每一个输入通道上的响应值乘以一个限定为正的因子后作为输出,在网络训练的过程中同时训练这些恒正因子的取值。本文定性证明了通道放缩层可以缓解网络训练过程中的零梯度问题,还通过建立通道放缩层和网络模型剪枝评价指标的联系来说明了通道放缩层可以在网络训练过程中学习每个通道在网络模型中的重要性。3.本文设计的辫状网络是一个二分类网络模型,在网络训练过程中会产生正负训练样本不均衡问题。为解决正负样本不均衡问题,本文提出了“样本比例学习”(Sample Rate Learning)策略,可以在网络训练过程中动态调整每个Batch中的正负样本比例,从而避免了人工指定正负样本比例带来的超参数难以优化设置的问题。在 CUHK03-Detected、CUHK03-Labeled、CUHK0I、Market-1501、DukeMTMC-reID和DukeMTMC4ReID数据集上,本文通过一系列对比实验和特征可视化说明了上述三点贡献的有效性。最后,本文还对辫状网络的特点和应用场景进行了总结和展望。
其他文献
本文提出了一个城市公路交通网络的分层模型。模型认为,车流有自由流动和拥挤流动两种状态。两种状态下的车流密度、流率等车流信息均以波的形式传播,波速大小几乎恒定但方向不
运动控制是自动化研究领域的一个重要分支,是推动新产业革命的关键技术之一。运动是机械学科的重要概念,而控制则是控制学科的研究对象和研究内容,因而运动控制具有跨学科的性质
变电站规划是城市电网规划的重要内容,本文针对现有算法的缺点和不足,提出了基于加权Voronoi图的变电站规划算法,并在此基础上做了进一步的完善和改进,主要包含以下几个方面:1、本文采用了加权Voronoi图的变电站规划算法,并加入了选址过程中已有站容量的变化,增加考虑了对孤立负荷点及孤立站以及规避不可建站区域的处理方案,大大缩短了程序的运行时间,而且算法能保持很好的收敛性。2、本文提出了基于运输模
防灾、减灾和救灾事关人民生命和财产安全,是国家公共安全的重要组成部分。在危险和恶劣的灾后环境中,救援机器人是一种可以协助救援人员进行相关搜索探测和救援工作的重要辅助
LXI总线是一款相对新型的仪器总线,其结构开放,且不需要专用机箱,为组建分布式自动测试系统提供了十分便利的条件。同时LXI总线与其它仪器总线组建的混合测试系统也为测试复杂的被测对象提供了一种方便、灵活的解决方案。示波器是一种综合的信号特性测试仪,可以形象地显示信号随时间变化的波形,是电子测量仪器中的基本仪器,也是应用最广泛的电子测量仪器。本文首先介绍了仪器总线的研究背景以及国内外示波器的发展现状,
How to retrieve the vast audio information effectively and efficiently is not only a hotspot for researchers, but also a trend for the industrial community to b
学位
相似性度量是模式识别的基本问题,很多算法的性能都极大地依赖于相似性度量的好坏。例如排序、最近邻分类、聚类和各种基于图的半监督学习算法均以样本间的距离度量为基础。另
学位
由于水下复杂的操作环境,自治水下机器人动态方程的高度非线性和水力系数很难精确预测。这些困难通常会导致自治水下机器人控制器设计的复杂性。神经网络由于它非常好的非线性
运动/力协同控制技术是制约我国精密电子组装生产的技术难题之一,它涉及基于视觉的高速运动、精确定位与恰当力的优化控制等核心科学问题。随着日益增长的电子元器件组装需求,
现代社会中摄像机作为人类视觉的延伸,已经进入人类社会的方方面面。智能视觉监控系统作为安全监控的一种有效手段受到了各国政府的高度重视。目前,已有的智能视觉监控技术主要
学位