融合局部特征的行人重识别神经网络模型

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cet1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会中监控设备的大量部署,对监控画面的人工检视显得力不从心,智能监控领域的研究正受到越来越多的关注。行人重识别则是智能监控中的核心一环,主要研究内容是从无重叠视场的监控画面中查找出指定的行人目标,用来刻画该目标在监控点之间的移动轨迹。行人重识别的研究可以被看作是一个类似模式识别的分类问题,一般由对行人的特征提取和对特征进行度量两步完成。行人重识别的很多研究都关注于对行人的特征提取方面。由于行人图像的复杂性,传统计算机视觉领域的方法往往难以定义出一个良好的特征描述子;而近年来兴起的深度神经网络模型,虽然已经具备了一定的行人重识别能力,但其往往都是对图像的全局像素进行无差别的学习,无法区分图像的重点区域。考虑到行人图像中常有一半左右的像素属于背景画面,与行人目标没有直接关系,影响了特征的质量,因此本文希望在引入深度网络模型的基础上,强化行人目标对特征的影响,弱化噪声干扰,来提高行人特征描述子的质量,获得更高性能的模型。本文首先基于表征学习的思路提出了一个特征融合网络,将行人的局部特征和全局特征融合成一个统一的特征描述子来对行人进行识别和分类。该网络模型由3部分组成:行人局部特征提取模块、全局特征提取模块和特征融合模块。局部特征提取模块使用了改进的LOMO方法来描述局部特征,该方法将提取LOMO特征的范围限定在行人目标的主体区域中,尽可能的排除背景像素对特征造成的干扰,来强化前景像素的影响;全局特征提取模块选用了近年表现较为突出的深度残差网络模型,获得行人全局特征向量;特征融合模块通过训练神经元,将行人的局部和全局特征向量相融合,并完成对行人图像的识别、分类工作。最后通过在主流的行人重识别数据集上进行对比实验,证明该特征融合网络的性能优于传统的特征提取方法和单一的深度神经网络模型。随后本文在度量学习方法上对该特征融合网络进行进一步改进和优化,以特征融合网络为基础,提出了一个融合行人局部特征的三元组度量模型。通过特征融合网络计算三元组的特征向量,并度量出特征的距离,训练模型完成推开负样本对、拉近正样本对的工作。为了保证模型的训练效率,模型通过难样本取样的方式从数据集中选取样本构成输入的三元组。通过对比实验,该三元组度量模型进一步提高了特征融合网络的分类精度,达到了优化模型的目的,同时也证明了度量学习的方法在规模较大的数据集上,相较表征学习能取得更好的准确性。
其他文献
通过对中国学生在英语学习中常犯错误的分析分类,用语言学的分支学科语义学来指导教学活动,使课堂教学上升到新的理论高度,从而改进大学英语教学。语义学在英语教学中的应用归纳
目的探讨急性手外伤患者社会支持程度与心理状态、生活质量、手功能恢复相关性。方法选择我院2017年1月-2018年1月间收治的116例急性手外伤患者临床资料为本研究对象,根据患