基于深度学习的人脸检测及表情识别方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wuchen112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测和表情识别是人机交互中的关键技术,并且在众多领域有着广泛的应用前景。近年来,随着深度学习方法在人脸相关领域的不断发展,人脸检测和表情识别技术受到了研究者们的广泛关注,已经成为计算机视觉和模式识别领域的热点研究课题。随着实际应用需求的不断增加,人脸检测及表情识别仍然面临复杂场景下的诸多挑战,如人脸姿态变化、光照变化、尺度变化、遮挡变化和身份信息变化等。这些非受控场景下的复杂情况会导致人脸检测和表情识别出现稳定性差的问题,从而降低人脸技术的应用价值。如何实现高性能、高效的人脸检测与表情识别成为了一个重要的研究课题。本文针对基于深度学习的人脸检测及表情识别的关键问题展开研究。主要的工作和贡献有:  (1)提出了一种基于区域卷积神经网络Faster R-CNN的人脸检测方法。利用深度卷积神经网络对小尺度人脸提取特征时,会使得该特征具有较强的语义信息表达能力,但是特征的分辨率太低,从而导致产生人脸检测错误。为了解决人脸检测中的小目标人脸和多尺度问题,本文提出了分步式的人脸检测方法。该方法分为两个阶段:第一阶段,提出了一种高效的基于级联Boosting人脸检测器的多任务RPN网络,以提高人脸候选区域的提取效率和回召率。第二阶段,提出了一种基于人脸候选区域尺度的并联式Fast R-CNN网络,针对不同候选区域的尺度进行分组,分别利用三个对应的Fast R-CNN网络进行检测,实现了针对人脸目标尺度特性的人脸检测,有效地提高了人脸检测精度。  (2)提出了一种基于高效卷积神经网络、滤波器剪枝和二值化网络参数相结合的网络压缩和加速方法。由于深度卷积神经网络的参数量和计算量过大,导致人脸检测方法的应用范围受到了限制。为了解决人脸检测中的检测速度问题,提出了三种网络压缩和加速方法以及融合策略:基于分组点卷积的高效卷积神经网络,从网络结构本身减小参数量;基于近似Hessian矩阵的滤波器剪枝方法,利用求取的Hessian矩阵估计低敏感度的滤波器并将其剪枝,从而有效降低内存占用并且提高网络的前向传播速度;基于二值化的网络参数化简方法,通过减少表示每个权重所需的比特数来压缩原始网络。进而,利用Faster R-CNN分步式的检测框架将融合后的加速网络应用到人脸检测任务中。通过消除实验验证了多种网络压缩和加速策略可以有效地进行融合,使得网络获得速度与精度之间更好的平衡点。  (3)提出了一种基于特殊关键点定位的多姿态表情识别方法。由于人脸可以视作一种凸球结构,因此人脸的姿态会导致自遮挡现象的产生,使得人脸的表情特征产生差异性,从而影响表情识别的精度。为了解决人脸表情识别中的姿态问题,提出了基于卷积神经网络的特殊关键点定位方法,利用特殊关键点之间的几何关系估计人脸的姿态。提出基于人脸姿态的感兴趣区域投影和特征图拼接方法,使得不同的人脸姿态对应不同的特征图拼接权重,以实现表情识别网络对姿态的自适应性。提出基于类内距离和类间距离的损失函数,在减小样本特征与类别中心类内距离的同时增大类间距离,进而增强不同表情特征之间的区分性。  (4)提出了基于身份信息增强的表情识别方法。在表情识别中,身份信息的改变会导致表情识别的混淆,不仅使得相同表情之间具有较大的差异性,同时不同表情之间又具有一定的相似性。为了解决表情识别中由身份信息改变导致的识别率下降问题,提出在表情特征的监督学习过程中利用身份信息来增强其判别性的方法,以实现表情识别网络对于不同的身份信息的自适应性。提出通过空间融合将身份信息与表情特征进行有效地融合,再利用基于约束的多任务学习来增强包含在表情特征中的身份信息特征。该方法将身份信息融合到表情识别任务中,有效地提高了表情识别的准确率。
其他文献
遥感图像变化检测技术在国土资源规划管理、自然灾害监测、军事目标打击效果评估等军民领域都具有重要的应用价值。通过高分辨率遥感图像可以检测到更加详细的变化信息,因此高
学位
我国蕴藏着大量的低品位有色金属资源,随着国民经济的快速增长,我国工业化进程的不断推进,如何经济有效地利用这类矿产资源,对我国的可持续发展战略具有极其重要的意义。作为
压电式微力传感器的低能耗、高灵敏度、易于与压电微执行器集成等优点使其具有良好的应用前景。压电式微力传感器的研究尚处于起步阶段,本文以基于PVDF薄膜的微力传感器为研
通用模型控制(CMC)是在一般模型控制(GMC)基础上,直接利用非线性过程,将非线性模型直接嵌入控制器中,在控制量不受约束的情况下,将非线性系统变为一个标准二阶线性系统。为了克服
智能车作为移动机器人的一种,是一个集环境感知、规划决策、自动驾驶等多种功能于一体的综合系统。为了提高智能车跟踪和运动性能,本文在分析智能车系统原理的基础上,从硬件
年龄作为一种重要的人脸属性,在人机交互、智能商务、安全监控和娱乐等领域都有着广阔的应用前景。自动人脸年龄估计作为一种重要的生物特征识别技术,目前已经成为模式识别和计
近年来,随着互联网技术的飞速发展,社交媒体、在线购物网站等越来越受到人们的欢迎,人们可以从这些丰富的网络应用中寻找各自感兴趣的内容或需要的物品。以用户为中心的网络数据
为了与车载运行时的情况相一致,汽车、摩托车、坦克等起动机性能测试目前一般以蓄电池作为电源。但在实际测试过程中,采用蓄电池作为实验用电源却不适宜。因为其特性多变使得测量出的结果很难具有重复性,容量的有限性使得对它的充电、保养及更换给测试工作又带来诸多不便,并且还增加了企业成本等。本课题以中国兵器工业集团201所电机启停性能实验供电研究为背景,提出一种用电气设备—整流电源取代蓄电池进行起动机性能试验的
反映企业产品质量、生产效率、生产成本等的选矿过程综合生产指标分解出的工艺指标将直接影响到各个工序的生产,综合生产指标主要包括综精产量、综精品位、金属回收率,工艺指
磨矿过程是所有选矿厂中最普遍、最通用、也是最重要的环节,其运行品质对于提高选矿厂产品质量和生产率至关重要。该过程具有多变量、强耦合、非线性严重、生产工况变化以及