论文部分内容阅读
人脸识别是生物特征识别领域内重要的研究课题,在社会生活中有着广泛的应用,包括视频监控、安防、便捷支付等。传统的人脸识别算法在目标受控的场景下取得了很好的效果,然而在非受控环境下,受姿态、光照、表情变化等因素的影响,进行稳定的人脸识别比较困难,人脸识别的研究重点也逐渐地从受控环境下的人脸识别转变为非受控环境下的人脸识别。在姿态、光照、表情变化这些挑战中,姿态问题是最重要的课题之一,研究人脸多姿态问题对实际的应用具有重大的意义。本文的具体研究内容为多姿态人脸识别的算法研究,涉及人脸辨识(1: N)和人脸认证(1:1)两个问题。主要关注于人脸姿态合成和人脸姿态归一两类方法。本文首先对多姿态人脸识别问题进行描述,介绍现存的相关算法。然后以人脸姿态合成与人脸姿态归一两类方法为思路进行研究内容的展现。对于人脸姿态合成算法,首先对从单一输入人脸图像重建三维模型的方法——通用伸缩模型(Generic Elastic Model,GEM)进行了扩展,扩展为多深度通用伸缩模型(Multi-Depth Generic Elastic Model,MD-GEM),利用了人脸轮廓深浅是线性变化的这一假设,弥补了 GEM使用单一的深度图模型建立三维模型的不足,在MultiPIE数据库上的多姿态人脸识别实验证实了 MD-GEM对于GEM改进的有效性;然后利用商图像(QuotientImage,QI)方法对GEM进行光照方面的扩展,利用多姿态多光照虚拟样本的合成思路基于单一训练样本进行多姿态多光照的人脸识别。在MultiPIE数据库上的多姿态多光照人脸识别实验取得了 91.1%的识别率,与state-of-the-art相当,同时具有需要训练样本少,需要调节的参数少的特点。对于人脸姿态归一算法,首先本文提出了一种基于三维模型的能够保持输入人脸光照情况一致性的算法。仅仅基于五个人脸关键点,进行三维模型的拟合。利用轮廓线的检测来对人脸自遮挡的区域进行准确的估计,再利用商图像这一关于人脸左右对称且与光照无关的特征,对自遮挡区域进行填充,使输出结果能够保持输入人脸的光照情况。此方法同时提供了进行光照归一化的思路。在LFW人脸认证实验上取得91.5%的认证率,在MultiPIE多姿态人脸识别实验上取得99.5%的识别率,与同类方法相比为state-of-the-art的表现,带有适用于真实世界场景应用的优点。然后进行了基于深度学习的姿态归一的探索,将姿态光照归一看作为一个非线性变换问题,通过深度卷积神经网络进行求解。通过姿态光照样本合成的思路来进行数据增强,在大大减少所需训练样本的情况下,达到了与其他同类方法相当的识别率。本文最后分析比较了文章中各类研究算法的优势与不足,并提出了可扩展的研究方向。