论文部分内容阅读
由于人脸表达了与人类特性相关的重要信息,因此人脸识别在入口验证、身份识别、人机交互等方面得到了广泛应用,在最近十多年内更成为了图像分析和理解领域的热门研究话题。广泛的人脸应用衍生了丰富的人脸研究内容,包括人脸定位、人脸识别、年龄估计和性别分类等。本文主要研究内容为:采用人脸跟踪实现人脸目标定位;识别目标人脸身份;估计人脸目标表观年龄。为此对人脸定位、人脸识别和人脸年龄估计三个模块作出了不同程度的改进和优化,主要贡献如下:1)人脸目标定位是人脸相关研究的基础,其定位结果对后期处理有很大程度的影响。优秀的人脸跟踪算法能与人脸检测协同使用,得到更精确的人脸目标。针对单一特征跟踪人脸目标不具有鲁棒性的缺陷,设计了在扩展跟踪框架CSK中融合纹理、颜色、亮度三种不同人工设计特征的算法,发挥多线索目标表达的优势,实时地跟踪人脸目标,取得了74.35%的跟踪精度,高出性能较好的KCF算法6.9%。2)本文采用扩展性良好的卷积神经网络(Convolutional Neural Network,CNN)网络结构自动学习目标表达代替手工设计的特征。为减少参数选择和训练的复杂性,采用4-5层卷积的Lighten CNN结构,在卷积层引入NIN深度结构增强了学习特征的抽象表达能力。首先,在CNN自学习的特征表达后引入PCA降维去冗余,识别率较原模型增长了0.3%。其次,因CNN训练采用识别任务监督,而LFW库是验证任务,受特征提取和分类器结合的启发,将CNN看作是自学习的特征提取子,倒数第二层的特征表达隐层作为分类器SVM的输入,协同获得更优的结果。最后,改进原CNN网络结构,在保留单模型结构的基础上,使用PRe LU激励函数代替原MFM激励函数,单参数空间更小,更容易优化;不采用池化层,减少了损失且增加了运行速率;为了降低类内偏差,增加类间差异提高识别结果,CNN引入验证和识别双监督信号来约束CNN的特征学习能力,在LFW库上获得了98.67%的识别率,较原结构增长0.9%。3)人脸图像年龄的估计成为继人脸识别后新一轮的关注焦点。年龄可看作是分类问题或者回归问题,不同的模型对应了不同的处理方式。本文在基于CNN-DEX模型的基础上,使用深度监督和延迟传导方式,引入分类回归双Loss监督。分类采用softmax Loss监督,回归采用线性回归L2 Loss和支持向量回归Hinge Loss监督。在数据库Image Net和IMDB-WIKI上进行模型预训练,在人脸表观年龄数据库LAP微调获得了2.995岁的年龄误差,较LAP ICCV2015挑战赛冠军DEX算法降低了0.24岁。