论文部分内容阅读
近年来,随着深度神经网络研究的推进,人工智能技术也迅猛发展,尤其是计算机视觉相关技术。通过计算机视觉技术可以模拟人类视觉功能辅助监控和生产,因此数十年来研究人员一直在进行相关任务的研究。人脸年龄估计作为计算机视觉的研究方向之一,在人机交互、法律条款推进、广告投放以及安防监控等方面有着重大的影响和良好的发展前景。
人脸年龄估计是通过对输入的人脸图像进行判断得到具体年龄的过程。人脸年龄估计系统的准确率主要依赖模型空间的构建和输入数据的质量。在模型构建方面,现有的算法大多直接使用深层抽象特征进行预测,并且采用复杂的决策方案,损失了大量的底层信息造成模型精度下降的同时增加了模型构建复杂度。在数据方面,由于性别因素的存在扩大了数据类内方差,导致输入空间存在异构性,模型精度下降。为解决上述问题,本文提出了以下方案:首先设计了双向融合特征提取网络,通过对正、反向融合机制的结合使模型能够提取丰富的底层和抽象特征,避免因底层特征丢失导致的模型精度下降。其次,基于年龄标签之间存在相关性的现象,本文对模型的损失函数进行研究,提出了类方差损失函数对模型预测概率分布进行评估,并对不合理的概率分布做出惩罚。通过类方差损失函数和交叉熵损失函数对模型进行联合监督,促进概率分布的合理性。最后,本文尝试探索数据中由性别因素导致的异构性对于模型精度的影响。通过分析提出包含线性、非线性以及自适应映射三种消除策略的性别因素消除模块。该模块通过三种策略探索人脸特征向量和性别特征向量之间的关系,并对特征进行分解以消除人脸特征存在的性别因素,达到缓解数据存异构性的效果。
本文分别在MORPH,MEGAAGE以及MEGAAGE-ASIAN等三个较大规模的公开人脸年龄数据集上进行实验。将改进后的整体模型和现有的研究方案进行比较,结果验证了本文提出的改进方案的有效性。本文在小型数据集FGNET上进行实验,模型同样达到了目前较好水平,表明本文提出的模型在小规模数据集上同样具有较好的收敛效果。
人脸年龄估计是通过对输入的人脸图像进行判断得到具体年龄的过程。人脸年龄估计系统的准确率主要依赖模型空间的构建和输入数据的质量。在模型构建方面,现有的算法大多直接使用深层抽象特征进行预测,并且采用复杂的决策方案,损失了大量的底层信息造成模型精度下降的同时增加了模型构建复杂度。在数据方面,由于性别因素的存在扩大了数据类内方差,导致输入空间存在异构性,模型精度下降。为解决上述问题,本文提出了以下方案:首先设计了双向融合特征提取网络,通过对正、反向融合机制的结合使模型能够提取丰富的底层和抽象特征,避免因底层特征丢失导致的模型精度下降。其次,基于年龄标签之间存在相关性的现象,本文对模型的损失函数进行研究,提出了类方差损失函数对模型预测概率分布进行评估,并对不合理的概率分布做出惩罚。通过类方差损失函数和交叉熵损失函数对模型进行联合监督,促进概率分布的合理性。最后,本文尝试探索数据中由性别因素导致的异构性对于模型精度的影响。通过分析提出包含线性、非线性以及自适应映射三种消除策略的性别因素消除模块。该模块通过三种策略探索人脸特征向量和性别特征向量之间的关系,并对特征进行分解以消除人脸特征存在的性别因素,达到缓解数据存异构性的效果。
本文分别在MORPH,MEGAAGE以及MEGAAGE-ASIAN等三个较大规模的公开人脸年龄数据集上进行实验。将改进后的整体模型和现有的研究方案进行比较,结果验证了本文提出的改进方案的有效性。本文在小型数据集FGNET上进行实验,模型同样达到了目前较好水平,表明本文提出的模型在小规模数据集上同样具有较好的收敛效果。