基于卷积神经网络的人脸图像年龄估计算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wilson_rui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度神经网络研究的推进,人工智能技术也迅猛发展,尤其是计算机视觉相关技术。通过计算机视觉技术可以模拟人类视觉功能辅助监控和生产,因此数十年来研究人员一直在进行相关任务的研究。人脸年龄估计作为计算机视觉的研究方向之一,在人机交互、法律条款推进、广告投放以及安防监控等方面有着重大的影响和良好的发展前景。
  人脸年龄估计是通过对输入的人脸图像进行判断得到具体年龄的过程。人脸年龄估计系统的准确率主要依赖模型空间的构建和输入数据的质量。在模型构建方面,现有的算法大多直接使用深层抽象特征进行预测,并且采用复杂的决策方案,损失了大量的底层信息造成模型精度下降的同时增加了模型构建复杂度。在数据方面,由于性别因素的存在扩大了数据类内方差,导致输入空间存在异构性,模型精度下降。为解决上述问题,本文提出了以下方案:首先设计了双向融合特征提取网络,通过对正、反向融合机制的结合使模型能够提取丰富的底层和抽象特征,避免因底层特征丢失导致的模型精度下降。其次,基于年龄标签之间存在相关性的现象,本文对模型的损失函数进行研究,提出了类方差损失函数对模型预测概率分布进行评估,并对不合理的概率分布做出惩罚。通过类方差损失函数和交叉熵损失函数对模型进行联合监督,促进概率分布的合理性。最后,本文尝试探索数据中由性别因素导致的异构性对于模型精度的影响。通过分析提出包含线性、非线性以及自适应映射三种消除策略的性别因素消除模块。该模块通过三种策略探索人脸特征向量和性别特征向量之间的关系,并对特征进行分解以消除人脸特征存在的性别因素,达到缓解数据存异构性的效果。
  本文分别在MORPH,MEGAAGE以及MEGAAGE-ASIAN等三个较大规模的公开人脸年龄数据集上进行实验。将改进后的整体模型和现有的研究方案进行比较,结果验证了本文提出的改进方案的有效性。本文在小型数据集FGNET上进行实验,模型同样达到了目前较好水平,表明本文提出的模型在小规模数据集上同样具有较好的收敛效果。
其他文献
本文针对矿山排水系统中的水泵机组调度问题,以水泵机组所耗电费最小、水泵负载均衡为目标,以分时电价为基础,建立了相应的约束优化模型,进而结合水泵调度问题的特点,提出了基于群智能优化算法的调度算法。本文的主要创新点包括:  (1)给出了矿山排水系统中水仓水位预测算法。矿山排水系统启停的主要约束是水仓水位不能超过预定的阈值,对水仓水位进行预测是实现优化调度的基础,其关键是对涌水量进行预测。为此,提出了基
云计算使得用户可以通过互联网来使用应用程序、计算、服务和存储。通常情况下,为确保计算效率以及智能手机的能源效率需要使用很多软件和硬件。近年来,随着科技不断进步,已经引入了许多新技术来最大限度地利用资源并降低成本。在数据中心中,云计算可以托管多种类型的异构虚拟机VM,并提供灵活性、安全性、支持以及比传统数据中心更好的维护等。在云计算中,需要解决  在云计算中需要考虑能源使用优化、资源利用、减少时间消
学位
云端融合计算是大数据发展的产物,是当前主流的一种计算范型,它是多种计算形态的结合,其发展经历了两个阶段,形成两种不同的架构:移动计算和云计算融合的云/端融合架构;边缘计算出现之后,终端、边缘节点、云计算中心三者结合的云边端融合架构。在云端融合中,计算迁移(Computation Offloading)是一种重要的计算模式,即终端设备通过向远程具有较强计算能力的设施(边缘节点或者云服务器)迁移部分计
学位
医学图像分割在临床研究中有非常重要的应用,可用于治疗可视化及手术计划等应用。虽然已经有大量人脑组织图像分割的相关研究,但是,已有的分割技术要么太复杂,要么对某些应用来说不够准确。为此,本文提出了三种新的医学图像分割算法。  首先,利用模糊水平集方法的中值滤波器来提出磁共振成像(MRI)脑组织图像的模糊分割。MRI图像用作输入图像,利用中值滤波器和模糊C均值(FCM)聚类来分别去除图像噪声并创建图像
学位
图像的相似性或失真性评估对图像处理和计算机视觉的广泛应用至关重要。已经提出了很多基于统计学的图像相似度量方法来处理特定类型的图像失真,如具有广泛应用的经典结构相似度度量技术SSIM。  由于涉及诸如头部姿势、不同类型的光照和不同面部表情之类的重大挑战,人脸识别被认为是图像相似性研究中最艰巨的挑战之一。提出了四种新的用于人脸识别的图像相似性度量方法,进而来完成人脸相似性检测和人脸识别,并对提出方法进
学位
图像相似性评估和人脸识别评估在图像处理和机器视觉领域具有广泛的应用,研究者已经提出了许多测量方法来应对图像相似性和人脸识别评估技术所面临的挑战。  本文着重从统计学和信息论两个方面研究图像识别的相似性。研究表明信息论方法和统计方法在图像识别中具有较好的性能,但混合方法在相似性判断上具有更好的效果。利用功能和通用规则对面部和非面部图像相似性评估进行了深入研究,特别研究了它们的性质及其对相似性和判别的
学位
近年来,人脸检测和行人检测是计算机视觉中非常重要的研究课题,并且取得了相当大的进展。然而,基于二者的人数统计任务在实际应用中仍存在限制。人脸检测方法仅仅能够检测人脸,这就意味着当人背对着摄像头时,该目标就会漏检;同时由于室内场景的复杂性,身体的大多数部位都是不可见的,所以行人检测的方法同样不可行。而人头检测就没有上述限制。在人头检测领域,虽然已经有相关团队基于传统图像处理方法及深度学习方法对其进行
学位
从海量的数据中挖掘出有价值的模式是非常重要的研究领域。数据挖掘的早期研究主要集中在频繁模式挖掘,目标是识别出在事务数据库中出现次数较多的项目集。这些频繁的模式能够帮助企业更好的理解数据并且提供决策支持。然而随着数据丰富度的增加,模式的频次信息不能满足工业界的应用需求,因此面对复杂的数据类型和多样的属性信息,许多基于频繁模式挖掘的拓展研究被相继提出。其中,高效用序列模式挖掘是近年来重要的研究领域之一
随着城市交通系统建设的快速发展,目前无人驾驶技术受到了越来越多的关注。如何保证高速行驶的无人车的安全性成为了无人驾驶技术的研究重点之一。场景深度推断和自运动检测作为无人驾驶技术的两个关键问题,对它们的深入研究将有助于无人驾驶技术安全性与可靠性的发展。目前激光雷达和GPS等传感器被广泛应用于场景深度推断和自运动检测问题研究,然而,它们普遍存在成本较高、对噪声和对人为干扰敏感等问题。随着照相机技术的快
驾驶事故是当今社会最严峻的问题之一,约九成驾驶事故是由于驾驶员行为不规范引起,利用准确高效的监管系统可有效降低事故发生概率。但现有系统面临诸多问题:使用机器学习方法提取特征,计算速度较慢,时效性较差;异常驾驶行为样本过少,难以训练有效分类模型;现有模型结构单一,分类精度差强人意。因此,设计精度高,速度快的驾驶员行为分类算法尤为重要。  针对以上问题,本文提出基于深度学习的驾驶员行为分类算法,利用目
学位