基于深度学习的人脸表情识别研究

来源 :南京理工大学 | 被引量 : 9次 | 上传用户:tanyanlong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习方法在自然图像、自然语言、人脸等众多机器学习领域获得了较好的性能,且引起了学术界与工业界的广泛关注。深度学习研究的是一大类拥有多层非线性变换的模式识别系统,这些系统将数据从低往高逐层抽象,相比于浅层方法更适合于对真实世界中的高度非线性问题进行建模。
  人脸表情识别是一个典型的高度非线性问题,本文围绕人脸表情识别问题,研究探索了二值神经网络、二值自编码器、二维卷积神经网络、带有视觉注意力的卷积神经网络、卷积-反卷积神经网络、三维卷积神经网络等多种深度学习方法,主要的研究工作成果概述如下:
  (1)提出了基于二维卷积神经网络的人脸表情识别方法,并在此基础上研究了一种卷积特征迁移方法,虽然该网络的性能较好,但其决策不具备可解释性,而心理学将表情解释为脸部局部肌肉运动,这些运动固定地发在特定感兴趣区域内,为了研究这些感兴趣区域,以改进人脸表情识别的性能,同时从机器学习角度验证有关表情的心理学定义,本文进一步提出了基于视觉注意力的人脸表情感兴趣区域提取与人脸表情识别方法,借助基于视觉注意力的特征聚合,可放大感兴趣区域内部有效信号、抑制背景中的无效噪声,从而提高人脸表情识别准确率。
  (2)人脸表情识别系统需要对人脸图像中的表情信息敏感而对身份信息保持不变,为了研究人脸表示中表情与身份两种不同成分,本文提出了由一对18层卷积-反卷积神经网络构成的系统:NET-3,将其用于表情与身份两组互补特征的提取,互补特征可应用于人脸重构、人脸合成、人脸插值、人脸表情识别与人脸身份验证。为了配合实验,还创建了LSFED大规模合成人脸表情数据集,该数据集是目前同类型中规模最大的。
  (3)大多数人脸表情识别算法的识别依据是静态的人脸外观,而心理学将表情定义为人脸动作单元的组合,通过动作往往比外观能更准确地识别人脸表情,为了充分利用视频数据中丰富的动作信息,本文还研究了基于三维卷积神经网络的人脸表情动作识别方法,定义了一个完整的三维卷积神经网络基本框架,讨论了三维卷积神经网络的一般设计原则,提出了三维Gabor特征与光流特征两种三维底层特征,提出了3DCNN-A、3DCNN-B、3DCNN-C与3DCNN-D四种不同结构的三维卷积神经网络,并提出了不同特征与不同网络组合的高效的决策层融合方法,最终获得了较高的准确率。
  (4)主流深度学习算法往往比浅层方法需要更多的计算资源,为了降低大型深度网络对高速处理器与大容量存储器的依赖,实现快速的实时的计算,本文研究了基于多尺度稠密局部二元模式特征、栈式二值自编码器与二值神经网络的快速人脸表情识别,以最低的硬件要求,即较少的内存和计算消耗,实现了较高的人脸表情识别准确率。
其他文献
目的:1. 研究N-乙酰半胱氨酸(NAC)对神经胶质瘤细胞Notch2信号通路的抑制作用并阐明其发生机制。2. 明确NAC对Notch2信号的抑制效应对体内外神经胶质瘤生长的影响,为NAC用于神经胶质瘤的临床治疗提供一定的实验和理论依据。  方法:1. 分别用Western Blottingting和Real Time-PCR实验检测NAC对U87和U251细胞Notch1、Notch2、Notc
有丝分裂是真核细胞生长与增殖的主要方式,是遗传物质平均分配给子代细胞的重要基础。有丝分裂中,染色体的排列和分离均依赖于染色体着丝粒两侧的蛋白质复合体—动粒。动粒是由数十种核心蛋白在着丝粒上组装形成的大分子复合物,在染色体上呈现盘状特化结构。在染色体着丝粒部位,部分组蛋白 H3 被其变构体CENP-A 所取代,形成 CENP-A 核小体并启动内层动粒的分子组装。在有丝分裂前期,动粒内层招募由KNL1
学位
NH3-SCR作为降低柴油机NOx排放最有效的方法之一在国外被广泛应用。为进一步研究满足更严格排放法规柴油机的NH3-SCR系统,本文针对柴油机NH3-SCR的特点搭建了柴油机尾气模拟反应测试系统;此外,鉴于目前在用SCR催化剂毒性较高、污染环境的缺点,作者在深入研究钒基催化剂组成、制备工艺与性能之间关系的基础上,开发了含铁低钒环境友好型催化剂。本文工作内容如下:1.开发了先进的柴油机尾气模拟反应
学位
随着人们对环保性问题的日益重视以及对电网供电质量要求的不断提高,以往仅仅考虑经济性的单目标优化已经跟不上新时代对现代电力系统运行控制的要求。当代的电力系统需要同时综合考虑发电成本经济性,发电环保性,电网安全性、可靠性和稳定性以及减少电网有功线损这些问题。因此,研究电力系统多目标优化对如今电网的运行有着实际的指导意义。不仅如此,随着大规模微网、分布式能源的开发与利用均通过以电网为骨干网的能源系统将能
全球变暖与大气污染是威胁人类生存的两大环境问题。火电厂在发电过程中会产生大量的温室气体及大气污染物,前者主要以CO2为代表,后者则以PM2.5、SO2、NO2的影响最为严重。作为碳排放和空气污染物排放的最重要主体之一,电力工业在低碳、低大气污染发展中担任着重要的角色。近年来,电力系统最优环境经济调度技术因其无需增加多余建设成本、收效较快而引起学者的广泛关注。  大气中温室气体的含量直接决定着大气对
学位
风力发电技术的发展使大规模风能资源得到了开发和利用,然而我国源-荷逆向分布制约风电的消纳,远距离输电是解决风电消纳问题的重要手段,固定串补能显著能提高线路的输送能力,增加系统的稳定裕度,在远距离输电中广泛应用并带来次同步振荡问题;但风电场规模庞大,单机容量小,建模复杂,是研究次同步振荡等风电并网动态问题的重要瓶颈,为此需要对双馈风电场进行等值建模,借助于等值技术,可有效地研究次同步振荡问题。因此,
该论文介绍了MgB的重要超导特性和提供了研制MgB超导薄膜的有价值的新方法.该论文创建了一种新的制作MgB超导薄膜实用技术,化学气相沉积两步法异位退火法合成MgB超导薄膜,采用这种新方法制备MgB超导薄膜的基本过程为:先以BH为B源在衬底上化学气相沉积先驱B薄膜;然后先驱B薄膜在Mg蒸气中高温退火形成MgB超导薄膜.这种新方法成功地在AlO多晶和单晶衬底上制备了MgB超导薄膜.在多晶AlO衬底上制
学位
该文的主要工作有以下几点:(1)根据专利01250270.7提出的横向流动和电激励相结合的方法来提高TEA CO激光器的重复率的新思想,建立了TEA CO激光器的理论模型.(2)根据双曲函数保角变换的基本原理,分析了放电电极的特点,讨论了电极面形变化对电极之间电场分布的影响,对几种不同的电极面形结构进行了对比和研究.(3)给出了风机、导风板、球隙、腔镜结构等主要部件的结构形式和设计计算方法,为新结
学位
该文首先阐述了质子交换LiNbO波层结构特性、质子浓度分布、折射率分布基本理论,论述了折射率测量方法迭代法.并用三维FD-BPM法对的质子交换LiNbO波导传输模式进行了研究,确定符合器件设计要求的单模波导的尺寸和工艺参数.该文对质子交换LiNbO单Y相位调制器的重要部件Y分支进行了深入的研究,比较了不同S弯曲形式的Y分支过滤长度与损耗的关系,并计算出间距250μm时的最小弯曲长度.对于调制器的电
学位
该文研究了脉冲预电离的扩散冷却CO激光器的运转机理,提出采用脉冲预电离技术改善纵向脉冲放电的稳定性、降低工作电压和提高电光转换效率.提出了两种新的预电离技术.采用螺旋结构横向脉冲预电离技术首次研究了非自持纵向放电CO激光器,非自持激光器的主放电和输出功率由外加的预电离脉冲控制,激光器的可控性非常好.该文还发展了一种采用Pspice软件对脉冲预电离放电进行瞬态模拟的理论分析方法,有利于激光器放电电路