基于深度学习的人脸表情识别及其应用研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:civili
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的迅猛发展,传统的人脸面部表情识别技术难以满足更精确的人机交互需求。基于深度学习的人脸面部表情识别研究受到国内外研究者的极大关注。然而,针对于人脸面部表情识别的深度卷积学习网络在网络结构和参数上还存在可优化的空间,因此研究具有更优化特性的深度卷积神经网络,对于提高人脸面部表情识别有着重要的实际应用价值。论文主要研究内容如下:
  (1)针对现有深度学习方法在表情识别中的细节网络结构设计不够优化,容易引起测试结果不佳,单一卷积神经网络模型无法结合表情序列数据的缺陷,本文设计了一种基于表情序列的的深度卷积学习网络结构(Deep Convolutional Neural Network Based on Expression Alignment, DCNNBEA)。该结构是在VGG16卷积神经网络的基础上,调整设计卷积神经网络相关层数,对人脸表情特征进行高效准确提取,同时结合长短期记忆网络(Long Short-term Memory, LSTM)进行图像序列预测分析,最终在fer2013数据集上跟其他同类方法进行对比实验,实验获得较好结果。
  (2)针对于人脸表情识别深度学习算法在训练过程中容易出现梯度消失和深度学习模型的参数初始化等问题,提出了一种可训练的多层网络激活函数(Trainable Active Function of Multiple Networks, TAFMN)。激活函数具有强大的函数映射表示功能,可通过增加线性和非线性的激活函数性能来提取潜在特征。此外,还研究了卷积核大小与数量的关系,寻找卷积核最优大小与数量参数关系。最终对整个网络参数进行整合,然后同样在fer2013数据集上进行训练和测试,跟同类方法相比,优化参数后的网络方法获得较好结果。
  (3)设计并实现了一种基于人脸表情识别的人机交互系统原型。该系统主要用于检测本文提出的人脸表情识别模型的有效性,同时也可将其运用于商场人机交互体验区,为人机交互行为提供一种良好的可能性。对获取到的用户脸部表情图片,进行图片处理,然后传入相关训练好的人脸面部识别模型中,最后快速得到检测结果,并将结果以友好的、可视化的、文字图表相结合的方式展示给体验用户。
其他文献
臧克家的文学创作中,新诗与旧诗占据着同等重要的地位。相较新诗而言,他的旧体诗创作及诗学观念对当代旧体诗词的发展有着更为重要的意义,但目前学界对其还缺乏足够的关注。本文在新旧对照的视野下,通过内部文本细读与外部社会历史批评相结合的思路,对臧克家旧体诗的思想内蕴、审美特征、诗学价值、诗学渊源等方面进行系统的梳理与总结,以勾勒出臧克家更为全面、丰富、立体的文学形象,并进一步分析其在中国现当代文学史中的重
学位
本文以1980年代兴起的“新笔记小说”为考察对象,首先梳理其兴起的背景、命名由来及随后开创的批评空间;然后再在重返文学史现场的期刊策划、选本编纂、作家创作个案研究的基础上,探讨新笔记小说的文学史意义。本文认为,以往研究受限于“新笔记小说”概念范畴的笼统认识,忽视了新笔记小说既受制于新时期文学意识,又对新时期文学发展在主题与文体方面都有所拓展的复杂性。而只有在对这一复杂性充分认识的基础上,总结新笔记
学位
1978至1980年,是新时期文学恢复与重建阶段。这一阶段的全国优秀短篇小说评选往往在全社会引发轰动效应,体现出一种可贵的全民参与热情。本文以新时期之初(1978-1980)“全国优秀短篇小说评选”获奖作家为考察对象,进而探究文学评奖与新时期作家队伍培养之间的关系,在此基础上,明晰新时期之初文学评奖的影响机制实际上是通过与评奖有关的合力因素的参与才得以实现。  第一章,新时期初期文学评奖的设立。对
学位
石黑一雄(kazuo Ishiguro,1954—),日裔英国小说家,2017年诺贝尔文学奖得主。1982年,石黑一雄的处女作《远山淡影》出版,并获得英国温尼弗雷德·霍尔比纪念奖。同年,石黑一雄被英国文学杂志《格兰塔》(Granta)评选为英国最优秀的20名作家之一。《远山淡影》是一部关于记忆、责任的小说。表面上,小说聚焦于主人公悦子对过去的回忆;实际上,是悦子因无法推卸大女儿自杀的责任进而对伦理
学位
20世纪末21世纪初,关于听觉性文化问题的跨学科研究正式出现,“听觉文化”作为一个愈加明晰的问题域受到学界广泛关注。本文以当代听觉文化为研究对象,整合并运用国内外听觉理论,挖掘本土化新兴听觉个案,探究数字媒介语境下听觉文化转向的发生语境与当代表征。第一章对“听觉文化”的研究对象与范畴做出界定,厘清“听觉转向”的概念内涵,并对当代听觉文化转向的发生语境具体分析。广义上的“听觉文化”是从生理学维度划分
在英语学习的过程中,由于语言本身以及文化和思维方式的差异,使中国学生遇到许多困难.在这其中,否定结构的表达方式是英语学习的难点之一.该文的目的是对英文和中文的否定现象进行对比,通过分析中英文否定表达方式的异同点使中国学生对这两种语言的差异有一个清晰的了解,从而提高他们学习和驾双英语的能力,同时这种对比研究的成果可以在英语教学和翻译领域中得到广泛的应用.由于该文旨在讨论英文和中文否定的差异,希望通过
学位
该文应用燃烧的基础理论和数学模型,对高温空气燃烧过程进行了理论分析和数学建摸.针对以燃料直接喷射(FDI)为代表的高温空气燃烧技术关键,以FORTRAN语言为编程工具,用自行编制的计算程序,分别对高温空气燃烧过程的三维湍流流动、湍流混合、湍流燃烧、耦合辐射传热过程和氮氧化物污染物NO的湍流生成进行了数值模拟,模拟计算结果与相似实验条件下的实验结果基本符合,变化规律一致.用自行编制的高温空气燃烧三维
受频谱资源限制,现有无线通信技术已很难承载未来更高速的传输需求。基于发光二极管(Light-emitting Diode,LED)的可见光通信(Visible Light Communication,VLC)融合了无线通信技术和光通信技术,具有不占用频谱资源、发射功率高、无电磁干扰等优点,是实现室内无线高速传输的一种补充技术。但LED有限的物理带宽使可见光通信的传输速率受到限制,多输入多输出(Mu
基于位置服务(Location based Service, LBS)的应用与需求爆发性的增长,使得全球导航卫星系统(Global Navigation Satellite System, GNSS)定位技术成为智能设备的基本组成部分。这就对室内、城市峡谷等恶劣环境下,利用GNSS信号进行定位提出了更高的要求。接收机工作在弱信号环境时,到达接收机的GNSS信号非常微弱,因此如何在信号衰减严重的弱信
室内环境是人类工作和生活的重要场所,随着互联网和通信技术的发展,室内定位技术被用于越来越多的服务中。室内定位方法是室内定位技术的关键,基于接收信号强度的室内定位方法具有对硬件资源要求低、数据获取方式简单,以及后期数据处理算法丰富等诸多优点,已成为室内定位方法研究的热点。  本文深入研究了基于接收信号强度的室内定位关键方法,主要包括:基于几何原理的定位算法和采用指纹数据库的室内定位方法等研究内容,特
学位