基于表情合成的面部表情识别算法

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:strongstrongqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部表情识别是机器理解人类情感、情绪的途径之一,在人机交互、学习分析等领域有着广阔的应用前景。受制于面部表情图像固有的类内差异,面部表情识别技术尽管在近几年取得了可喜的进展,但现有算法的精度与实际应用要求仍有较大差距。导致面部表情图像类内差异的原因至少包括:(1)主体身份特征和面部表情特征交织。从面部图像上提取的特征中势必包含大量的主体身份信息,造成同种表情不同主体的图像在特征空间距离较大。(2)头部姿态带来的类内差异。具有同一表情的同一主体在不同的头部姿态下的图像差异巨大。本文采用表情图像合成的思路来降低由于主体身份和头部姿态导致的面部表情图像类内差异,以提高面部表情识别的精度。主要的工作和贡献如下:(1)针对主体身份导致的面部表情图像类内差异,提出了一种自差分卷积神经网络的面部表情识别方法。首先利用条件生成对抗网络,以面部表情活动单元(AU)作为条件生成与输入图像相同身份的6类基础面部表情图像;然后设计了 6个同构的轻量级差分卷积神经网络用于对面部表情进行分类。每个差分网络从测试图像和6个合成出表情图像之一提取—对图像特征,并比较这对特征之间的差异。这样,测试图像中任何潜在的面部表情都有机会与合成的“自我”进行差分。自差分操作可以显著消减由于主体身份导致的面部表情图像类内差异。所提方法在CK+和Oulu-CASIA分别取得了 99.7%和91.3%的识别准确率;而且运行时模型的体积仅为9.54MB,显著小于目前主流的表情识别方法。(2)针对头部姿态导致的面部表情图像类内差异,提出了一种基于人脸3D模型头部姿态旋转和正面表情图像合成方法。将有一定角度偏转的人脸图像旋转为正脸图像并保留面部表情相关的特征,从而消减由于头部姿态导致的面部表情图像类内差异。结合本文提出的轻量级自差分表情识别方法,在多视图人脸数据集KDEF和BU-3DFE上进行了实验,分别取得了 87.1%和83.0%的识别准确率。综上所述,本文采用面部表情图像合成的方法来降低面部表情图像的类内差异,为提高面部识别精度提供了一种思路。所提方法在主流面部表情识别数据集上取得了优良识别精度,验证了本文方法的有效性。
其他文献
建筑物三维模型是地球空间信息的重要组成部分,也是组成“数字城市”的关键所在,在诸如城市规划、三维导航、文化遗产保护等领域得到了广泛的应用。而随着激光雷达技术的不断发展,点云数据尤其是机载激光雷达扫描数据已经成为继矢量地图和影像数据之外的第三类重要的时空数据,其本身蕴含的信息具有二维地图和影像无可比拟的优越性。目前,根据建筑物点云数据进行建筑物三维重建是摄影测量、计算机图形学、计算机视觉和遥感社区中
学位
学习分析中学习者的学业成绩预测有利于教师进行教学决策,并采取教学干预以提升学生成绩。当前该领域主要是通过学习者的人口学信息和行为特征来预测学业成绩,忽略了文本数据所蕴含的情感与学业成绩之间的关系。因此,本文尝试利用学习情感进行学业成绩预测。具体而言,本文首先识别文本所蕴含的情感极性,然后从情感角度来预测学业成绩。为提升情感识别准确性,本文加入与学习行为相关的主题文本,包含“教师授课”、“获得证书”
学位
文本关键词抽取是从文本中把能代表该文本内容的词或短语抽取出来的一种自然语言处理技术,它是自然语言处理领域较为重要的一个研究方向,在信息检索、图书馆学、情报学等领域都有重要的实际应用价值。尤其是进入二十一世纪,随着移动互联网等信息技术的快速发展,文本类型的数据呈现出指数增长的态势。对于企业和一些组织而言,这些文本数据具有极大的潜在应用价值,然而如何快速理解、利用这些文本数据是当前企业面临的一个重大实
学位
随着自然语言处理的发展,开放领域的问答成为越来越重要的研讨课题,它基于用户的自然语言提问,从大批候选文本中精准地找到答案,而面向开放领域问答系统的机器阅读理解技术成为其中的一个热门研究方向。机器能够更准确的理解人类文本语言,从而去构建开放领域的问答系统、自动化阅读理解评价系统以及电子化答疑系统等。这对于学习分析领域的研究,辅助教师进行答疑、阅卷、学习行为干预,帮助学生进行成绩预测和更高效的学习有着
学位
虚拟学习社区角色分类旨在探究虚拟学习社区交互网络中不同类别的学习者在协作式知识构建网络中的行为特征和其所处位置对知识构建过程的推进作用。目前,以MOOC为主的异步式虚拟学习社区中,多数课程存在学习者众多,但学习者参与讨论式知识构建活动的活跃度不高的情况。现有的虚拟学习社区角色划分方法主要有:机器学习方法、内容分析方法、数学分析方法和以凝聚子群、中心性方法为主的社会网络分析方法。上述方法主要存在以下
学位
当今时代信息爆炸式增长,用户如何从海量的数据里快速地查找到自己所需的信息显得至关重要。它不仅带来很多值得研究的学术问题,还催生了像百度、谷歌等以搜索引擎为主营业务的科技巨头,而搜索引擎的核心技术之一就是信息检索。文本信息检索研究的是如何从大规模文档集合中找出满足用户需求的文档的过程。其中的关键技术包括:计算查询与文档的匹配、按匹配程度给文档评分并排序。好的信息检索模型能把与查询主题相关的文档排在返
学位
微生物之间存在多种交互关系,如共生、竞争、寄生等各种类型的交互。研究微生物之间的交互关系是理解微生物群落的结构和功能的前提和基础。大量关于微生物交互关系的研究成果发表在生物医学文献中,从这些无结构化的文本中抽取出相应的微生物交互信息,并组织成结构化的知识库,是一种有效的研究微生物交互关系的方法。现有文本挖掘的工作简单地将微生物之间的关系定义为有或无两种,而忽略了微生物之间丰富、细致的关系类型。因此
学位
图像的分辨率意味着图像中包含的信息量,图像超分辨率重建技术通过算法将输入的低分辨率图像重建得到对应的清晰的、纹理细节更加丰富的高分辨率图像,在医学、遥感、公共安全、计算机视觉等各个领域普遍应用。因此,图像超分辨率重建算法近年来被广泛研究。目前基于卷积神经网络的超分辨率重建任务在重建性能和重建效率方面都远超于传统算法,但依然存在在真实模糊图像上重建效果较差的问题。针对这个问题,本文重点研究了基于真实
学位
近年来随着电动汽车的快速发展,电网、信息网、交通网呈现相互交叉、相互支撑、相辅相成的发展态势。电网、信息网和交通网逐渐演化为一个复杂的耦合系统。电动汽车不确定性的充电行为会进一步加大电网负荷峰谷差增加电网负担,聚集性充电会增加交通网的道路拥堵程度。电网-信息网-交通网融合可实现智慧交通,从而解决电动汽车快速增长给电网以及交通网带来的问题。但目前却缺少对电网-信息网-交通网耦合系统的仿真研究,因此对
学位
随着互联网技术的快速发展,人们通过社交平台的联系也越来越紧密。因为社交平台具有虚拟性和即时性,使得各种复杂纷乱的信息在互联网上肆意传播。短文本是社交平台中不良信息的主要传播形式,如何准确有效地过滤这些流传在社交平台的不良文本,是一个非常有社会意义的研究工作。自然语言处理技术为网络不良文本过滤问题提供了可行的方案,但社交平台上传播的文本表达往往不符合语言规则,也存在着大量词语变体、情感语言糅合等特点
学位