基于生成式对抗网络的鲁棒情绪识别

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:snowl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感交互的目的是通过赋予计算机识别、理解、认知人的情感的能力,从而使计算机具有更高的类人智能,提供更加自然的人机交互体验。随着计算机设备、网络摄像头等设备的普及,基于视觉通道的情绪识别成为分析用户情绪最有效的手段。  基于视觉的情绪分析依靠普通摄像头来获取交互过程中人脸表情的二维图像,然而在自然人机交互活动中,情绪表达往往辅以头部运动甚至手势变换,使得计算机捕捉到的人脸表情图像经常存在头部面外翻转、面部局部遮挡和光照变化等问题;此外对于同一种表情,不同个体之间表达表情时也呈现出一定的差异性。一个良好的情绪识别系统应该能够提取弱化类内偏差的用户无关情绪特征,具有优良的泛化识别性能,同时对各种表情图像的成像条件具有一定的鲁棒性。  目前大部分的情绪识别算法通过提取二维表情图像的纹理特征或者几何特征来进行情绪识别,这类方法大多通过人工精心设计的特征描述子来提取图像中表情相关的信息,然后利用机器学习模型对情绪特征进行分类或者回归,进而达到情绪跟踪识别的目的。当二维表情图片出现大角度的头部姿态变化时,基于二维视觉特征的情绪识别系统鲁棒性往往会大幅度降低。基于三维几何特征或者深度特征的情绪识别能够大大提升情绪识别系统的鲁棒性,但由于三维信息获取依赖于深度设备,成本高昂,一些研究者采用升维的方法用三维头部模型来拟合二维图像,正投影后获得接近正面的表情图像。但这种方法只能处理头部面内旋转,在处理稍大角度的面外翻转时,由于存在自遮挡问题,经过仿射变换后的正投影图像往往会导致部分面部信息缺失,这一定程度上限制了升维方法在实际中的应用。  基于上述问题,本文提出了一种基于生成式对抗网络的鲁棒情绪识别方法,其主要贡献有:  1.针对用升维方法矫正头部面外翻转的表情图像导致的用户面部图像缺失问题,采用基于生成式对抗网络的方法进行人脸补全,生成符合上下文语义的补全人脸。人脸补全算法可以作为现有姿态矫正算法的后续处理,共同作为表情识别的预处理步骤,与现有情绪识别系统进行集成。  2.提出了一个用于情绪识别的多任务神经网络结构,通过将表情识别和身份识别任务结合对情绪识别中由身份信息导致的类内偏差进行抑制,提取更本质的情绪特征。  基于上述算法,本文实现了一个基于生成式对抗网络的多任务鲁棒情绪识别系统,可以在较大角度头部面外翻转下进行情绪的识别与跟踪,提升表情识别的鲁棒性和准确率。
其他文献
电子病历是医院信息系统的重要组成部分。病历的录入要求结构化和灵活性的有机结合和统一。目前国内外的电子病历系统广泛采用的是结构化录入方式(表格或编辑控件)。结构化录
网络的高速发展给企业带来了更多的发展机遇,但是随着网络结构的日益复杂,网络管理成为人们日益重视的问题.该文对当前网络资源管理的现状进行了分析,针对实际情况总结出不同
本文深入研究了文件系统及磁盘管理的基本理论,结构,工作过程,及有关的概念,算法,技术等。详细阐述了构造一个实际文件系统的具体实现,包括磁盘管理,文件系统格式的形成,并选取了目前
该文在ISO模型的基础上,提出了面向对象开发中必须考虑的八个要素——耦合、内聚、规模、抽象、复用、信息隐蔽、继承和多态.并将这八个要素与ISO模型联系在一起,以利于对面
随着现代信息技术的发展,立体显示作为一种重要的信息技术也得到快速发展和广泛应用,受到了人们的关注。立体显示技术相对于传统显示技术给用户提供更加真实的临场感和沉浸感,带
该文提出了一种计算插值节点的新方法,该方法具有二次曲线的插值精度.文中所介绍的计算插值节点的方法,在平面五点可唯一地确定一条二次曲线为基础,首先利用二次曲线的理论计
随着IT技术的不断发展,基于容器的云资源共享泛型已成为大数据和人工智能基础设施的主要构造模式,其服务对象由7*24小时的服务类应用开始向服务类和批处理类应用混合场景转变,单
随着网络技术的逐步成熟和完善,Internet应用的复杂性不断增加,对原有构建方案提出了新的要求.如何适应这种要求,找到一种构建Internet应用的最佳方案也就成为一个新的研究课
随着Internet应用的广泛深入,计算机系统的安全问题日益引起人们的高度重视.操作系统是连接计算机硬件与上层软件及用户的桥梁,它的安全性是至关重要的.中国的政府、国防、金
模式识别是研究利用计算机来模仿或实现人类或其它动物的识别能力,以便研究对象来完成自动识别的任务。模式识别任务的输入模式可由任意阶张量表示,但其在作为传统分类器输入时