三维点与二维图像协同的面部表情识别方法研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:virusniper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部表情在人与人之间的交流上有重要的作用,人脸表情相对文字、语音等媒介在表达人的情感、情绪方面具有更加直观、准确的优势。将自然人这种情感交互模式用于如虚拟远程教学、虚拟游戏、疲劳驾驶检测等人机交互领域,有利于提升人机交互的自然性。目前面部表情识别主要采用摄像设备采集的二维图像作为输入,通过二维图像样本训练表情识别模型,从而实现交互环境下基于面部图像的表情认知。但研究证明包括深度信息的三维表情信息在表情理解中也占有重要的地位,因而基于三维信息的表情识别也逐渐成为一种主要方法。为探讨二维图像和三维点坐标信息融合对表情识别的提升作用,本文研究了基于特征融合表情识别效果。然而实际应用环境,存在二维表情图像易获取,而三维表情信息需要特定的采集设备,数据采集相对困难的问题。本文研究改进了深度超限学习机模型,以面部捕捉仪获取的三维表情数据为基础,二维表情图像数据做局部参数修正,利用知识迁移建立了3D和2D信息协同的表情识别模型,将3D面部表情识别模型迁移到了针对2D面部表情数据的识别中。本文主要的研究工作和创新点如下:1.构建了基于面部标记点坐标的3D表情数据集与对应的2D表情图像数据集。由于实验室购置的OptiTrack面部动作捕捉设备可以精确地捕捉特定面部标定点的三维坐标点数据,捕捉到的三维点数据相比二维图像数据能够更加准确地表达面部表情过程中的面部运动信息。本文利用OptiTrack面部捕捉设备构建了基于面部标记点坐标的3D表情数据集,数据集包含27个特定位置标记点的三维坐标点数据。同时,利用高清摄像头采集了相同对象的2D表情数据集。两类数据集中各含有7个被采集对象的6种基本表情,每个表情共有5组数据。2.利用深度超限学习机研究了3D表情与2D表情的融合表情识别。本文通过研究3D几何向量和2D图像纹理特征融合的表情识别方法,证明特征融合的方法能够提高单独种类特征下的表情识别效果。为提取具有良好表征能力的表情特征,本文利用深度随机网络中的深度超限学习机提取3D几何向量与2D表情融合数据的特征,利用提取的特征进行表情识别。实验结果表明,深度超限学习机的多层ELM-AE网络具有很强的特征提取能力并且能提高基于特征融合的表情识别效果。3.提出一种基于改进深度超限学习机的迁移学习模型,研究了基于迁移学习的表情识别。迁移学习模型由深度超限学习机中的多层ELM-AE网络与OS-ELM分类器组合而成。本文利用迁移学习模型将基于三维点表情数据的表情识别模型迁移到基于二维图像的表情识别中,提升了基于二维图像数据的表情识别效果。
其他文献
在航拍视频中自动检测运动目标,是无人机执行空中侦察、火力打击等高层任务的基础,是提升无人机自主能力的关键技术之一。相对于摄像机固定的视频监控,无人机航拍具有机动灵活,监
虚拟现实技术(Virtual Reality),是一种利用计算机模拟出三维空间的虚拟世界,让使用者通过视觉、听觉等产生交互式的、沉浸式的体验感受,虚拟现实技术是计算机图形学、人机交互
随着无线基础设施的广泛部署,无处不在的无线接入服务己经成为人们生活和工作必不可少的一部分。同时移动互联网也如火如荼的发展着,基于位置的服务由于可以为人们提供更具体
由于目前经济的快速增长、企业竞争、服务意识的提高和互联网的迅速普及等因素,呼叫中心已成为客户服务及电话营销不可或缺的信息化平台。近年来,呼叫中心产业在呈现了飞跃性的
互联网中信息规模的爆炸式增长,满足了用户对信息的需求。但庞大的信息量使得用户难以快速定位到有用信息,降低了信息的使用率,导致了信息过载问题的出现。个性化推荐技术是一种
随着系统复杂度的不断提高、系统对硬件的依赖程度的增加以及客户对程序的安全性、可靠性等要求的提升,传统的离散建模工具已经越来越难以满足软件工程师对于系统建模的需求
随着肝脏切除手术及肝脏活体移植手术需求的不断增长,肝脏自动分段越来越受到关注。肝脏内主要的几套供血系统走向确定了肝脏的分段,肝脏自动化分段主要依据于较为成功,受到较普
随着计算机安全技术的发展,可执行文件的比较技术不断应用到软件版权保护、系统补丁分析、电脑病毒研究、计算机漏洞检测等领域中。由于软件的封闭源码特性导致源代码比对方
随着移动互联网的普及和移动互联设备的深入应用,高校师生对移动应用的需求也日益增长,迫切需要一个安全、便捷、丰富的集成化移动服务环境,满足师生随时随地利用移动终端方便快
学位