基于图像序列的动态人脸表情识别算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mir_lww0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别作为计算机视觉领域中的一个重要研究课题,大多数的研究往往聚焦于以单帧表情图像作为研究对象的静态人脸表情识别任务中。然而,人脸表情作为一个动态变化过程,单帧人脸表情图像无法完整地捕捉人的情感变化。与之相比,表情视频或表情图像序列由于包含丰富地与表情变化相关的纹理信息和运动信息,可以较为完整地表达人的情绪变化过程。因此,基于图像序列的动态人脸表情识别研究具有重大的研究价值。本文的主要研究工作和创新点如下:1.深入研究了人脸表情的区域特征提取问题。针对不同表情运动在脸部的不同区域具有不同的结构和纹理信息,在使用卷积核提取特征时,对不同的局部区域应该使用不同的卷积核处理。具体而言,我们设计了一种多尺度区域特征学习模块,并在自然场景下的人脸表情数据集上进行了验证,多尺度区域学习模块的添加确实有助于提升模型对表情特征的表征能力。2.本文提出了一种基于异构网络融合的动态人脸表情识别算法。解决了3D卷积神经网络直接对表情序列提取特征存在冗余和噪声干扰导致识别率低的问题。该算法集成了两种网络模型:3D时空网络和静态网络,前者直接以表情序列作为输入,用于提取相邻帧之间连贯的时空信息;后者以表情序列的关键帧为输入,用于提取静态特征,再通过模型融合,进而弥补前者在提取序列特征方面的不足,提高动态人脸表情识别准确率。通过在CK+和Oulu-CASIA数据集上的大量实验结果表明,本文提出的算法具有良好地识别结果。3.深入分析了本文提出的基于异构网络融合的动态人脸表情识别算法应用于实际场景中存在的问题与不足之处,继而提出了一种基于时序关系推理的动态人脸表情识别算法,算法通过对长度不一的表情序列进行稀疏采样,进而通过设计的多尺度区域特征提取网络对稀疏表情序列提取语义特征,然后创新性地使用时序关系推理模块建模稀疏表情序列的时序上下文信息,从而得到表情序列所属类别。最后的实验结果验证了算法对自然场景下的动态人脸表情识别具有良好的识别率,而且能达到实时识别。
其他文献
祁东煤矿82煤层覆岩存在多层厚度较大坚硬岩层,初次跨落步距大,周期断裂悬顶长,严重危害工作面的安全生产.通过分析坚硬顶板的岩梁结构、力学特性,建立了初次来压双固支梁模
职业教育在社会上处于尴尬的境地,一方面社会快速发展,职业教育人才供不应求,另一方面是学生对职业教育冷视,供过于求。主要原因是学生对专业的不认同,造成了家长、社会对职业教育
一、建立正确的观念(一)从狭隘的人才观到全面的人才观即从单纯的技术人才观到多样性、多层次性的全面人才观。由于历史与社会的原因,中小企业普遍认为人才就是指技术人才。
现实条件下,统筹城乡经济协调发展、解决“三农”问题、全面推进社会主义新农村建设,都需要大力发展县域经济。目前理论界多用区域经济经济发展理论体系来指导县域经济的发展,但
通过对传统中韩泡菜的发酵原料与工艺,乳酸菌菌相和风味物质组成进行比较,分析了传统中韩泡菜发酵过程中乳酸菌菌相的生态演替和风味物质组成。传统中国泡菜发酵过程中的优势
[目的]对松嫩平原野大麦种子在不同条件下的萌发特性进行研究,找出最佳的萌发条件。[方法]设定5个变温(15/25、20/30、15/30、20/25和15/20℃),5个NaCl浓度(0、75、85、95和1
太平洋战争爆发后,中美英三国开始积极谋划联合军事行动,然而就在此时,英缅当局为加强缅甸防卫,在还未征得中方同意的情况下,就匆忙将"土鲁撒"轮所载美国援华租借法案军火物
在我国现代教育史上,陶行知先生是最有影响而且有国际声誉的教育家。他的教育思想极为丰富而深邃,尤其是在师范教育方面积累了很多经验,理论上有着精辟而完备的论述。这些,对于改
测角仪是X荧光光谱仪的核心部件,由南京地质矿产研究所研制的HYY-G1/1000型高精度测角仪,采用θ轴和2θ轴独立控制的设计方式,其定位精度优于万分之五度,可实现双轴联动、单动,连续
以黄河三角洲为例,将可持续发展系统划分为经济子系统、社会子系统、资源环境子系统构建可持续发展评价指标体系,并采用主成分分析方法综合测度黄河三角洲可持续发展水平,结果显