论文部分内容阅读
随着人工智能的迅猛发展,传统的人脸面部表情识别技术难以满足更精确的人机交互需求。基于深度学习的人脸面部表情识别研究受到国内外研究者的极大关注。然而,针对于人脸面部表情识别的深度卷积学习网络在网络结构和参数上还存在可优化的空间,因此研究具有更优化特性的深度卷积神经网络,对于提高人脸面部表情识别有着重要的实际应用价值。论文主要研究内容如下:
(1)针对现有深度学习方法在表情识别中的细节网络结构设计不够优化,容易引起测试结果不佳,单一卷积神经网络模型无法结合表情序列数据的缺陷,本文设计了一种基于表情序列的的深度卷积学习网络结构(Deep Convolutional Neural Network Based on Expression Alignment, DCNNBEA)。该结构是在VGG16卷积神经网络的基础上,调整设计卷积神经网络相关层数,对人脸表情特征进行高效准确提取,同时结合长短期记忆网络(Long Short-term Memory, LSTM)进行图像序列预测分析,最终在fer2013数据集上跟其他同类方法进行对比实验,实验获得较好结果。
(2)针对于人脸表情识别深度学习算法在训练过程中容易出现梯度消失和深度学习模型的参数初始化等问题,提出了一种可训练的多层网络激活函数(Trainable Active Function of Multiple Networks, TAFMN)。激活函数具有强大的函数映射表示功能,可通过增加线性和非线性的激活函数性能来提取潜在特征。此外,还研究了卷积核大小与数量的关系,寻找卷积核最优大小与数量参数关系。最终对整个网络参数进行整合,然后同样在fer2013数据集上进行训练和测试,跟同类方法相比,优化参数后的网络方法获得较好结果。
(3)设计并实现了一种基于人脸表情识别的人机交互系统原型。该系统主要用于检测本文提出的人脸表情识别模型的有效性,同时也可将其运用于商场人机交互体验区,为人机交互行为提供一种良好的可能性。对获取到的用户脸部表情图片,进行图片处理,然后传入相关训练好的人脸面部识别模型中,最后快速得到检测结果,并将结果以友好的、可视化的、文字图表相结合的方式展示给体验用户。
(1)针对现有深度学习方法在表情识别中的细节网络结构设计不够优化,容易引起测试结果不佳,单一卷积神经网络模型无法结合表情序列数据的缺陷,本文设计了一种基于表情序列的的深度卷积学习网络结构(Deep Convolutional Neural Network Based on Expression Alignment, DCNNBEA)。该结构是在VGG16卷积神经网络的基础上,调整设计卷积神经网络相关层数,对人脸表情特征进行高效准确提取,同时结合长短期记忆网络(Long Short-term Memory, LSTM)进行图像序列预测分析,最终在fer2013数据集上跟其他同类方法进行对比实验,实验获得较好结果。
(2)针对于人脸表情识别深度学习算法在训练过程中容易出现梯度消失和深度学习模型的参数初始化等问题,提出了一种可训练的多层网络激活函数(Trainable Active Function of Multiple Networks, TAFMN)。激活函数具有强大的函数映射表示功能,可通过增加线性和非线性的激活函数性能来提取潜在特征。此外,还研究了卷积核大小与数量的关系,寻找卷积核最优大小与数量参数关系。最终对整个网络参数进行整合,然后同样在fer2013数据集上进行训练和测试,跟同类方法相比,优化参数后的网络方法获得较好结果。
(3)设计并实现了一种基于人脸表情识别的人机交互系统原型。该系统主要用于检测本文提出的人脸表情识别模型的有效性,同时也可将其运用于商场人机交互体验区,为人机交互行为提供一种良好的可能性。对获取到的用户脸部表情图片,进行图片处理,然后传入相关训练好的人脸面部识别模型中,最后快速得到检测结果,并将结果以友好的、可视化的、文字图表相结合的方式展示给体验用户。