论文部分内容阅读
表情是人类交流中信息传递的主要媒介,在人类的日常生活中扮演着重要的角色。表情包含了丰富的情感信息,是情绪的外在表现,同时也是人的社会行为的外在表现。表情识别的研究对于智能机器人、人机交互、医疗、安全、通信以及驾驶安全等领域均有着重要的现实意义。
面部表情是通过眼、眉、嘴和脸颊部肌肉变化来表现人的情绪状态。本文在前人研究的基础上,主要研究了基于混合特征和分层最近邻法的六种人脸基本表情的识别,即高兴、恐惧、厌恶、悲伤、生气、惊奇。
首先,依据嘴巴区域几何特征较明显,眼睛、眉毛及鼻子区域纹理特征较为显著的特点,采用主动形状模型提取人脸嘴巴几何特征,采用Gabor小波提取眼睛和眉毛频域特征。在Gabor小波提取纹理特征时,采用3*6的小波,即3种尺度,6种方向的小波。同时,为减少维数,提高实时效率,本文只提取预先标定好的关键点处的小波特征。
其次,在混合特征(几何特征和频域特征)分析和提取的基础上,根据表情数据库的特点提出了分层最近邻法的表情分类算法。基于分类树思想将表情按照“粗细”进行三层分类,在每一层分别采用最近邻法进行表情分类。第一层以嘴宽高比、嘴高、嘴宽高差作为最近邻的输入进行训练实现分类;第二层以嘴宽、嘴巴宽高差作为最近邻的输入进行训练实现分类;第三层以眼睛和眉毛区域15个关键点的Gabor小波特征作为最近邻的输入进行训练实现分类。整个识别过程由粗到细,融合了几何特征和频域特征。
第三,本文以作者所在实验室人员为对象,初步建立了实验室静态表情数据库。将上述混合特征的提取算法和表情分类算法在日本JAFFE静态表情数据库和自建的实验室静态数据库进行了测试,测试结果良好。
最后,对序列图片表情识别进行了研究。主要分析了关键帧的提取,在此基础上对提取的关键帧进行特征提取组成一个大的特征集作为最近邻分类器的输入,然后按照静态图片识别的思想实现表情识别。该算法在美国Cohn-Kanade人脸序列表情库进行了测试,测试结果良好。