论文部分内容阅读
为了实现在非特定人环境中的语音情感识别,本文提出一种基于卷积神经网络和长短时记忆神经网络的算法,经过实验在对4种情感的分类任务中取得了51.7%的平均加权预测准确率。算法通过提取语音信号的梅尔频谱特征作为输入,利用卷积神经网络同时对语音信号进行短时域和频域特征的提取,利用长短时记忆神经网络进行长时域特征提取,从而达到语音情感识别的目的。