论文部分内容阅读
近年来,随着计算机科学信息技术的迅猛发展,音频信号的声学方面的相关研究已经逐渐成为当前音乐领域的研究热点。基于声学特征的乐器识别是当前音乐信号分析工作的重点,为了提高乐器音频信号种类识别正确率,本论文主要是对收集到的古筝、吉他、钢琴、手风琴、口琴、唢呐这6种乐器的音频进行研究,主要包括有以下几个方面的工作:首先,本论文针对乐器音频信号中附加噪声导致的乐器音频信号识别率低的问题,本文采用改进的变分模态分解(VMD)对乐器音频信号进行去噪处理。本论文是通过先采用VMD将乐器音频信号分解成一系列平稳的窄带分量(IMF),之后,通过相关系数大于或等于0.5的IMF与相关系数小于0.5的IMF被小波阈值去噪后得到的有效的信息一起重构信号的方式来对VMD进行改进的。在相同的实验环境下,分别研究了小波阈值去噪、经验模态分解、VMD、改进的VMD等方法对乐器音频信号的去噪效果的优劣,仿真实验结果表明,本文采用的改进的VMD算法比其他去噪算法去噪鲁棒性更好。其次,为了在去噪后能进一步提高分类正确率,从乐器音频信号中提取充分体现声音特性的声音特征,该声音特征为基于改进的核主成分分析(KPCA)降维的Mel频率倒谱系数与一阶差分Mel频率串联起来的24维的组合特征。本论文提取24维Mel频率倒谱系数、24维一阶差分Mel频率倒谱系数作为分类器的输入参数,实验结果表明,Mel频率倒谱系数与一阶差分Mel频率倒谱系数串联起来的共48维的组合特征在对比分析实验中比单个特征获得了更高的识别率。由于此组合特征的维度非常高,为了提高运算速度,提高分类识别的精度,降低运算量,本论文采用改进的KPCA算法对此组合特征进行降维实验,仿真实验结果表明,改进的KPCA比KPCA与主成分分析(PCA)降维后保留了更多的体现音频信号音色特性的成分,去掉更多的干扰成分。最后,本论文采用由改进的PSO优化的SVM作为乐器音频信号的分类器。首先,由于实验数据样本少,本论文决定采用支持向量机来对去噪后的乐器音频信号的特征进行分类识别。由于SVM的参数的选择对识别结果影响很大,本论文在接下来的仿真实验中分别采用粒子群优化算法(PSO),改进的PSO来优化SVM参数,该改进的PSO算法是对PSO进行了自适应惯性权重和异步自适应学习因子的改进,实验结果表明:经由改进的PSO优化参数的SVM获得更高的乐器音频信号分类识别率。