基于声学特征的几种典型乐器识别研究

来源 :东北林业大学 | 被引量 : 2次 | 上传用户:mxqfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机科学信息技术的迅猛发展,音频信号的声学方面的相关研究已经逐渐成为当前音乐领域的研究热点。基于声学特征的乐器识别是当前音乐信号分析工作的重点,为了提高乐器音频信号种类识别正确率,本论文主要是对收集到的古筝、吉他、钢琴、手风琴、口琴、唢呐这6种乐器的音频进行研究,主要包括有以下几个方面的工作:首先,本论文针对乐器音频信号中附加噪声导致的乐器音频信号识别率低的问题,本文采用改进的变分模态分解(VMD)对乐器音频信号进行去噪处理。本论文是通过先采用VMD将乐器音频信号分解成一系列平稳的窄带分量(IMF),之后,通过相关系数大于或等于0.5的IMF与相关系数小于0.5的IMF被小波阈值去噪后得到的有效的信息一起重构信号的方式来对VMD进行改进的。在相同的实验环境下,分别研究了小波阈值去噪、经验模态分解、VMD、改进的VMD等方法对乐器音频信号的去噪效果的优劣,仿真实验结果表明,本文采用的改进的VMD算法比其他去噪算法去噪鲁棒性更好。其次,为了在去噪后能进一步提高分类正确率,从乐器音频信号中提取充分体现声音特性的声音特征,该声音特征为基于改进的核主成分分析(KPCA)降维的Mel频率倒谱系数与一阶差分Mel频率串联起来的24维的组合特征。本论文提取24维Mel频率倒谱系数、24维一阶差分Mel频率倒谱系数作为分类器的输入参数,实验结果表明,Mel频率倒谱系数与一阶差分Mel频率倒谱系数串联起来的共48维的组合特征在对比分析实验中比单个特征获得了更高的识别率。由于此组合特征的维度非常高,为了提高运算速度,提高分类识别的精度,降低运算量,本论文采用改进的KPCA算法对此组合特征进行降维实验,仿真实验结果表明,改进的KPCA比KPCA与主成分分析(PCA)降维后保留了更多的体现音频信号音色特性的成分,去掉更多的干扰成分。最后,本论文采用由改进的PSO优化的SVM作为乐器音频信号的分类器。首先,由于实验数据样本少,本论文决定采用支持向量机来对去噪后的乐器音频信号的特征进行分类识别。由于SVM的参数的选择对识别结果影响很大,本论文在接下来的仿真实验中分别采用粒子群优化算法(PSO),改进的PSO来优化SVM参数,该改进的PSO算法是对PSO进行了自适应惯性权重和异步自适应学习因子的改进,实验结果表明:经由改进的PSO优化参数的SVM获得更高的乐器音频信号分类识别率。
其他文献
通过对装配流水线传输设备的种类分析,以工程机械整机的结构特点、生产车间产能规模等为依据,来选择相应的流水线设备,介绍了装配流水线传输设备的组成,整机装配生产线设计关
背景:从干细胞角度去认识和研究子宫内膜细胞,能够为临床上解决子宫内膜引发的子宫内膜疾病治疗提供新的治疗方案和研究切入点。目的:比较不同方法体外分离、培养子宫内膜基质
新产品研发项目组合管理的三个关键因素是人才、研发周期和成本。考虑多技能研发人员的学习效应,将技能增值作为一个主要目标,建立以技能增值、研发周期和成本为目标的新产品
失智老人养老服务是当前养老服务业中的难点问题。本文分析了失智老人养老服务标准现状,总结了失智老人早期干预服务机构标准化试点的主要措施和成效,为标准化在失智老人养老
<正> 用氢还原氧化铜(Ⅱ)和氧化亚铜(Ⅰ)的实验,精确度高,再现性也好。它的化学变化可以用简单的化学方程式来表示,然而,这个实验用氢作为还原剂的缺点是:装置复杂,常常引起
判断函数的凹凸性是高等数学中导数的一个重要应用,本文探讨了文科高等数学中函数凹凸性的教学方法,采用数形结合、提问式、启发式教学让学生直观的发现凹函数与凸函数,引导
目的 动态观察人类母乳中胰岛素样生长因子 1(IGF 1)在初乳及成熟乳中的变化及其与泌乳量的关系 ;探讨母乳中IGF 1水平对新生儿生长发育的影响。方法 监测 38名足月新生儿
补中益气汤乃金元时期四大著名医学家李杲创造的一首脾胃病名方,临床运用得当,效果十分显著,古今许多医家都喜用、善用,近代医家亦多有发挥。实际运用起来,有时疗效较好,有时却不甚
伍迪·艾伦曾经说过,令他略感遗憾的是,他还没有在巴黎完整拍摄过一部电影,虽然这个念头早就在艾伦的心里盘旋,可他从来没有在这个令人魂牵梦萦的城市拍摄过一部完整的电影。
高强度聚焦超声(HIFU)治疗目前已经被成功地用于多种肿瘤治疗之中。其原理是:运用超声换能器将声能汇聚到生物体肿瘤所在区域,通过各种效应,尤其是热效应,使该区域肿瘤细胞发