【摘 要】
:
随着信号处理技术和计算机硬件的不断发展,关于声音事件识别技术的许多应用近年来受到越来越多的关注。声音事件识别技术可以作为音频监控系统、机器人导航、智能穿戴设备等
论文部分内容阅读
随着信号处理技术和计算机硬件的不断发展,关于声音事件识别技术的许多应用近年来受到越来越多的关注。声音事件识别技术可以作为音频监控系统、机器人导航、智能穿戴设备等其他的情景感知应用系统的辅助部分。经历几十年的发展,针对声音事件识别的特征提取和分类模型研究已取得了较大的进步,使得相应的应用系统的性能获得了较大的提升。然而,由于声音事件自身的结构特性,经常是在具有噪声条件下发生的。虽然声音事件识别系统在低噪声的条件下具有较好的识别性能,但随着噪声强度的增加,其稳健性逐渐变差,系统的性能明显降低。通过将声音信号转换成类似于图像的声谱图,并利用图像处理技术提取相关的特征进行声音事件识别已成为一种新的研究趋势。但是,在现有方法中没有充分的研究声谱图和图像之间的差异,如何从声谱图中提取出有效的特征仍然是研究的难点。本文基于声谱图与声音信号的密切关系,探讨了基于声谱图特征的声音事件识别方法。本文的主要内容如下:1.提出了基于耳蜗谱图纹理特征的声音事件识别方法。首先,使用Gammatone滤波器组将声音事件转化为灰度耳蜗谱图;然后,对耳蜗谱图进行Curvelet变换得到不同尺度不同方向的Curvelet子带;再采用改进的完全局部二值模式(Improved completed local binary pattern,ICLBP)提取Curvelet子带的纹理特征并生成分块统计直方图,将统计直方图级联作为一种新的声音事件特征。实验结果表明,与其他声音特征相比,使用所提特征对各种噪声环境下的声音事件能够取得较好的识别结果。2.提出了基于多尺寸卷积核的卷积循环神经网络声音事件识别方法。首先,将耳蜗谱图作为卷积神经网络的输入层,卷积神经网络可以通过学习在时间和频率上发生偏移的滤波器来有效地处理谱图的时频变化,并通过在最后一个卷积层上使用三种不同尺寸的卷积核与特征图进行卷积操作,可以捕获特征图上不同区域的特征,丰富了提取的特征;然后,将这些特征分别馈送到循环神经网络,循环神经网络通过在序列历史上集成动态变化的上下文窗口来捕获谱图中关于声音事件的时间上下文信息;再将注意力机制作用于循环神经网络的输出层,使声音特征更具区分性;最后,将注意力层的输出拼接到全连接层,使用Softmax分类器对声音事件进行分类。实验结果表明,该方法对各种噪声条件下的声音事件可以取得较好的识别结果。
其他文献
艺术歌曲是诗歌与音乐紧密结合的艺术形式,其中钢琴声部担任着烘托气氛、渲染意境、描绘人物情感、刻画音乐形象等作用,钢琴声部本身具有弹奏、合作的属性,因此,较为深入地阐释钢琴声部的弹奏与合作,对于全面理解艺术歌曲有重要意义。声乐套曲《夏夜》是柏辽兹的声乐代表作品,柏辽兹运用交响性思维将乐队的音响效果进行浓缩,并且根据歌曲中不同的情绪和音乐内容创作了和声丰富、自由且灵动的钢琴声部织体,加上戈蒂耶浪漫又唯
成都龙泉驿汽车产业功能区规划面积144.9平方公里,与成都中法生态园、简州新城、天府新区邛崃新能源新材料产业功能区共同支撑成都绿色智能网联汽车产业生态圈构建。龙泉驿区
随着互联网技术的飞速发展,网络空间丰富的信息和大数据共享为人们的工作和生活提供了极大的便利。然而,面对日益增长的海量数据和信息需求的不断提升量,信息按需获取、快速检索成为互联网时代亟待解决的问题。研究信息推荐技术与推荐系统可有效地提高信息获取效率,帮助用户从海量数据中按需高效获取有价值的信息,满足用户对信息的高层次需求。学位论文主要研究基于Python的医疗专家推荐系统与混合推荐算法设计问题。医疗
城市热岛是城市下垫面及大气温度高于周边非城市环境的现象,越来越多的观测和模拟研究结果已经表明,城市热岛效应会对环境流场产生重要作用,继而影响降水过程。目前国内研究
前车师人是指吐鲁番盆地及附近地区苏贝希文化的创造者,年代在公元前13世纪到公元前后,属于青铜时代到两汉或稍早时期。前车师人的墓葬、遗址发现有数十处,其中以洋海墓地为代表。2019年大型考古报告《新疆洋海墓地》问世,其中洋海Ⅰ号墓地的资料最为典型,这为研究吐鲁番史前时期的前车师人提供了珍贵而典型的研究个案。目前,围绕洋海墓地的相关研究刚刚开始,研究者主要针对遗存的年代、文化性质、文化源流等方面进行分
铁路客运枢纽布局对铁路网、国土空间总体规划具有重要意义,需遵循铁路运行机制,实现服务城市发展、交通高效运行的目标。通过系统梳理和思考广州铁路枢纽规划建设运营实践,
汽车底盘支架是汽车底盘总成中的一类重要零件,企业不仅对该零部件表面质量有较高的要求,而且还需满足较高的强度要求。汽车底盘支架铸件质量的控制作为企业生产难关一直无法完美突破,而控制产品质量的关键是模具浇注及排溢系统的设计和压铸参数的设置。本课题针对苏州某公司所生产的某型汽车底盘支架铸件合格率较低的情况,通过专业数值模拟软件、正交试验方法及BP神经网络预测相结合的方式为提高产品合格率提供数据支撑。通过
过程写作教学法认为写作的过程大致可以概括为一种群体间的交流活动,而非传统意义中写作者的单独行动,它是建立在交际理论基础之上的一种作文教学方法。在这种教学理论中,写
随着我国高速和城际铁路网络的不断完善,空铁一体枢纽陆续建成,铁路成为一种新兴的机场路侧交通方式,但空铁枢纽的衔接与高品质服务尚在初级阶段.欧洲在空铁一体枢纽及空铁联
国内保理业务起源于国际保理,因此在研究国内保理时,国际保理是“应然”意义中的存在。但实际上,从经济学角度看,国内保理相较于国际保理有很大差异,究其原因,并非是保理业务