论文部分内容阅读
公共场所的安全监控一直是维护社会大众生命财产安全的重要措施之一。目前的监控系统主要都基于视频进行监控,但是视频监控容易受到光线,天气等因素的影响。相比于视频监控,异常声音监控具有复杂度低、易获取、无向性等优势。因此可以作为一种辅助方法来提升监控系统的性能。异常声音监控系统的实现存在几个难点,针对安防的异常声音检测的准确率要求高,传统的声学特征如MFCC等用于异常声音识别效果较差。 本研究主要内容包括:⑴以前的研究中异常声音监控系统大多采用直接识别的方法,此方法只适用于少量种类的检测,当检测种类上升时漏检容易升高。本文采用先检测后分类的方法构建异常声音监控系统。针对检测阶段,提出了一种基于单类支持向量机的异常声音检测算法。该算法对每一帧声音判定是否为异常,当有连续多个帧出现异常时判定这一段声音为异常声音,从而直接省去端点检测等步骤。⑵针对MFCC等传统声学特征识别率低的问题,通过对异常声音时域,频域,时频域上特性的统计分析,本文认为异常声音信号具有非平稳性的特点。因此本文提出基于EEMD的异常声音特征提取方法:将信号通过EEMD处理获得不同层的模态函数IMF,对每一层的IMF提取MFCC等常用特征组合成最终的特征。此外本文考虑公共场所背景噪声分布情况,假设公共场所背景噪声更符合SaS分布。在重构异常声音信号时用SaS分布代替高斯分布,以此改进特征提取方法。⑶结果表明,本文的检测方法能够有效检测到异常声音(信噪比20dB条件下平均漏检率为2.4%,误检次数为每小时5.2次)。基于EEMD的特征EEMD MFCC的识别效果相比MFCC等有明显提升,表明基于EEMD提取的特征能够有效描述异常声音,EEMD适合作为异常声音等非平稳信号的特征提取方法。最后实验表明改进的EEMD_ MFCC的识别率在地铁背景噪声四种信噪比下比改进前平均提高了4%,但是在白噪声条件下识别率不如改进前,表明实际的噪声分布直接影响基EEMD的特征对于异常声音的描述性能。