论文部分内容阅读
语音增强技术广泛应用于语音通信的背景噪声抑制、语音压缩编码和语音识别的前端处理中。语音增强的目的就是消除背景噪声的影响,改善语音质量。
随着对入耳听觉系统生理机制的研究深入,近年来基于听觉感知的语音增强算法得到了长足的发展。该方法通常与传统的语音增强算法结合实现去噪,同时考虑听觉对语音信号的感知和语音信号信噪比的提高。本文系统深入地研究了基于听觉感知的语音增强算法,主要研究工作如下:
1.传统卡尔曼滤波得到的增强语音信号,其功率谱包络在谱峰处具有很高的信噪比,而在语音能量低的谱谷处信噪比就很低。入耳听觉系统更容易感知到谱谷处的噪声。因此本文给出一种基于听觉感知的卡尔曼滤波语音增强方法。引入感知加权滤波器,能够在不影响谱峰处听觉效果的前提下提高谱谷处的信噪比。实验结果表明,采用这一方法能进一步减少人耳感知到的噪声。
2. 研究人耳听觉感知特性在语音增强中的应用,给出一种后置感知滤波器应用于子空间语音增强的方法。根据掩蔽阈值,对带噪语音谱分量有选择地进行处理,将可闻残留噪声控制在掩蔽门限之下,可以进一步抑制残余噪声。该方法能够提高增强语音的听觉质量,改善增强效果。
3.针对传统子空间方法中,采用语音活动检测(VAD)估计噪声不准的缺陷,给出一种基于子空间域噪声特征值估计的语音增强方法。该方法不需要区分有声段和无声段,能够更加准确的反映当前时刻的噪声水平,具有鲁棒性。