论文部分内容阅读
现实环境中的语音常常受到噪声的影响。麦克风阵列语音增强作为消除噪声提高语音质量的一种有效手段,尽管近年来取得了长足的进步,但仍不能完全满足实用的要求。本文的工作主要研究了麦克风阵列语音增强算法中的两个算法:后滤波语音增强算法和信号子空间算法。后滤波算法的重点在于后滤波器的准确估计。信号子空间算法的重点在于合理的子空间维度选择和线性滤波器估计。本文利用人耳的听觉感知特性对于这些重点进行了研究和改进。主要工作和创新点如下:
●根据麦克风阵列上接收到的信号的相关性,将噪声信号分为相关性噪声和不相关性噪声。在此基础上,分析了各个阵元上信号的自功率谱和阵元间信号的互功率谱的特性,给出了一种后滤波器的估计方法。接着通过将后滤波器表达为矩阵形式,结合人耳的听觉掩蔽效应,进一步改进了该后滤波器,使得该后滤波器的语音增强效果进一步得到了提高。
●针对传统的信号子空间算法中用阈值确定子空间维度不准的问题,利用噪声子空间上的特征值应该相等的特点,提出一种更为准确的子空间选择方法。提出了在噪声子空间上用条件概率估计噪声功率谱的方法。利用人耳的听觉掩蔽效应合理的估计了线性滤波器中拉格朗日乘子的值,给出了线性滤波器的一种更为有效的估计方法。
●用高斯、拉普拉斯和Gamma分布描述了麦克风阵列上接收到的语音和噪声的分布情况,提出了极大化语音存在概率来估计信号子空间维度的方法,根据语音的存在概率估计出了噪声功率谱。利用人耳的听觉掩蔽效应,合理的折中了增强语音中的语音畸变和残余噪声,给出了一种合理有效的后滤波器估计方法。
基于听觉掩蔽效应的麦克风阵列语音增强算法的研究是本文工作的重点和亮点。本文所提的几种改进算法比传统的算法在消除噪声和减少语音畸变两方面都有明显的改进,达到了预期的研究目的。