论文部分内容阅读
随着无线移动通信技术的迅速发展,使得通话范围不断扩大,在噪声环境下进行语音通信,尤其在噪声环境比较恶劣的情况下,基于参数编码的声码器,很难从带噪语音信号中准确提取激励源和声道模型参数,会导致编码后的合成语音质量严重下降。因此研究噪声环境下低速率语音编码,提高噪声环境下的语音通信质量具有非常重要的研究价值和实际应用背景。针对上述目标,本文实现了一个基于Kalman平滑的语音增强系统,并把它作为前端处理模块与2.4kbpsMELP低速率语音编码相级联,提高合成语音质量。
本文的主要研究工作如下:
为了更好的从带噪语音中直接提取线性预测系数,使得Kalman滤波模型建市更加准确,本文给出了一种分子带进行谱相减的方法。利用最小统计算法估计噪声功率谱,利用估计出来的先验信噪比和无语音概率对谱减的增益因子进行修正,再依据语音信号的能量主要集中在低频范围的特点,将带噪语音信号分为五个子带,依次进行谱减。尽可能去除背景噪声,利于AR模型参数的提取。
为了解决提取的AR模型参数在相邻帧谱包络之间可能会出现畸变的问题,本文提出了一种基于声道慢变特性的平滑方法。根据人们在发声时,声道参数缓慢变化的特点,对相邻帧的谱包络做一阶平滑,平滑因子根据帧间能量变化设定。该方法可以很好的消除语音中的孤立残留噪声,而且不会引入语音失真。
为了提高Kalman平滑增强语音质量,针对人耳的听觉掩蔽特性,本文给出了一种将感知域滤波和Kalman双向平滑相结合的方法,利用感知域滤波器将估计误差的能量进行重新分配。针对激励源信号具有随时间快速变化的方差,本文研究了利用多脉冲激励编码和残差幅度削波的方法修正Kalman状态噪声。
MELP声码器是2.4kbps语音编码的标准。其合成语音质量与4.8kbps的FS-1016相近。本文深入研究了MELP的原理,通过大量的实验对其性能进行了洋细分析。针对基音周期估计的问题,本文给出了一种适合于硬件电路实现的快速估计方法,并在xilinx的FPGA上实现了一个语音信号基音周期估计系统。