论文部分内容阅读
麦克风阵列语音增强技术在语音相关的应用中有着十分重要的作用。双麦克风系统作为麦克风阵列的一种特殊形式,由于其成本较低并且易于实现,成为麦克风阵列增强研究的热点并拥有广泛的应用领域。 本文以波束形成法为基础研究几种适用于宽带信号的双麦克风语音增强算法,并最终将该算法与3G通信网络中的3GPP(The3rd Generation PartnershipProject) AMR-WB(Wideband Coding of Speech at around16kbit/s using AdaptiveMulti-Rate Wideband)宽带语音编码标准相结合,以提高移动通信系统的噪声消除性能和语音质量。 本文通过对波束形成法衍生得到的基于相位差的滤波器(Phase-error BasedFilter, PBF)及基于最优修正对数幅度谱(Optimally-Modified Log-SpectralAmplitude,OM-LSA)估计器的单声道语音增强方法的性能分析,提出一种融合的双麦克风语音增强算法。该算法首先提出一种基于相位差的后验信噪比估计方法,并采用基于加权欧式失真测度的幅度谱估计器代替维纳滤波器,随后将PBF算法与OM-LSA算法的增益函数按照最大化噪声抑制准则进行融合,进而得到一种改进的相位差滤波器(Improved PBF,IPBF),以消除音乐噪声并提高算法的整体噪声消除性能。 为了进一步消除IPBF算法的增强语音在目标语音不存在时的残留噪声问题,本文从噪声的频谱特征角度进行研究,提出一种针对嘈杂人声(babble噪声)的改进方法。该方法基于感知线性预测特征计算目标语音存在概率,并采用该概率修正IPBF算法的增益函数,进而减少在babble噪声环境下的残留噪声。 鉴于IPBF算法在目标语音不存在时残留噪声较多,而针对babble噪声的消除算法缺少一定的普适性,本文提出一种基于先验知识的双麦克风语音增强算法。首先,该算法采用子带相位差作为特征,通过线下训练获得分别对应目标语音存在与不存在情况的两个高斯混合模型,随后在增强阶段,根据贝叶斯准则计算当前帧的语音存在概率,并把目标语音存在概率与IPBF算法相结合,进而得到一种能够有效消除残留噪声的改进IPBF方法。 本文采用分段信噪比提升,谱失真,PESQ(Perceptual Evaluation of SpeechQuality)等指标对所提语音增强算法性能进行测试。针对不同的算法,测试环境包括会议室环境、手机通信环境和车载系统环境。测试结果表明,本文所提出的双麦克风语音增强算法获得较好的噪声消除效果,算法性能优于参考算法。