论文部分内容阅读
语音增强是语音通信系统中的关键技术,多通道语音增强和单通道语音增强都已经研究多年,近年也得到了应用和推广。但是,不论是多通道还是单通道语音增强算法,都有其固有的问题:多通道语音增强算法对传声器失配、混响以及导向矢量估计错误等问题非常敏感,这些因素会导致语音失真增大,而且干扰噪声无法被有效抑制;单通道语音增强算法一般只处理较平稳的噪声,而且常用的谱减法,还存在严重的“音乐噪声”问题。语音增强算法的问题限制了它的应用,只有解决这些问题,语音增强技术才能得到更为广泛的应用。针对这些问题,本文展开了深入的研究,寻求解决这些问题的有效方法。本文的主要研究内容和创新点包括以下三个方面:
(1)从理论上分析了传声器失配对双传声器语音增强算法的影响,并通过实际实验验证了理论分析的结论,为校准传声器提供了依据。针对多通道语音增强算法对传声器失配特别敏感的问题,本文详细分析了传声器失配对GSC算法和ANF算法的影响。尽管本文只分析了双传声器的情况,但是,本文的分析方法可以直接推广到任意多个传声器的情况,并为多传声器的校准提供依据。
(2)利用归纳法首次提出了鲁棒MVDR算法,为分析比较三种非参数化的MSC方法提供了理论依据。本文提出的鲁棒MVDR算法,即α-MVDR算法,首次将三种非参数化的相干函数分析(MSC)方法三种方法统一于一个简单的形式。α-MVDR算法还被应用于频域功率谱估计和空间谱估计。在空间谱估计的应用中,结合α-MVDR算法与一种自动对角加载技术(GLC),得到了α-GLC-MVDR,实验结果表明,当导向矢量估计存在偏差时,α-GLC-MVDR比GLC-MVDR更为鲁棒,性能更为优越。α-MVDR算法目前已引起国内外专家学者的注意,并被德国斯普林格(Springer-Verlag)出版公司的信号处理专题丛书所引用。
(3)提出了两种适合于谱减法的低方差功率谱估计方法,包括自适应平滑周期图方法(AAP)和基于语音倒谱系数均值的方法(MVSC)。其中,AAP方法完全基于噪声功率谱结构特征;而MVSC方法则完全基于语音倒谱系数特性。由于谱估计方差是造成谱减法“音乐噪声”的根本原因,因此,AAP方法和MVSC方法很好的解决了“音乐噪声”问题。
仿真实验和实际的系统应用都验证了本文的理论分析,也验证了本文提出的算法优于传统的方法。