论文部分内容阅读
自上个世纪八十年代以来,客观语音质量评价研究已成为语音信号处理领域中的一个重要课题。在开发语音处理算法、设计语音通信系统、优化语音通信设备时,对输出的语音质量进行评价是衡量信息交流是否畅通的关键因素。基于听感知模型的客观评价方法利用人耳的听觉特性,能较好地模拟人耳对声音的感知,因而受到众多研究人员的关注。近年来,无参考源(Non-intrusive)的评价方法也已成为研究的热点,并提出了许多新的算法。
本文首先分析了音质评价与语音信号处理相关研究方向的联系,对现有的各种客观音质评价方法进行了评述,包括有参考源(Intrusive)的评价方法和无参考源的评价方法。
在此基础上实现了无参考源方法中基于时域包络的ANIQUE(AuditoryNon-IntrusiveQUalityEstimation)方法和基于语谱图共生矩阵的MPSDD(MeasuringPerceptualSpectralDensityDistribution)方法。ANIQUE方法利用语音中的2-30Hz包络调制成份,通过与语音中其他频率调制成份比较,来对语音质量做出评价。
基于不同调制频率对音质的影响作用是不同的,本文提出了对ANIQUE进行调制频率权重因子的改进算法;基于语音成分的包络信息是不受静音成分的影响,进而又提出使用静音检测(VoiceActivityDetector,VAD)的改进算法。实验结果表明,MPSDD和ANIQUE算法都与主观MOS分达到了较好的相关性(0.7-0.8之间),ANIQUE的两个改进算法也都带来不同程度的性能提高。