论文部分内容阅读
随着经济全球化的不断发展,人们的生产和生活不再局限于某一个城市或某一个国家,越来越多的公司或机构需要借助电视电话会议来完成彼此间的沟通。因此,清晰、高质量的宽带数字语音通信成为一种需求。目前,在宽带数字音频通信领域,1988年由CCITT制定的G.722标准被广泛认可和应用。G.722是7kHz带宽的64kbps音频编解码标准,它将可用通频带从200至3.2kHz扩展到50至7kHz。与传统的窄带通信相比,G.722在通话的清晰度和交谈的语音质量上,有较大改善,这也使传输更高质量的音乐信号成为可能。G.722有64kbps、56kbps、48kbps三种编码速率。当网络带宽拥挤时,G.722会自动进行高比例的数位压缩,选用较小的速率,如使用56kbps、48kbps进行编码传输,从而节省带宽。当网络带宽正常时,G.722会恢复到64kbps的方式。这样就使宝贵的网络带宽得到高效的利用,从而使基于G.722编解码器的电视电话会议等应用成为可能。本文对G.722宽带音频预处理算法进行了研究,主要做了如下几个方面的工作:(1)介绍宽带音频编码器的历史和发展现状,以及语音预处理方法的基本概念。(2)介绍了预处理算法所涉及的相关理论,如人耳的掩蔽效应、人耳的感知频率特性,以及mel倒谱分析中所涉及的同态滤波理论。(3)在对G.722语音编解码器的原理和各个模块进行深入研究的基础上,对目前常用的几种预处理算法,如量化噪声成型算法、自适应后滤波算法、自适应mel倒谱分析、长时预测等进行了研究和讨论。(4)结合G.722编解码器的特点,将量化噪声成型算法、自适应后滤波算法应用到G.722的编解码系统中。并对这两种算法进行仿真,分别从语音和噪声的时域波形、频谱分布、功率谱分布、对数功率谱分布等特征,准确地验证了算法的性能和优缺点。并应用PESQ语音质量评分工具对该算法的效果进行评估。经过软件仿真与验证,所提的算法能够在不增加过多计算复杂度以及不降低语音质量客观评价的PESQ分值的基础上,对语音的主观听觉质量有一定的提升。