G.722宽带音频预处理算法的研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:QUEEN_ZX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济全球化的不断发展,人们的生产和生活不再局限于某一个城市或某一个国家,越来越多的公司或机构需要借助电视电话会议来完成彼此间的沟通。因此,清晰、高质量的宽带数字语音通信成为一种需求。目前,在宽带数字音频通信领域,1988年由CCITT制定的G.722标准被广泛认可和应用。G.722是7kHz带宽的64kbps音频编解码标准,它将可用通频带从200至3.2kHz扩展到50至7kHz。与传统的窄带通信相比,G.722在通话的清晰度和交谈的语音质量上,有较大改善,这也使传输更高质量的音乐信号成为可能。G.722有64kbps、56kbps、48kbps三种编码速率。当网络带宽拥挤时,G.722会自动进行高比例的数位压缩,选用较小的速率,如使用56kbps、48kbps进行编码传输,从而节省带宽。当网络带宽正常时,G.722会恢复到64kbps的方式。这样就使宝贵的网络带宽得到高效的利用,从而使基于G.722编解码器的电视电话会议等应用成为可能。本文对G.722宽带音频预处理算法进行了研究,主要做了如下几个方面的工作:(1)介绍宽带音频编码器的历史和发展现状,以及语音预处理方法的基本概念。(2)介绍了预处理算法所涉及的相关理论,如人耳的掩蔽效应、人耳的感知频率特性,以及mel倒谱分析中所涉及的同态滤波理论。(3)在对G.722语音编解码器的原理和各个模块进行深入研究的基础上,对目前常用的几种预处理算法,如量化噪声成型算法、自适应后滤波算法、自适应mel倒谱分析、长时预测等进行了研究和讨论。(4)结合G.722编解码器的特点,将量化噪声成型算法、自适应后滤波算法应用到G.722的编解码系统中。并对这两种算法进行仿真,分别从语音和噪声的时域波形、频谱分布、功率谱分布、对数功率谱分布等特征,准确地验证了算法的性能和优缺点。并应用PESQ语音质量评分工具对该算法的效果进行评估。经过软件仿真与验证,所提的算法能够在不增加过多计算复杂度以及不降低语音质量客观评价的PESQ分值的基础上,对语音的主观听觉质量有一定的提升。
其他文献
目前,产权保护已经成为一个引起广泛关注的焦点,数字水印技术为数字化产品的版权保护提供了一种有效方法。将数字水印技术运用到二维CAD图形对CAD图形的版权保护方面将会有很
信息隐藏是一项用于隐密通信和版权保护的新兴技术,能够同时隐藏信息的内容和信息的存在。因此,当信息隐藏用于隐蔽通信时,表现出了比密码技术更高的安全性。但信息隐藏技术
期刊
数字图像作为一种多媒体信息,在互联网及人们生活中扮演着举足轻重的角色。随着信息技术的快速发展,以及功能强大的图像编辑软件的出现,篡改数字图像变得更加简单,且人眼难于
家庭基站,即Femtocell,是一种移动通信系统室内覆盖的解决方案。目前研究WCDMA系统下的Femtocell基站侦听比较多。TD-SCDMA系统是我国自主研发的系统,起步较晚,所以TD-SCDMA
随着中国铁路系统的高速发展,人们也面临着越来越严重的铁路事故。与此同时,智能交通已成为交通科技领域的研究热点,然而,大部分的学者研究领域主要几种在公路交通,对铁路交
缺陷接地结构(DGS)是近年来在光子带隙(PBG)结构的基础上发展而来的一种新结构。DGS是通过在微波电路的接地板上蚀刻出周期的或非周期的形状,以改变电路衬底材料的有效介电常
移动通信近几十年来得到了广泛的研究,为人类社会的发展进步做出了巨大的贡献。尽管如此,电磁波在实际传输中却面临着更为复杂的传播环境。其中多径衰落效应是无线通信质量的
期刊
期刊