MPEG音频压缩编码的改进与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:yhbx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在音频压缩编码领域中,MPEG标准是应用最为广泛的标准之一,特别是其中的第三层编码方案(即MP3音频格式)在互联网时代得到了最大规模的普及.MP3编码方案建立在心理声学模型的基础上,运用ASPEC算法极大的去除了音频信号中的冗余信息,在很高的压缩比下仍然能得到令人满意的结果. MP3编码流程中的时频变换模块原先采用的是PQMF混合滤波器组与固定窗口的MDCT变换,本文在详尽讨论MP3编码流程的基础上提出并实现了一种新的编码方案,即采用自适应局部余弦变换来构成新的时频变换模块.局部余弦变换(LocalCosineTransform)是一种在上世纪八十年代末提出的时频局部化算子,它可以做到先将信号在时域上光滑地分割成区间信号,然后在区间内部进行频率分解.不同于常见的加窗Fourier变换,局部余弦变换在时域上的区间分划完全是任意的,这使得根据信号内在结构对其进行时域分割,然后在这种分割的基础上进行时频变换成为可能.上世纪九十年代初,人们提出可以对信号进行自适应的时域分割然后进行进一步频域分解,这被称为自适应局部余弦变换(AdaptedLocalCosineTransform).本文对已有的自适应区间划分算法进行了改进,使之能够更适应音频编码的要求,进而在此基础上将其应用于音频压缩流程之中,实现了新的音频压缩编码方案.同经典的MP3编码方案相比,新的编码方案一方面做到了能够根据信号内在时域结构来进行窗口划分和压缩,从而得到很好的压缩效果,另一方面在编码后的码流中可以携带根据自适应区间分析而得到的关于信号特征的信息,这些信息可以为进一步实现对音频文件的自动识别、分类和检索提供有效的帮助.这些优势(特别是第二方面的优势)会在互联网大规模传播音频文件的时代得到很好地发挥和应用.
其他文献
本文对一类具有有界混合偏导数的函数类的基于非线性信息的非线性宽度进行估计,并得出其非线性宽度阶的精确估计.下面我们首先从伪维数的定义引入非线性宽度的概念,综合上面两
解析函数的唯一性和增长性是复分析研究的重要对象。本文研究了在复分离条件下解析函数的增长性以及广义准解析函数类在角形区域上的唯一性,另外,也探讨了广义准解析函数、渐近
本文通过对荣华二采区10
本文讨论了如何从数据的变量聚类分析结果和条件独立性出发,进行无向图和有向图学习的问题。本文回顾了基于独立性的无向图一般学习算法,介绍了SAS(R)的变量聚类过程PROCVARCLU
本文通过对荣华二采区10
2005年11月,省政府在东莞市召开了全省供销合作社工作会议。会议要求各级供销合作社要抓住机遇,大胆创新,开拓经营,坚持为农服务的宗旨,加快社有企业、基层社改革和四大网络建设步
本篇论文首先回顾了正则化方法的发展,罗列了当前正则化方法所取得的结果,在介绍基于解决Shannon取样的学习理论中,利用已有的先验知识,把单参数变为两个参数时,能够提高界的精度.
对于高中生而言,其思想已趋于成熟.因此,教师在进行高中政治教学时,不能仅仅进行文化教育,更应重视学生思想道德的培育,帮助学生树立正确、健康的人生观、世界观、价值观.也
本文采用两种模型来对首都圈的37个地震和37个爆破进行分类。首先采用线性判别分析模型。不同于通常在选择判别变量时单独使用逐步判别的做法,本文使用单台的判别效果以及逐步
本次交易会的背景是什么? 2006年国际焊接与切割商品交易会,是借助中国商务部重点支持、中国历史最悠久的知名五金展——全国五金商品交易会及第九届中国国际五金商品博览会