论文部分内容阅读
信息技术的迅猛发展给人们的生产生活带来了深远的影响。相对于文字、语言之类的抽象信息表示形式,视频、图像具有直观、生动、易于理解、通用性强等特征。但是由于视频图像的数据量非常大,不利于存储与传输,因此就要用到视频压缩技术来解决这一实际问题。
2003年5月,ITU-T/ISO正式公布了H.264/AVC视频压缩标准,与以往的视频编码标准相比,H.264/AVC具有出色的编码性能。其性能的提高得益于采用了许多新技术,如新的帧内预测方法、整数DCT变换、环路滤波、率失真优化技术、4×4块的运动估计、多参考帧选择、内容自适应的二进制算术编码等。但是H.264性能的提高是以增加编码复杂度为代价的,利用RDO技术计算每种模式RD的时候都要经过一个完整的编码过程,即对残差块进行DCT变换,量化,反变换,反量化,熵编码等。因此编码器的计算复杂度非常高,由此可见,如何有效地降低帧内预测的计算复杂度具有重要的应用价值。
本文首先介绍了H.264/AVC视频编解码标准,以及H.264中采用的主要技术,包括H.264的编解码器、H.264的档次和级、H.264的编码格式、H.264帧内和帧间预测、整数变换与量化、去方块滤波等,并详细地介绍了帧内预测中4×4亮度块、16×16亮度宏块、8×8色度块的预测模式,分析了帧内预测编码的运算复杂度。然后介绍了边缘检测与纹理分析的方法与应用,并在此基础上提出了基于边缘检测的帧内预测快速算法和基于纹理方向的帧内预测快速算法。对于前一种方法,首先将图像块下采样为3×3大小的图像块,再利用四方向的sobel算子进行边缘检测,根据边缘检测的结果选择少数的几个预测模式进行RDO计算。对于后一种方法,通过分析帧内图像的纹理方向,确定了一个预测模式的子集,该集合中预测模式的数量要少与全搜索下帧内预测模式的数量,因此可以有效地降低编码的复杂度。