论文部分内容阅读
视频编码技术以及网络传输技术和用户终端设备计算能力的飞速发展催生出多种类型的视频服务,如视频电话和会议、移动流媒体、视频监控、IPTV等。然而,异构网络的时变特性,用户终端能力的千差万别(如接入带宽、解码能力、分辨率等)向网络视频的稳定传输提出了挑战。视频可分级编码便是一种非常具有吸引力的解决方案。尽管JVT(Joint Video Team)组织在2007年通过了基于H.264/MPEG-4 AVC架构的可分级编码标准,可是其率失真性能仍低于现有的不分级编码器。另一方面,基于多尺度分析(特别是小波分析)的视频编码技术虽有多种方案,其可分级编码框架也已经基本建立,可是并未完善,仍有很多关键问题需要寻求更佳的解决方案。因此,对视频可分级编码的深入研究具有很好的理论意义和应用价值。 本文以多尺度分析为理论工具,对视频可分级编码的关键技术进行了深入研究,包括帧内/帧差图像的编码、运动估计以及运动向量编码等。本文贡献主要体现在以下五个方面: (1)给出了多尺度变换系数的自相关模型 在多尺度分析理论的基础上,论文给出了多尺度变换系数的统计指标与空域指标的关系。从该模型出发,本文: ①从理论上分析了多尺度变换系数的压缩性、持续性和聚集性; ②建立了运动向量精度与小波域运动补偿误差之间的关系; ③证明了高频系数在运动估计中作用有限,甚至有负面影响; ④提出了比特转换误差一运动向量精度模型。 (2)提出了基于轮廓波和四叉块模型的帧内/帧差图像编码算法 论文利用轮廓波方向子带内系数幅值的相关性,给出了一种用于轮廓波方向子带的四叉块分裂模型,自适应地定位大幅值系数的聚集区域,以减少用来编码重要系数位置的信息,并提出了基于轮廓波的四叉块编码算法。实验结果表明,该算法对于纹理比较突出,或者边缘和轮廓信息丰富的图像,其重构峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)在相同码率下较之SPIHT提高了0.5~1.5dB。 (3)提出了主观无损的运动向量精度预测算法 论文对运动向量精度进行了研究,提出了一种主观无损的运动向量精度预测算法。根据给定视频的分布特性和空间分辨率特性,该算法用来预测主观无损的运动向量精度阈值,从而为运动向量的基层编码精度提供参考。只要运动向量可分级编码的精度高于该阈值,就可采用任何一种基于率失真优化的方法编码运动向量,进而在保证视频的主观重构质量的前提下,提高编码效率。实验结果验证了该算法的有效性。 (4)提出了性能优化的小波域快速运动估计算法 本文研究了小波域运动估计,提出了一种只在低频子带进行运动估计的层次算法HLBME(Hierarchical Low Band Motion Estimation)。实验结果表明,该算法的运动补偿PSNR较空间域全搜索平均高0.24dB,比最精细的子带直接运动估计高1.74dB,比低频子带平移算法高0.72dB。并且,该算法的运算量是全搜索的21.34%,是低频子带平移运动估计的21.10%,与子带直接运动估计的速度相当。在此基础上,采用低比特像素技术对HLBME算法进行了改进,提出了基于模糊量化的比特转换方法以及基于低比特像素的小波域运动估计算法。与HLBME相比,该算法的运动补偿PSNR平均降低约0.4dB,略低于FS,但运算量却减少了78.16%。 (5)提出了Alpha平面辅助的视频对象快速小波域运动估计算法 本文将Alpha平面视为一种用于视频对象的特殊的低比特像素表示,设计了边界延拓、边界掩码和Alpha平面的匹配衡量准则,并提出了一种Alpha平面辅助的视频对象快速小波域运动估计算法。实验结果表明,该算法的运动补偿质量优于现有的典型小波域算法,相当或略优于FS,计算速度比全搜索快22.68倍,比低频子带平移方法快22.90倍,比部分搜索方法快7.10倍,比最精细的子带直接运动估计快1.29倍。