论文部分内容阅读
随着网络通信技术的高速发展,和数字视频在跨领域中的广泛应用,适应于异构网络的多样化视频服务为人们的生活和工作提供了更便捷、高效的视频体验。但是不同网络接入模式的服务质量具有差异性,带宽会经常发生波动,而多样化的终端和视频业务性能也各不相同,所以要求传输的视频流在结构上具有自适应性,在服务质量上具有灵活性和稳定性。可伸缩视频编码正是针对这些网络视频应用的新问题与需求应运而生的一种视频编码方案。在时域、空域和质量域等方面都有效地实现了可伸缩性,能根据条件的变化随时进行调整。提升可伸缩视频的编码效率、降低编码复杂性是视频编码领域的一项重要研究课题。本文应用率失真优化技术,针对H.264/SVC编码器设计特性,实现了性能优化。不仅有效地提升了编码效率,也为多用户网络视频应用从源端提供了保障,有助于推动可伸缩视频编码技术在网络视频中的产业化应用。由此可见,基于率失真优化的可伸缩视频编码研究具有重要的理论和应用价值。
本文以优化可伸缩视频编码器设计为出发点,围绕最新的可伸缩视频编码标准H.264/SVC特性展开,重点研究了率失真优化技术在H.264/SVC视频编码实际应用中的关键问题,主要的创新点包括以下几个方面:
(1)提出了一种基于改进的率失真代价函数的快速帧内预测模式选择算法通过估计残差信号的量化后DCT系数中包含零系数和±1系数的个数,结合CAVLC熵编码特性,提出了一种有效估计实际编码码率的预测方法。同时选取SAD为失真量度,构造了一种计算简单且均衡率失真性能的改进型率失真代价函数,进行模式优化选择。该方法有效地避免了在率失真优化选取过程中对每个块都需要进行量化、反量化、反变换和熵编码等一系列实际编码操作。在保证最优化编码性能几乎不变的同时,大幅度降低编码的时间复杂性。
(2)提出了一种基于GOP的空域可伸缩视频层码率优化分配方法在重点分析了空域可伸缩性中“层间预测”技术引入的层次间相关性的基础上,提出了两种不同分配单元粒度的码率优化分配的方案:基于GOP和基于图像帧为基本单元的空域视频层码率分配方案。从信号分解的角度刻画了增强层编码的实质,指出了造成非独立率失真特性的两方面因素,即依赖于基本层失真的输入差分序列的变化,以及增强层自身的量化参数的选取。通过引入图像帧复杂性用于描述输入差分序列特征后,分别对增强层视频的失真和码率特性进行分析,构建了以GOP为基本单元的率失真模型,最后使用拉格朗日乘数法求取了码率优化分配问题的最优分配方案。该方法的提出有效地弥补了现有H.264/SVC标准中没有层次间码率优化分配控制算法的不足,有利于进一步提高多空域层视频编码的编码性能。
(3)提出了一种基于图像帧的空域可伸缩视频层码率优化分配方法针对基于GOP的码率分配算法延迟较大、不适于实时网络视频应用的问题,进一步分析了包含不同分辨率尺寸图像帧的空域视频层间的相关性。利用柯西概率密度函数刻画了差分序列变换系数分布特点,构造了基于增强层视频帧的码率和失真模型,并有效去除了多量化参数变元间的相关性,从而利用拉格朗日乘数法求取了最优的码率分配方案。同时,将该两层优化分配算法拓展到多个视频层的应用场景,验证了该方法的通用性和鲁棒性。为了给出空域视频层码率优化分配问题的完备解决方案,还比较了基于GOP和基于帧的两种码率优化分配方法的性能和优缺点。
(4)提出了一种面向空域一质量域联合可伸缩视频层码率优化分配方法通过分别构建空域/质量域增强层失真值关于基本层失真值的失真域函数关系,将具有多变元的增强层失真函数去耦合,表示为关于基本层失真的多项式表达式。同理也分析了空域/质量域码率-码率域间的函数关系,建立了增强层码率多项式表达。这种相关层次间失真-失真、码率-码率关系的分析与建模,记作Self-domain方法。在已知空域和质量域视频层的码率和失真模型基础上,将两维可伸缩性联合视频编码的码率分配问题描述为一个两阶段最优化问题,并求取近似最优解。
(5)提出了一种面向空域-时域联合可伸缩视频层码率优化分配方法重点分析了时域可伸缩编码器设计中层次化B帧结构,在充分挖掘了时域层次间相关性的基础上,构建了时域各相关视频层的率失真函数关系。利用S-domain方法的分析,分别提出了时域视频层的失真和码率模型。从而针对H.264/SVC三种通用可伸缩性,提供了统一的模型化方法,实现了一种通用的基于S-domain码率优化分析方案。最后,将获得的时域/空域视频层率失真模型,同时代入到二维联合优化问题中,利用数值优化的方法求取该联合可伸缩视频编码层次间码率分配问题的最优数值解。