论文部分内容阅读
随着多媒体信息处理和网络通信技术的飞速发展,视频编码已成为信息产业的基础核心技术之一。H.264/AVC是由ISO/IEC和ITU—T联合制定的新一代视频编码标准,具有更高的压缩效率和稳定的网络友好性,应用前景十分广阔。然而,H.264/AVC在获得高效编码性能的同时也带来了巨大编码复杂度,严重阻碍了该标准的实时应用与推广。因此有效降低编码复杂度并保持编码优势成为H.264/AVC获得成功的关键因素,也是数字视频技术大规模实用化的迫切需要。
在上述背景下,本文针对H.264/AVC标准中的帧内预测、帧间预测模式选择以及运动估计等关键技术进行了研究,主要研究成果包括:
提出了基于宏块平坦度和子块相关性的快速帧内预测算法。首先,分析了帧内预测模式与视频内容的相关性,定义了宏块平坦度特征及其度量准则,针对Intra16×16和Intra4×4两种帧内预测模式进行优先判决;然后,依据相邻子块纹理相似性及预测模式相关性,针对Intra4×4预测模式选择进行逐级预判;最后,将提出的两种帧内预测策略结合,构成了分层管控的帧内预测模式快速选择机制。实验结果证明,本文算法实现了快速、准确的帧内预测,并且对输出码率和重建视频质量基本没有影响,保持了较高的率失真性能。
提出了基于宏块时空相关性和模式同源性的帧间预测模式快速选择算法。首先,分析了帧间编码模式分布的非均衡性,依据宏块时空相关性,在P帧编码中实现了对帧间和帧内两种预测模式的快速判别;然后,分析了多尺寸帧间预测模式的时间连续性和空间一致性,定义了时域同位块和空域相邻块的模式同源性特征,按Skip模式优选、到宏块分割模式预判、再到子块分割模式可选的顺序,实现了分层次帧间预测模式快速选择。实验结果证明,本文算法在几乎不牺牲编码性能的前提下显著降低了帧间预测计算复杂度,与文献中其它优化算法相比,具有较强的鲁棒性和较高的综合编码性能。
提出了基于编码块运动矢量相关性的动态运动估计搜索策略。首先,分析了可变块运动估计特点及UMHexagonS算法计算冗余,设计了基于运动矢量中心分布和运动特征分类的增强搜索模板,依据编码块运动程度,判定搜索层次;然后,基于运动矢量时间连续性和最优点SAD空间局部单调性,制定了搜索区间的预判准则,使搜索过程迅速靠近最佳匹配点;最后,根据运动矢量方向筛选搜索点集。实验结果证明,本文提出的动态搜索策略与全搜索算法FS相比,保持了预测的准确性;与H.264/AVC标准最新采纳的运动估计算法UMHexagonS相比,进一步降低了运动估计搜索复杂度,对不同运动程度的视频序列均取得了稳定的运动估计优化效果。
设计了融合视觉感知特征的低复杂度可分级视频编码方案。首先,分析了编码信息与视觉关注度的相关性,提出了基于编码信息的视觉感知特征分析与检测算法,实现了视觉感兴趣区域的准确获取;然后,根据视觉感知分析结果,设定视觉感兴趣优先级,并以设定的优先级为依据,结合提出的快速编码算法,对具有不同视觉特征显著度的视频内容制定分级编码方案;最后,构建了融合视觉特性的面向H.264/AVC低复杂度视频编码框架,实现了视觉感知分析与视频编码之间的信息复用。实验结果证明,本文提出的分级编码方案有效缓解了编码复杂度与编码准确性之间的矛盾,在保持良好视频图像质量的前提下,将编码速度平均提高约80%,显著改善了H.264/AVC的编码性能。