论文部分内容阅读
技术的完善与需求的驱动促使多视角视频处理研究在近年飞速发展。为保证在现有信道带宽的基础上,以更高的增益传输多视角视频序列,国际电信联盟(ITU)与国际标准化组织(ISO)共同成立了联合专家组JVT/MPEG,并于2005年7月公开征集以H.264/AVC标准为基础的多角度视频编解码系统议案。
本文致力于在H.264/AVC视频编解码标准基础上,通过基于目标的多视角视频编解码框架,挖掘多视角视频序列之间的相关性,以提高编码增益。
在结构上,首先对多视角视频编解码问题的发展与相关工作进行了总结,并对基于H.264/AVC标准的多视角编解框架的设计与修改方案提供了充分的讨论。在此基础上,作者详细的描述了多视角视频编解器的设计要旨与实现过程。
在实验上,作者以基于视差补偿的多视角视频编码框架为基础,分析了基于目标的多视角视频编码框架的合理性与必要性。最后,作者详细描述了基于目标的多视角视频编码器的实现过程,并使用KDDI提供的三组多视角视频序列进行实验。实验结果显示,对于低分辨率且相机位置与角度固定的多视角视频序列,与传统H.264/AVC标准相比,基于目标的多视角视频编解码框架可以提供0.3dB-2.2dB的增益。
本文贡献如下:
1.提供了基于H.264/AVC标准的多视角视频编解码算法的详细设计方案;
2.提出了基于运动目标的多视角视频编解码算法,与已发表的工作相比,该方法充分利用了编码器自身提供的运动估计信息进行运动目标聚类,无须摄像机的内外参数和深度图像辅助,从而降低了编码器与解码器的复杂度;在进行运动目标位置校准时,该方法借助了SIFT特征点匹配算法,有效地避免了传统校准算法在解码图像上失效的问题。
在本文的附录部分,作者总结了硕士阶段在视频、图像编解码领域的另外两项工作,概述如下:
附录一:基于矩阵分解的DCT快速算法研究作者使用了矩阵分解的方法,分析现有离散余弦变换(DcT)快速算法的内在规律,并在此基础上揭示了产生离散余弦变换的快速算法的通用方法;同时利用离散余弦变换矩阵的正交特性,提出当快速算法的递归核(recursivekernel)正交时,则存在另一个“孪生”离散余弦变换快速算法;最后作者提出了一个具有并行结构的新的DCT快速算法,其算法复杂度与当前最快的DCT快速算法相同;
附录二:符合DCI规范数字影院解码系统中核心控制FPGA的设计与实现该工作旨在根据DCI规范对数字电影解码部分的功能要求,使该FPGA芯片对数据流与控制流进行有效控制,并与系统中其他部件,如:PCI总线接口、解码器、高清输出等,相互配合,以实现数字影院服务器最终独立成功研制。