基于H.264/AVC标准的多视角视频编解码算法设计

来源 :北京大学 | 被引量 : 0次 | 上传用户:xmuppdragon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
技术的完善与需求的驱动促使多视角视频处理研究在近年飞速发展。为保证在现有信道带宽的基础上,以更高的增益传输多视角视频序列,国际电信联盟(ITU)与国际标准化组织(ISO)共同成立了联合专家组JVT/MPEG,并于2005年7月公开征集以H.264/AVC标准为基础的多角度视频编解码系统议案。 本文致力于在H.264/AVC视频编解码标准基础上,通过基于目标的多视角视频编解码框架,挖掘多视角视频序列之间的相关性,以提高编码增益。 在结构上,首先对多视角视频编解码问题的发展与相关工作进行了总结,并对基于H.264/AVC标准的多视角编解框架的设计与修改方案提供了充分的讨论。在此基础上,作者详细的描述了多视角视频编解器的设计要旨与实现过程。 在实验上,作者以基于视差补偿的多视角视频编码框架为基础,分析了基于目标的多视角视频编码框架的合理性与必要性。最后,作者详细描述了基于目标的多视角视频编码器的实现过程,并使用KDDI提供的三组多视角视频序列进行实验。实验结果显示,对于低分辨率且相机位置与角度固定的多视角视频序列,与传统H.264/AVC标准相比,基于目标的多视角视频编解码框架可以提供0.3dB-2.2dB的增益。 本文贡献如下: 1.提供了基于H.264/AVC标准的多视角视频编解码算法的详细设计方案; 2.提出了基于运动目标的多视角视频编解码算法,与已发表的工作相比,该方法充分利用了编码器自身提供的运动估计信息进行运动目标聚类,无须摄像机的内外参数和深度图像辅助,从而降低了编码器与解码器的复杂度;在进行运动目标位置校准时,该方法借助了SIFT特征点匹配算法,有效地避免了传统校准算法在解码图像上失效的问题。 在本文的附录部分,作者总结了硕士阶段在视频、图像编解码领域的另外两项工作,概述如下: 附录一:基于矩阵分解的DCT快速算法研究作者使用了矩阵分解的方法,分析现有离散余弦变换(DcT)快速算法的内在规律,并在此基础上揭示了产生离散余弦变换的快速算法的通用方法;同时利用离散余弦变换矩阵的正交特性,提出当快速算法的递归核(recursivekernel)正交时,则存在另一个“孪生”离散余弦变换快速算法;最后作者提出了一个具有并行结构的新的DCT快速算法,其算法复杂度与当前最快的DCT快速算法相同; 附录二:符合DCI规范数字影院解码系统中核心控制FPGA的设计与实现该工作旨在根据DCI规范对数字电影解码部分的功能要求,使该FPGA芯片对数据流与控制流进行有效控制,并与系统中其他部件,如:PCI总线接口、解码器、高清输出等,相互配合,以实现数字影院服务器最终独立成功研制。
其他文献
UWB(超宽带)穿墙探测器是一种新型的、基于UWB技术的手持式探测器。UWB信号具有良好的穿透能力、低功率谱密度、实现简易等优点。基于UWB技术的隐藏活动目标探测器,能有效探
本研究利用细胞学、形态学和分子系统学等多学科手段和方法,对菝葜属和肖菝葜属以及菝葜复合种进行了研究,探讨了菝葜属和肖菝葜属的核型和花序演化特征、以及菝葜属内菝葜复合
非均匀光照是指由光学系统渐晕、大气扰动等因素引起的单幅遥感图像局部的色彩不均衡或多幅遥感图像之间的色彩不均衡。无论对卫星图像还是航空图像而言,非均匀光照都是无法避
心率变异性(HRV)就是指逐次心跳间期之间的微小差异,人体输出的心率变异性信号中隐藏着重要的非线性动力学信息,它受人体自主神经系统的调控,能够反映心脏的生理和病理状态。作
随着视频应用的日益广泛,视频的数据量也在不断增加,对这些视频数据必须进行有效的管理、组织才能对其进行更好的分析和利用。但对视频进行有效的管理和利用却是一件非常困难
多频连续波雷达以其结构简单、测距精度高、无速度模糊、便于采用现代数字信号处理等优点,在测量等领域中具有广阔的应用前景。在多频连续波雷达实时测量中,速度测量对后续测距
耐辐射奇球菌(Deinococcus radiodurans)以具有极强的DNA损伤修复能力而著称,是研究DNA损伤修复的理想模式生物。pprI是耐辐射球菌体内的一个重要的DNA修复开关基因,通过直接或
本论文从一个崭新的角度看网络,将网络视为各种服务器组成的服务器群,将网络的性能表示成三大类服务器性能的复杂组合。为了得到更好的系统性价比,引出了光突发交换网络中用于解
自从卢米埃尔兄弟发明电影以来,在相当长的时间里,胶片成为电影图像和声音的唯一载体。在科学技术飞速发展的今天,数字技术已成为当今世界领先的技术,电影经过百年磨砺,现今已向数
现实生活中存在大量的电话语音,无论是民用还是国家安全应用,都迫切需要分析这些电话语音.手工分析整理这些电话则面临着成本高、劳动强度大、标准难以统一、可信度受到局限等
学位