论文部分内容阅读
随着计算机通信和显示技术的不断发展,视频信号处理技术也随之迅猛发展,其中的二维(2D)视频压缩传输技术几近成熟,并逐渐被应用在各个领域。下一代视频技术将是与人的双眼三维(3D)视觉更匹配的3D立体视频技术,以自由视点视频为代表的3DTV视频技术在本世纪初迅速发展起来,其特点是立体感和交互性。自由视点视频给传统的视频处理技术带来新的挑战,包括多视点视频数据的采集、编码压缩、传输、接收端绘制重现等,而多视点视频编码压缩是其中最为关键的瓶颈技术。
与单视点和双目立体视频序列相比,多视点视频序列是由摄像机阵列对同一场景的不同角度拍摄得到,其视频流路数更多,数据量成倍增加,各个视点视频图像问也增加了大量的冗余度。多视点视频编码应根据多视点视频的这些特点,充分利用多个视频图像之间的多重冗余信息,更有效地编码压缩和传输多视点视频数据。
本文对多视点视频源端采集的摄像机成像过程进行了研究分析,提出一种基于遗传算法的摄像机自标定方法。利用遗传算法实现Hartley的基于新Kruppa方程的摄像机自标定过程,消除了极点的影响,将这个过程完全转化为通过代价函数的最小化来求得摄像机的内参数,排除了极点的不稳定因素,这样可得到较精确的标定结果。由于其标定过程简单易行,该方法适用性强。
本文在摄像机内外参数标定的基础上,研究了基于标定参数的视点预测方法。在完成摄像系统的标定工作后,根据其内外参数来预测多个视点的图像,减少了视差搜索的时间,提高效率。本文对多视点视频序列的实验得到了较好的预测效果,表明基于摄像机标定参数的多视点视频图像预测是一种简便易行、有效的多视点预测方法。
本文针对主流的GoGOP(Group of GOP)预测结构的帧内编码帧较多从而影响编码效率的问题,提出一种基于多参考帧视差预测的编码预测结构。该结构充分利用多视点间和帧间的冗余相关性,减少帧内编码帧的个数,扩展视点的预测范围,采用基于可变块匹配算法的多参考帧视差预测方式;某些B帧在编码端不传送,而在解码端通过帧估计技术补偿重建,以此来提高预测/补偿编码效率。多参考帧的视差预测效果良好,实验结果显示预测图像的峰值信噪比(PSNR)平均提高了2dB左右,提出的预测结构明显降低了码率,不同的测试序列在相同码率下的平均PSNR提高1.1~1.6dB。
本文对上述预测结构中编码端丢弃的B帧,采用基于多参考帧的帧估计补偿方法在解码端进行重建,选取了具有因果关系的多个参考帧,自适应选择最佳匹配块来补偿当前帧的当前块。实验表明:基于多参考帧的补偿效果远比基于单参考帧的重建效果要好,图像质量更加清晰,PSNR提高了2.5dB。而基于多参考帧的补偿效果一定程度上依赖于视差估计算法以及运动估计算法的精确度,若提高视差和运动估计的精度,基于多参考帧的帧重建效果还可进一步得到改善。