基于多尺度分析的视频可分级编码技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:supphia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频编码技术以及网络传输技术和用户终端设备计算能力的飞速发展催生出多种类型的视频服务,如视频电话和会议、移动流媒体、视频监控、IPTV等。然而,异构网络的时变特性,用户终端能力的千差万别(如接入带宽、解码能力、分辨率等)向网络视频的稳定传输提出了挑战。视频可分级编码便是一种非常具有吸引力的解决方案。尽管JVT(Joint Video Team)组织在2007年通过了基于H.264/MPEG-4 AVC架构的可分级编码标准,可是其率失真性能仍低于现有的不分级编码器。另一方面,基于多尺度分析(特别是小波分析)的视频编码技术虽有多种方案,其可分级编码框架也已经基本建立,可是并未完善,仍有很多关键问题需要寻求更佳的解决方案。因此,对视频可分级编码的深入研究具有很好的理论意义和应用价值。  本文以多尺度分析为理论工具,对视频可分级编码的关键技术进行了深入研究,包括帧内/帧差图像的编码、运动估计以及运动向量编码等。本文贡献主要体现在以下五个方面:  (1)给出了多尺度变换系数的自相关模型  在多尺度分析理论的基础上,论文给出了多尺度变换系数的统计指标与空域指标的关系。从该模型出发,本文:  ①从理论上分析了多尺度变换系数的压缩性、持续性和聚集性;  ②建立了运动向量精度与小波域运动补偿误差之间的关系;  ③证明了高频系数在运动估计中作用有限,甚至有负面影响;  ④提出了比特转换误差一运动向量精度模型。  (2)提出了基于轮廓波和四叉块模型的帧内/帧差图像编码算法  论文利用轮廓波方向子带内系数幅值的相关性,给出了一种用于轮廓波方向子带的四叉块分裂模型,自适应地定位大幅值系数的聚集区域,以减少用来编码重要系数位置的信息,并提出了基于轮廓波的四叉块编码算法。实验结果表明,该算法对于纹理比较突出,或者边缘和轮廓信息丰富的图像,其重构峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)在相同码率下较之SPIHT提高了0.5~1.5dB。  (3)提出了主观无损的运动向量精度预测算法  论文对运动向量精度进行了研究,提出了一种主观无损的运动向量精度预测算法。根据给定视频的分布特性和空间分辨率特性,该算法用来预测主观无损的运动向量精度阈值,从而为运动向量的基层编码精度提供参考。只要运动向量可分级编码的精度高于该阈值,就可采用任何一种基于率失真优化的方法编码运动向量,进而在保证视频的主观重构质量的前提下,提高编码效率。实验结果验证了该算法的有效性。  (4)提出了性能优化的小波域快速运动估计算法  本文研究了小波域运动估计,提出了一种只在低频子带进行运动估计的层次算法HLBME(Hierarchical Low Band Motion Estimation)。实验结果表明,该算法的运动补偿PSNR较空间域全搜索平均高0.24dB,比最精细的子带直接运动估计高1.74dB,比低频子带平移算法高0.72dB。并且,该算法的运算量是全搜索的21.34%,是低频子带平移运动估计的21.10%,与子带直接运动估计的速度相当。在此基础上,采用低比特像素技术对HLBME算法进行了改进,提出了基于模糊量化的比特转换方法以及基于低比特像素的小波域运动估计算法。与HLBME相比,该算法的运动补偿PSNR平均降低约0.4dB,略低于FS,但运算量却减少了78.16%。  (5)提出了Alpha平面辅助的视频对象快速小波域运动估计算法  本文将Alpha平面视为一种用于视频对象的特殊的低比特像素表示,设计了边界延拓、边界掩码和Alpha平面的匹配衡量准则,并提出了一种Alpha平面辅助的视频对象快速小波域运动估计算法。实验结果表明,该算法的运动补偿质量优于现有的典型小波域算法,相当或略优于FS,计算速度比全搜索快22.68倍,比低频子带平移方法快22.90倍,比部分搜索方法快7.10倍,比最精细的子带直接运动估计快1.29倍。
其他文献
随着各种技术的不断发展,机电一体化技术也获得进一步创新,其不仅集成更多先进的技术,而且拥有非常广泛的发展前景.本文主要对机电一体化的创新和发展趋势进行分析,旨在进一
工业废水中含有大量的对人体和环境造成危害的成分,利用化学检测技术可以在最短的时间内分析工业废水中所包括的含量以及成分,将其中对环境造成负面影响的内容筛选出来.并且
在社会经济高速发展的背景 下,我国铁路事业高速发展,动车组数量不断增加,对动车组检修备件库存管理提出了更高的要求.本文以动车组检修备件库存管理优化为研究内容,针对动车
近年来,随着数码相机、摄像机等电子产品的日益普及,人们能够非常方便地利用它们拍摄出高分辨率的数字图像。为了信息共享和交流的需要,人们通常需要把这些图像显示在手机、PDA
我国科学技术在不断发展,智能化、自动化控制技术受到了建筑行业的追捧.为了实现智能化建筑,需要电气技术、计算机技术以及电子技术和自动控制技术等的协同合作.而电气工程作
人脸老化是人脸表观随时间推移呈现的一种非人为控制的、必然的、不可逆转的缓慢变化,对人脸老化的建模是人脸相关研究的一个重要方面,吸引了来自计算机视觉、图形学、心理学
学位
本文的研究内容是动态身份认证。设计了一种可以实现双向认证的动态身份认证方案,并实现了该方案的C/S模型。 文中首先从现有的身份认证系统出发,分析研究了基于S/KEY协议的
绿原酸作为蒲公英中的有效成分,在食品保鲜和医学领域均有着广泛的应用.为进一步提高绿原酸的提取效率、加强药理活性研究,本文整理了近年来蒲公英中绿原酸的提取方法,归纳总
随着社会的进步,人工智能技术也有了快速的发展,给人们的生活带来了一定的改变,也为工业发展带来了变革,在很大程度上促进了现代社会的进步,文明的发展.电气自动化是非常有利
基于构件的软件开发是网络环境下大型分布式企业开发的重要形式。构件通过封装一定的功能来提供可以复用、组装的软件资源,对外提供软件服务。传统的构件技术通过中间件提供事