基于率失真优化的可伸缩视频编码研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：tryst8

【摘要】

：

随着网络通信技术的高速发展，和数字视频在跨领域中的广泛应用，适应于异构网络的多样化视频服务为人们的生活和工作提供了更便捷、高效的视频体验。但是不同网络接入模式的服务

【作者】

：

刘家瑛

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2010年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络通信技术的高速发展，和数字视频在跨领域中的广泛应用，适应于异构网络的多样化视频服务为人们的生活和工作提供了更便捷、高效的视频体验。但是不同网络接入模式的服务质量具有差异性，带宽会经常发生波动，而多样化的终端和视频业务性能也各不相同，所以要求传输的视频流在结构上具有自适应性，在服务质量上具有灵活性和稳定性。可伸缩视频编码正是针对这些网络视频应用的新问题与需求应运而生的一种视频编码方案。在时域、空域和质量域等方面都有效地实现了可伸缩性，能根据条件的变化随时进行调整。提升可伸缩视频的编码效率、降低编码复杂性是视频编码领域的一项重要研究课题。本文应用率失真优化技术，针对H.264/SVC编码器设计特性，实现了性能优化。不仅有效地提升了编码效率，也为多用户网络视频应用从源端提供了保障，有助于推动可伸缩视频编码技术在网络视频中的产业化应用。由此可见，基于率失真优化的可伸缩视频编码研究具有重要的理论和应用价值。　　本文以优化可伸缩视频编码器设计为出发点，围绕最新的可伸缩视频编码标准H.264/SVC特性展开，重点研究了率失真优化技术在H.264/SVC视频编码实际应用中的关键问题，主要的创新点包括以下几个方面：　　（1）提出了一种基于改进的率失真代价函数的快速帧内预测模式选择算法通过估计残差信号的量化后DCT系数中包含零系数和±1系数的个数，结合CAVLC熵编码特性，提出了一种有效估计实际编码码率的预测方法。同时选取SAD为失真量度，构造了一种计算简单且均衡率失真性能的改进型率失真代价函数，进行模式优化选择。该方法有效地避免了在率失真优化选取过程中对每个块都需要进行量化、反量化、反变换和熵编码等一系列实际编码操作。在保证最优化编码性能几乎不变的同时，大幅度降低编码的时间复杂性。　　（2）提出了一种基于GOP的空域可伸缩视频层码率优化分配方法在重点分析了空域可伸缩性中“层间预测”技术引入的层次间相关性的基础上，提出了两种不同分配单元粒度的码率优化分配的方案：基于GOP和基于图像帧为基本单元的空域视频层码率分配方案。从信号分解的角度刻画了增强层编码的实质，指出了造成非独立率失真特性的两方面因素，即依赖于基本层失真的输入差分序列的变化，以及增强层自身的量化参数的选取。通过引入图像帧复杂性用于描述输入差分序列特征后，分别对增强层视频的失真和码率特性进行分析，构建了以GOP为基本单元的率失真模型，最后使用拉格朗日乘数法求取了码率优化分配问题的最优分配方案。该方法的提出有效地弥补了现有H.264/SVC标准中没有层次间码率优化分配控制算法的不足，有利于进一步提高多空域层视频编码的编码性能。　　（3）提出了一种基于图像帧的空域可伸缩视频层码率优化分配方法针对基于GOP的码率分配算法延迟较大、不适于实时网络视频应用的问题，进一步分析了包含不同分辨率尺寸图像帧的空域视频层间的相关性。利用柯西概率密度函数刻画了差分序列变换系数分布特点，构造了基于增强层视频帧的码率和失真模型，并有效去除了多量化参数变元间的相关性，从而利用拉格朗日乘数法求取了最优的码率分配方案。同时，将该两层优化分配算法拓展到多个视频层的应用场景，验证了该方法的通用性和鲁棒性。为了给出空域视频层码率优化分配问题的完备解决方案，还比较了基于GOP和基于帧的两种码率优化分配方法的性能和优缺点。　　（4）提出了一种面向空域一质量域联合可伸缩视频层码率优化分配方法通过分别构建空域/质量域增强层失真值关于基本层失真值的失真域函数关系，将具有多变元的增强层失真函数去耦合，表示为关于基本层失真的多项式表达式。同理也分析了空域/质量域码率-码率域间的函数关系，建立了增强层码率多项式表达。这种相关层次间失真-失真、码率-码率关系的分析与建模，记作Self-domain方法。在已知空域和质量域视频层的码率和失真模型基础上，将两维可伸缩性联合视频编码的码率分配问题描述为一个两阶段最优化问题，并求取近似最优解。　　（5）提出了一种面向空域-时域联合可伸缩视频层码率优化分配方法重点分析了时域可伸缩编码器设计中层次化B帧结构，在充分挖掘了时域层次间相关性的基础上，构建了时域各相关视频层的率失真函数关系。利用S-domain方法的分析，分别提出了时域视频层的失真和码率模型。从而针对H.264/SVC三种通用可伸缩性，提供了统一的模型化方法，实现了一种通用的基于S-domain码率优化分析方案。最后，将获得的时域/空域视频层率失真模型，同时代入到二维联合优化问题中，利用数值优化的方法求取该联合可伸缩视频编码层次间码率分配问题的最优数值解。

其他文献

数据驱动的近岸涌浪动画合成方法研究

流体模拟，尤其是大面积水面及波浪的快速建模与可控动画一直是计算机图形学研究的热点问题之一。对各种波浪形态的模拟在影视特效、三维游戏开发等各种领域得到了越来越广泛的

学位

波浪模拟动画合成数据驱动图像重建

基于RFID的肉食品追溯管理系统的研究与实现

近年来，消费者对食品安全问题越来越重视，畜产品可追溯系统作为食品质量安全风险控制管理的有效手段也随之受到了越来越多的关注。　　本论文基于无线射频识别(RFID)技术提出

学位

食品安全

运营·有线内容

江苏:省有线网络公司成立7月24日,江苏省广播电视信息网络股份有限公司在南京成立,注册资本68亿元,由南京、苏州等10地市广播电视台以现有广电网络资产出资,及中信国安等机构

期刊

资产出资有线网络公司电网络数字电视广播电视信息股份有限公司有线电视数字电视用户村村通中信国安

确保先进性教育真正成为群众满意、师生满意工程

学校开展党员先进性教育活动,要自始至终把群众满意、师生满意作为根本标准。胡锦涛总书记最近在山东考察工作时强调,要确保先进性教育活动真正成为群众满意工程。这是总书

期刊

教育活动战斗堡垒作用先锋模范作用基层党组织自我教育辩证统一关系实践标准“为人民服务”教育体系正面教育

组工之歌

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

就是你平等待人人说革命事业吹洗秋夜基础工程夏雨

身份认证与识别系统中动态口令的生成

　　身份认证是多数计算机信息系统必要的组成部分，传统的身份认证多采用静态的用户名/口令身份认证机制。这种身份认证机制的优点是使用简单方便，但由于缺少全面的安全性方面

学位

网络管理信息系统身份认证动态口令

中断驱动系统有界模型检验的偏序优化技术研究

中断驱动系统(Interrupt-driven System)被广泛应用于安全关键系统中,因而中断驱动系统的正确性保障尤为重要。此类系统通常使用操作系统任务调度加中断处理程序的软件体系结

学位

中断驱动系统有界模型检验偏序约减

周恩来关心棉区红旗杨柳雪

“文革”爆发后,国民经济遭到严重破坏,关系到国计民生的粮棉生产形势十分严峻。周恩来心急如焚,努力寻找粮棉双高产的先进典型,以推动全国农业的发展。1969年夏,山东党组织

期刊

杨维屏滨县粮棉双高产尚店创造经验山东大汉纪登奎雅庄杨得志

传递成长的快乐

少儿频道即将五周岁。其成长迅猛,显示了初生牛犊不畏虎的锐气。在全国上星频道中,少儿频道平均收视份额已从开办之初的第21位跃居目前的第7位,频道满意度列全国上星频道第9

期刊

少儿频道收视份额上星频道专业频道初生牛犊绿色收视率迪士尼播出季儿童节目罗迪

基于主题模型的检索结果聚类的研究

网络信息技术的飞速发展使得信息检索成为用户从海量网络资源中获取有用信息的重要手段，由于目前大多数检索系统主要基于词语匹配，而其查询结果仅仅提供一个冗长的相关列表，这导

学位

信息检索聚类算法主题模型类簇标签

基于率失真优化的可伸缩视频编码研究

其他学术论文