无参考视频质量评价方法的研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dillon100200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着智能手机、平板电脑、掌上电脑等各种多媒体终端设备的快速发展与普及,视频资源的数量呈现出爆炸式增长的趋势。但是,受限于视频采集与传输过程中的一些客观条件,最终呈现在用户面前的视频往往都伴随着不同程度的失真。视频质量评价在诸如视频增强、视频压缩与重建、视频水印添加等视频处理应用中都起着非常重要的作用。视频质量评价根据评价主体的不同可以分为主观评价和客观评价。客观评价根据使用原始参考视频的多少又可以划分为全参考、半参考和无参考方法。本文主要围绕无参考评价方法展开了研究,主要工作包括:  第一,提出了一种基于韦伯定律的多回归无参考视频质量评价方法。传统的无参考视频质量评价方法大多是基于统计分析的,大部分使用手工提取的特征,时域信息考虑的较少,且多是采用单回归模型。这就导致其特征表示能力比较局限,且单回归模型的预测性能也有待提升,这些方法由于大量的手工设计的特征,实时性也较差。基于此,我们在空域信息方面重新训练Alex网络(即Alexnet)来学习表示帧内的质量特征,在时域信息方面设计了一种基于邻帧对应块的低频信息变换统计特征,实验中发现预测规律与韦伯定律相一致,从而促使我们采用多回归模型来进行建模。通过在LIVE数据集和EFPL数据集上的实验证明了我们方法的有效性。  第二,提出了一种经验与数据驱动相融合的无参考视频质量评价方法。无参考评价方法大致可以分为两类,经验驱动(基于先验知识)的方法和数据驱动(基于学习)的方法。前者由于受限于人类有限的经验知识以及视频中失真的复杂性,所以其预测性能并不是很好,但是由于其设计的单一性以及对数据内容普适性,使得其预测结果比较稳定。后者受限于有限的训练数据,致使其预测稳定性较差,但是由于有训练数据的介入,其预测趋势往往较好。我们首先提出了一种基于浅层网络的数据驱动方法,然后与经验驱动的方法融合,并在LIVE数据集上验证了其有效性。  第三,提出了一种基于3D卷积神经网络的无参考视频质量评价方法。主流的基于学习的无参考评价方法往往是分段式的,即空域与时域特征分开处理,这就不可避免的导致了时空信息的部分损失,同时也限制了它们的处理速度。鉴于此,我们提出了一种基于3D卷积神经网络的无参考视频质量评价方法,重新设计训练了所采用的3D卷积网络,使得其可以同时处理时域和空域的信息,同时进行端到端的预测,通过在LIVE数据集上的实验,证明了该方法的有效性,同时比主流方法速度提速2到8倍。
其他文献
Patchwork算法是一种典型的空域水印嵌入方法.目前也有人尝试将这一办法应用于变换域中,但是有关文献很少.特别是在将其与音频水印应用相结合的研究还显得不够.Patchwork算法
该文在参考了各种馈线自动化方案后,阐述了自己对馈线自动化的理解,在比较和参照了国内外同类装置的基础上,设计开发了一种以TMS320F206DSP为核心的FTU,相对于传统的基于普通
实时系统需要具备容错功能的观点,已经被实时与容错这两个领域的研究者所广泛认同?而分布处理和分布控制技术显示的广泛应用前景,各种分布的软硬件系统的大量开发使用,加之分
人类通常以创造新概念或拓展旧概念的方式来更新知识体系,维基百科是这个知识体系中最具代表性的缩影和镜像之一。近年来的研究发现,在不断演化的知识库中蕴含着有价值的概念关
随着信息技术的快速发展,海量的信息在满足人们信息需求的同时,也为快速准确地定位相关信息带来了空前的挑战,而信息检索技术的提出正是为了解决这一问题。信息检索的任务是根据
利用面向对象的技术设计、构建银行应用系统架构是满足银行发展转变的关键.该文利用UML和UP的结合,从需求、分析和设计逐层深入,揭示面向对象的银行系统框架.该文重点设计银
提出建立酸轧机组人工神经网络系统的必要性.建立该系统可以将实际生产过程中的模型系数的精度提高,进而改进酸轧工艺,最终提高酸轧的质量和效率.简要介绍了1420酸轧机组中的
业务需求的频繁变更和用户对软件质量的高要求,使快速持续、高质量的实现软件应用交付成为项目开发的主要目标。但是由于软件项目复杂度的不断增加,在具体的开发活动中,各团队成
主题模型是近年来比较流行的数据挖掘方法,可以有效地提取文本或图像中潜在的语义结构信息,已经被广泛地应用于自然语言处理、社交网络分析、图像处理等领域。随着Web2.0时代的
随着铁路运输的发展,运输生产指挥系统对铁路移动通信提出了更高的要求,以满足运输指挥系统对列车移动体进行管理和控制的需要.传统的单一功能的无线列调系统已经不能满足铁