论文部分内容阅读
伴随着智能手机、平板电脑、掌上电脑等各种多媒体终端设备的快速发展与普及,视频资源的数量呈现出爆炸式增长的趋势。但是,受限于视频采集与传输过程中的一些客观条件,最终呈现在用户面前的视频往往都伴随着不同程度的失真。视频质量评价在诸如视频增强、视频压缩与重建、视频水印添加等视频处理应用中都起着非常重要的作用。视频质量评价根据评价主体的不同可以分为主观评价和客观评价。客观评价根据使用原始参考视频的多少又可以划分为全参考、半参考和无参考方法。本文主要围绕无参考评价方法展开了研究,主要工作包括: 第一,提出了一种基于韦伯定律的多回归无参考视频质量评价方法。传统的无参考视频质量评价方法大多是基于统计分析的,大部分使用手工提取的特征,时域信息考虑的较少,且多是采用单回归模型。这就导致其特征表示能力比较局限,且单回归模型的预测性能也有待提升,这些方法由于大量的手工设计的特征,实时性也较差。基于此,我们在空域信息方面重新训练Alex网络(即Alexnet)来学习表示帧内的质量特征,在时域信息方面设计了一种基于邻帧对应块的低频信息变换统计特征,实验中发现预测规律与韦伯定律相一致,从而促使我们采用多回归模型来进行建模。通过在LIVE数据集和EFPL数据集上的实验证明了我们方法的有效性。 第二,提出了一种经验与数据驱动相融合的无参考视频质量评价方法。无参考评价方法大致可以分为两类,经验驱动(基于先验知识)的方法和数据驱动(基于学习)的方法。前者由于受限于人类有限的经验知识以及视频中失真的复杂性,所以其预测性能并不是很好,但是由于其设计的单一性以及对数据内容普适性,使得其预测结果比较稳定。后者受限于有限的训练数据,致使其预测稳定性较差,但是由于有训练数据的介入,其预测趋势往往较好。我们首先提出了一种基于浅层网络的数据驱动方法,然后与经验驱动的方法融合,并在LIVE数据集上验证了其有效性。 第三,提出了一种基于3D卷积神经网络的无参考视频质量评价方法。主流的基于学习的无参考评价方法往往是分段式的,即空域与时域特征分开处理,这就不可避免的导致了时空信息的部分损失,同时也限制了它们的处理速度。鉴于此,我们提出了一种基于3D卷积神经网络的无参考视频质量评价方法,重新设计训练了所采用的3D卷积网络,使得其可以同时处理时域和空域的信息,同时进行端到端的预测,通过在LIVE数据集上的实验,证明了该方法的有效性,同时比主流方法速度提速2到8倍。