论文部分内容阅读
伴随着多媒体技术的快速发展,视频相关的应用也得到了越来越广泛的普及。其中,视频质量评价和编码在视频处理过程中扮演着非常重要的角色,相关研究在近年也逐渐成为广受关注的热点问题。
实现视频质量评价的一种直接方式,是通过人眼主观测试来完成。然而,这种测试过程要求在较为严格的测试条件下进行,难以避免人力等资源消耗,需要较大的成本代价。而传统的客观失真度量方法与人类视觉感知机制是有偏离的。为了达到客观评价结果与主观观测更好的一致性,通过对人类视觉生理和心理机制的建模,人类视觉系统被引入这一领域的研究当中。但是,大部分现有方法对影响视觉感知的因素仍考虑的不够全面,而部分模拟视觉机制的方案又过于复杂,以致不能满足实时应用系统的要求。
数字视频编码和压缩过程的实现基于原始视频中存在大量的冗余信息,信息论给出了无损压缩所能达到的上限,而率失真技术提供了一种手段从而达到失真与码率之间的优化平衡。越来越多的研究也开始关注这一领域,探索潜在的码率降低空间,这就要求深入探讨心理视觉冗余的相关问题,从而实现在保证主观视觉质量不变的前提下,进一步降低编码码率。考虑到目前对人类视觉系统本身所具有的复杂性仍缺乏全面的理解和认知,引入感知机制的视觉处理方法尚存在更为深入的改进需求和空间。
本文的主要研究工作列举如下:
1.视觉关注是人类视觉系统中一项极为重要的特征,本文提出一种面向运动视频图像的显著性检测方法。该方法采用图像四元傅立叶变换方法获取频域相位谱,来重建对应图像的空域显著图。针对大部分已有视频显著性检测是基于对静止图像处理方法发展而来,缺乏对时域信息的视觉关注等问题,这里通过使用运动向量对这种由运动产生的视觉关注建模,充分考虑视频内容亮度、颜色和运动信息,达到了预期的检测效果。同计算机视觉领域其它显著性分析模型相比,该方法不依赖于先验知识、参数选择,并且快速有效。
2.提出一种基于视觉关注度分析的视频质量评价方法SDTW-SSIM(saliency anddistortion weighted structural similarity index with temporal pooling strategy)。该模型中,通过参考视频获取时域和空域的显著性信息,考虑到视频压缩失真对视觉关注的影响,这里还加入了待观测视频的区域失真因素。为了更好呈现视频观测属性,同时引入帧层和视频序列层级的显著性分析,从而使得视频质量评价方法的评价结果与主观观测更趋一致,克服了传统客观视频质量评价方法与主观感知差异的鸿沟。基于广泛使用的视频质量评价数据库上所做的实验结果表明,与诸多已有方法相比,本文所提出的算法取得了对主观评价值更相近的预测,并且有效降低了计算时间代价。
3.建立一种可更好呈现人类视觉关注机制的编码策略。为克服传统率失真优化过程对主观视觉失真程度考虑不足的缺陷,该方法将视觉感知相关的视频质量评价算法和显著性检测方法引入H.264/AVC视频编码的率失真优化过程,其中,失真代价度量部分由新算法取代,并将显著性权重作为率失真代价函数中Lagrange multiplier系数的调节因子。由此,该过程可以更合理地分配比特资源,从而在编码结果的视觉失真和码率上达到平衡,并且,新方案实际引入的计算复杂度较低,保证了新机制下编码过程的实时效率。