论文部分内容阅读
数字图像承载着生动丰富的视觉信息,在我们的日常生活和工作中扮演着重要角色。近几年,随着大数据时代的到来,面对海量图像数据,在无线网络带宽有限的情况下,如何有效地压缩编码图像并保持语义信息失真最小;另外,在人眼作为图像信息接收者的情况下,如何有效地评估图像的视觉质量,已成为图像处理领域的重要研究问题。如何有效的压缩编码图像以节省码率,是图像处理领域的经典研究课题。传统的图像压缩编码技术,如国际编码标准JPEG和JPEG 2000,关注的是率失真曲线,以给定码率下图像质量失真最小为目的,通常以峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)或者结构相似性准则(Structure Similarity Index Measurement, SSIM)来衡量图像的视觉质量。这些传统的图像编码方法假定压缩图像的信息接收者是人眼视觉系统,但是随着移动视觉检索、目标识别、目标跟踪等图像分析技术的广泛应用,压缩后的图像直接由计算机算法进行分析处理。在这种情况下,设计图像编码算法应该在节省码率的同时保留对图像分析有用的信息,从而保证图像分析任务的性能。对图像视觉质量的衡量牵涉到图像处理领域的一个重要研究课题——图像质量评价,有效的图像质量评价方法可以更好地指导图像编码方法,提升编码效率。现有的图像质量评价方法主要利用图像的底层信号级特征,忽略了图像内容中高层语义信息对衡量视觉质量的影响。针对传统图像编码方法的局限性和现有图像质量评价方法的不足,通过分析图像内容中的语义信息,我们研究了基于语义的图像编码和利用图像语义信息的无参考图像质量评价。论文的主要研究内容和创新点如下:(1)针对移动视觉检索,本文提出了基于显著性分析的语义图像编码方法。通过显著性检测,得到表示图像中各区域重要性程度的显著图。然后采用阈值分割方法,得到包含目标等图像中重要语义信息的显著区域。在编码阶段,采用基于感兴趣区域的编码方法,将码率更多地分配给显著区域,从而更好地保留图像中的语义信息。实验表明,在保证相似检索准确率的情况下,和传统的JPEG 2000编码方法相比,我们提出的编码方法可以节省12.25%乃至17.55%的编码码率。(2)通过引入对图像全局内容中高层语义的理解,本文提出了利用图像语义信息的无参考图像质量评价方法,由全局和局部内容感知来近似模拟人类视觉系统对图像视觉质量的评价过程。我们采用深度卷积神经网络模拟人脑视觉系统对图像全局内容中高层语义信息的抽象理解;根据人眼视觉系统的视觉关注机制和多频率通道特性,利用显著区域选择和Gabor滤波来模拟底层视觉信号的特征提取过程。通过全局和局部特征的综合评估,设计与人的主观感知相一致的图像质量评价方法。