论文部分内容阅读
随着现代通信和多媒体技术的迅猛发展,网络上数字图像的数量出现了急剧增长,如何从海量的数字图像中快速而有效地找到人们所需要的图像,是一个非常有理论价值和实际意义的研究课题。为缩小图像底层特征与高层语义之间的语义鸿沟,如何将图像底层特征与图像的语义视觉关键词相结合进行图像自动标注,以及如何利用学习的图像标签进行高效的图像检索,成为新的研究热点。本文研究属性的学习以及基于属性的图像检索方法,围绕着三个问题开展了相关的研究工作,创新成果如下:
(1)针对相对属性学习中局部特征表示的准确性问题,本文提出一种基于属性相关局部区域的深度相对属性学习方法。由于很多属性是面向局部的,属性相关的局部特征表示较全局特征表示更能表征属性变化,本文通过改进属性空间范围发现方法,以提高局部定位的准确性。此外,深度学习的特征较手工设计的特征更具识别力,本文通过串接从深度网络提取的中间层局部特征和高层全局特征来获得更准确的特征表示。在公开的图像数据集上进行了实验,实验结果验证了上述方法的有效性,并提高了相对属性学习性能。
(2)针对基于二进制属性的图像检索结果中所含查询属性强度的无序性问题,本文提出一种基于分组属性强度的图像检索方法。原来的基于二进制属性的图像检索方法最先检索到的图像,其属性强度往往参差不齐,导致检索结果无法满足用户需求。通过结合二进制属性和相对属性来学习分组属性强度,在粗粒度的检索过程中融入细粒度的元素,使得先检索到的图像具有更强的属性强度。在公开的图像数据集上进行了实验,所得检索结果更符合用户预期目标,较原有的基于二进制属性的图像检索方法具有更好的检索性能。
(3)针对扩展属性学习中语义关系度量的精确性问题,本文提出一种基于网络搜索量的扩展属性图像检索方法。该方法通过结合两种外部语言库共同构建候选扩展属性集,并且根据网络数据可以直接反应用户对属性词的使用量和熟悉度,利用从网络上获得的数据信息来度量用户偏好,以剔除候选集中不常用的项,得到最终的扩展属性集。用户通过该方法进行图像检索时,查询属性的范围不仅包括预标签属性,还包括扩展属性。此外,本文还提出一种一致性度量方法来粗略地验证所学习的扩展属性的可靠性。实验结果表明,所提方法在一定程度上提高了用户查询输入的自由度和图像检索性能。
(1)针对相对属性学习中局部特征表示的准确性问题,本文提出一种基于属性相关局部区域的深度相对属性学习方法。由于很多属性是面向局部的,属性相关的局部特征表示较全局特征表示更能表征属性变化,本文通过改进属性空间范围发现方法,以提高局部定位的准确性。此外,深度学习的特征较手工设计的特征更具识别力,本文通过串接从深度网络提取的中间层局部特征和高层全局特征来获得更准确的特征表示。在公开的图像数据集上进行了实验,实验结果验证了上述方法的有效性,并提高了相对属性学习性能。
(2)针对基于二进制属性的图像检索结果中所含查询属性强度的无序性问题,本文提出一种基于分组属性强度的图像检索方法。原来的基于二进制属性的图像检索方法最先检索到的图像,其属性强度往往参差不齐,导致检索结果无法满足用户需求。通过结合二进制属性和相对属性来学习分组属性强度,在粗粒度的检索过程中融入细粒度的元素,使得先检索到的图像具有更强的属性强度。在公开的图像数据集上进行了实验,所得检索结果更符合用户预期目标,较原有的基于二进制属性的图像检索方法具有更好的检索性能。
(3)针对扩展属性学习中语义关系度量的精确性问题,本文提出一种基于网络搜索量的扩展属性图像检索方法。该方法通过结合两种外部语言库共同构建候选扩展属性集,并且根据网络数据可以直接反应用户对属性词的使用量和熟悉度,利用从网络上获得的数据信息来度量用户偏好,以剔除候选集中不常用的项,得到最终的扩展属性集。用户通过该方法进行图像检索时,查询属性的范围不仅包括预标签属性,还包括扩展属性。此外,本文还提出一种一致性度量方法来粗略地验证所学习的扩展属性的可靠性。实验结果表明,所提方法在一定程度上提高了用户查询输入的自由度和图像检索性能。