论文部分内容阅读
近些年随着数码设备的普及,大量的图像媒介出现在互联网及我们的日常生活中。有效且快速地理解这些图像的内容,已然成为一种高度迫切的需求。视觉显著性是人类的基本视觉机制之一,能够快速地从看到的图像中选取关键区域并对其重点处理。在图像理解方面,显著性信息扮演着很重要的角色,它可以有效帮助图像分类、物体识别和基于内容的图像检索等。正因为如此,显著性信息检测成为计算机视觉领域的热点研究方向之一,吸引了许多视觉研究者的关注。在本论文中,我们重点关注其中的显著性物体检测,即识别出图像中含有显著性物体的区域。同时,探索了显著性在基于内容的图像检索上的应用。 本文围绕显著性物体检测及其应用,以随机森林算法为主要工具,研究了单张图像中的显著性物体检测及数百张图像中的共显著性物体的检测。目前主要的检测方法主要依赖区域的稀有性或区域之间对比度的强弱,很少考虑到图像中显著性物体的边缘。我们提出了从物体边缘的角度来检测图像中的显著性物体,同时初步研究了怎样把显著性用于物体图像的检索。其中,大部分的工作都是基于随机森林算法展开的。本文的主要研究成果如下: 1)提出了一种新的单张图像中显著性物体检测模型。这个模型是基于随机森林的。首先根据图像块落在森林中的叶子结点的大小,我们能够计算出图像的稀有性图,采用一个主动轮廓模型从中检测出物体的粗糙轮廓。然后通过轮廓内外的图像块相似性计算出显著性图。这个模型不仅能够较好地检测一张图像中的单个显著性物体,也能很好检测图像含有的两个显著性物体。在两个图像集上的实验结果显示,我们的方法的检测效果可比于或超过了当前最新方法的性能。 2)扩展了单张图像中显著性物体检测模型,用于检测几百张图像中的共显著性物体。以前的方法一般只能检测数十张图像中的共显著性物体,很难扩展到较大规模的图像集。我们借用分组的思想,把大的图像集分割成若干个只含有数张图像的图像组,分别在每个图像组内检测共有物体。对一张图像来说,我们搜集出含有这张图像的那些组,把组里面对应于它的显著性图融合在一起,从而得到这张图像的间显著性图。我们结合这张图像自身的显著性和它的间显著性图,最终实现了较大规模图像集的共显著性物体检测。在三个分别含有数百张图像的集合上的实验结果表明,我们的方法可以较好地检测出一个图像集中的共显著性物体,同时有效地压制了背景和其它物体。 3)提出一个显著性在物体图像检索方面的应用方案。为了更快地检索图像,我们首先提出了一种灵活的哈希码编码算法。这个算法是通过随机森林构造出来的,它能够高效地计算图像特征间的相似性,且占用更少的内存空间。另外,当我们对不同的特征构建随机森林时,若使用相同数目的树,则可以保证每种特征计算出的相似性在一个度量尺度上。在这个算法的基础上,我们提出了一种把显著性用于图像检索的方法。根据输入的查询图像的显著性,对依据我们的哈希编码算法计算出的局部和整体特征的相似性施加不同的权重,实现了高效的物体图像检索,同时提升了检索的准确率。在两个物体图像集上的检索实验表明,我们的方案可以获得更好、更快的检索结果。