论文部分内容阅读
图像分割作为计算机视觉领域一个基础而又重要的问题,得到了研究者们广泛而深入的研究。精确的图像分割结果对于计算机视觉中诸多高层任务十分重要,比如图像内容理解、自动驾驶以及机器人技术等等。然而,在实际研究中,由于自然图像场景彼此之间千差万别,并且所包含的目标之间亦存在着如类别、姿态、形状、尺度等巨大的差异,从而使得对其进行准确地分割变得十分困难。本文结合活动轮廓、子空间聚类、深度学习等理论提出了若干新的自然图像分割算法,主要的研究成果包括以下几个方面:(1)提出了一种基于非一致性因子的活动轮廓模型分割算法。传统的活动轮廓模型在自然图像上的分割性能难以得到提升,主要原因在于自然图像中包含丰富的颜色、亮度、纹理等变化。这些变化使得目标内部的像素点彼此之间是非一致的,并且这种非一致的信息并非外界因素造成的而是目标自身所固有的。为此,本文使用像素非一致性因子来刻画这样一种信息,并将其嵌入至活动轮廓模型中,提出了一种基于非一致性因子活动轮廓模型的分割算法。同时,本文还提出了一种基于显著性技术标定活动轮廓模型初始轮廓的方法,此方法使用图像的显著性检测结果可以自动地给出模型演化的初始轮廓,从而提高了目标分割算法的效率。在多个图像分割数据库上的实验验证了该方法的有效性。(2)利用传统图像分割算法的结果,本文提出了一种基于结构低秩表示学习的图像分割算法。大多数传统的图像分割算法将目标分割成若干一致的分割区域。通过观察发现,这些分割区域中的超像素之间具有相关性,即它们彼此属于同一个目标并且拥有低秩的结构。基于此信息,本文提出一种基于多种分割算法结果的相似性矩阵学习算法,并基于此相似性矩阵得到最后的分割结果。在多个图像分割数据库上的实验表明该算法的有效性。(3)本文提出了一种双稀疏重构的图像分割算法。现有的图像目标提取算法主要有两个方向:第一,图像的似物性采样,该方法趋于提取若干覆盖目标的区域,采样结果彼此之间有着很大不同。第二,目标检测的方法是通过包围盒的方式将目标提取出来,但是这类方法中也将包含许多背景的信息。对于这两种方法,通过观察可以发现:1)由许多采样覆盖的区域大多数来自于同一个目标,所以可以用这些构建目标的先验;2)包围盒外部的区域很大概率来自于图像背景,所以可以用这些构建背景的先验。基于这两个观察,本文利用目标的包围盒信息提出一种双稀疏重构的图像分割算法。在两个提供包围盒先验的图像分割数据库上的实验表明了该算法的有效性。(4)本文提出了一种基于非监督鉴别形状的图像分割算法。基于图像似物性采样的信息,深度卷积神经网络算法能够将其分到不同的类别中。然而,被分到同一类别的采样大多数对目标有过采样和欠采样的情况。为了处理这个问题,本文提出了一种非监督鉴别聚类的方法将与目标重合度较高的采样区域进行聚类并构建出目标的非监督鉴别形状。将所得到的形状信息融入到能量最小化函数最终生成针对不同类的前景目标分割结果。在四个图像分割数据库上的实验表明了该算法的有效性。