论文部分内容阅读
显著目标检测旨在通过设计智能算法,使得计算机具有模仿人类视觉注意机制的能力,从而自动获取图像中最吸引人眼注意的目标或区域。作为预处理技术用于降低数据处理成本和计算时间,显著目标检测广泛应用于图像分割、图像融合、图像恢复等其他计算机视觉和机器学习的任务中,具有重要的理论研究意义和社会应用价值。目前,简单场景下(比如单一显著目标处于图像中心、背景简单、前景与背景对比度高)的图像显著目标检测性能已经接近于人眼的水平,但是,复杂场景下(比如显著目标靠近图像边界、背景复杂、前景与背景对比度低、场景语义信息丰富等)的显著目标检测仍是个亟待解决的难题。本文针对已有图像显著目标检测方法存在的问题,基于稀疏表示、图论、深度学习等理论,提出了多种算法,用于完整、一致地检测复杂场景下的显著目标。具体研究内容如下:第一,提出了一种基于鲁棒稀疏表示与局部一致性的显著目标检测算法。已有基于稀疏表示的显著目标检测方法采用均方误差表示显著目标,对非高斯噪声具有较强的敏感性。与之不同,我们将显著目标看成稀疏的“野点”,采用稀疏误差表征稀疏“野点”,从而将显著目标检测问题转换为稀疏追踪问题,实现首次将鲁棒稀疏表示应用于显著目标检测。同时,采用拉普拉斯正则项,对局部邻域内超像素的表示系数和重构误差约束一致性,从而将局部一致性嵌入到鲁棒稀疏表示模型中,提高了显著图的平滑性。与基于传统稀疏表示的显著目标检测方法相比,提出算法增强了显著目标的表征能力和显著图的一致性。第二,提出了一种基于二阶段图的显著目标检测算法。上述基于鲁棒稀疏表示与局部一致性的显著目标检测方法仅仅考虑了当前超像素与其邻域超像素的局部相关性,对显著目标一致性的描述有一定的局限性。为了解决这个问题,我们采用图论解决显著目标检测问题。已有基于图论的显著目标检测方法仅考虑邻域空间一致性构建单一图。与此不同,我们以粗略到精细的方式,在两个阶段设计了两个不同的图。在第一阶段,根据邻域空间一致性将图像构建为图,并提出一种加权联合鲁棒稀疏表示模型,用于计算各个节点的显著值。在第二阶段,根据第一阶段图的粗略检测结果,确定潜在前景节点、潜在背景节点,将任意两个潜在前景/背景节点相互连接,从而构建区域空间一致性;联合邻域空间一致性和区域空间一致性将图像构建为精细图,用于获取更加精确的显著图。与已有基于图论的显著目标检测方法相比,提出算法增强了前景与背景之间的对比度、前景一致性和背景一致性,提高了显著图的一致性。第三,提出了一种基于上下文信息指导的深度显著目标检测算法。近年来,由于深度学习网络具有强大的特征表示能力,其已成功应用于显著目标检测,并突破了传统基于人工特征的方法的性能瓶颈。已有基于深度学习的显著目标检测方法通过多层网络的特征图级联或输出结果加和,用于多层深度信息的融合,该方式存在局限性。与之不同,我们提出了一种上下文信息指导策略,采用深层输出结果指导浅层特征图。一方面,在深层输出结果的指导下,浅层网络能够学习更加精确的显著特征;另一方面,在浅层网络特征的帮助下,深层输出结果在提高分辨率的同时,增加细节信息。同时,我们还提出了一种组卷积模块,用于学习具有更高鉴别性的特征图。最后,将组卷积嵌入到指导策略中,进一步提高了深层输出结果的指导作用。与已有基于多层深度信息融合的显著目标检测方法相比,提出算法能够更加充分地利用特征图与输出结果两种深度信息,提升了显著目标的定位精确性、分割完整性和一致性。第四,提出了一种基于二分流部分-目标匹配的深度显著目标检测算法。已有基于深度学习的显著目标检测方法大多独立计算图像各个部分的显著性,容易引起显著目标分割不完整/不一致的问题。为此,我们将部分-目标关系的特性引入到显著目标检测领域,即认为显著目标一般由几个相关的部分组成,而几个相关的部分可以组成一个完整的目标。通过采用胶囊网络解析图像中部分-目标关系,用于检测显著目标,实现了首次将胶囊网络用于显著目标检测。同时,我们提出了一种二分流策略,将输入胶囊分组后输入到两个完全一样的分流内,每个分流均采用胶囊网络解析部分-目标关系。该策略不仅降低了网络参数量和计算复杂度,还从一定程度上缓解了胶囊匹配的冗余性。与已有基于深度学习的显著目标检测方法相比,提出算法可以有效解决显著目标检测不完整/不一致的问题。通过在多个公共数据集上的客观评价和主观图评价,充分验证了以上提出的四种显著目标检测算法的有效性和优越性。