论文部分内容阅读
细分类问题是指对属于同一个基本类别的物体进行分类,例如区分不同类别的鸟。由于背景中很少包含可用于区分细致类别的特征,所以能否精确分割前景物体在细分类中至关重要。同时,在同一个基本类别中的物体整体外观特征比较相似,例如鸟类都有眼睛、翅膀、腿等部位并且有着相似的身体结构,因此区分不同这些物体的关键在于找到物体部件上细微的差异。 本文提出一种基于形状先验信息的分割方法用来解决细分类问题。首先,对于一幅测试图像,我们基于边缘图像信息检索到一个和该图像中物体形状最相似的训练图像集合作为候选集。接下来,我们利用候选集合中的每一幅图像标注好的分割信息来对测试图像像素的前背景分布进行估计,从而学习到形状先验模型。然后,我们定义了一个能量函数来度量前背景错分的代价。该能量函数将之前学习到的形状先验模型和GrabCut算法中的颜色模型进行结合。最后,我们通过最小化该能量函数得到一个高质量的分割结果。 本文还提出一种基于两阶段检索的物体部件定位方法。我们的方法包含两个图像检索的阶段,第一个阶段进行分割,第二个阶段定位物体部件。此外,我们还提出了一种利用分割结果校正部件定位的方法。在细分类领域中,传统的基于深度学习的部件定位方法是将物体分为头部和身体两个部件,我们提出一种能够定位物体多个小部件的方法,并应用到细分类任务中。我们提出一种方法可以生成足够多的小部件的候选检测区域,然后利用深度网络结构在这些候选检测区域中找出小部件的定位结果 本文在细分类领域著名的鸟类数据集Caltech-UCSD Birds200-2011上进行了实验,前景分割、部件定位以及最终的分类结果均优于同类工作。