基于分割和部件定位的细分类研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:qzhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细分类问题是指对属于同一个基本类别的物体进行分类,例如区分不同类别的鸟。由于背景中很少包含可用于区分细致类别的特征,所以能否精确分割前景物体在细分类中至关重要。同时,在同一个基本类别中的物体整体外观特征比较相似,例如鸟类都有眼睛、翅膀、腿等部位并且有着相似的身体结构,因此区分不同这些物体的关键在于找到物体部件上细微的差异。  本文提出一种基于形状先验信息的分割方法用来解决细分类问题。首先,对于一幅测试图像,我们基于边缘图像信息检索到一个和该图像中物体形状最相似的训练图像集合作为候选集。接下来,我们利用候选集合中的每一幅图像标注好的分割信息来对测试图像像素的前背景分布进行估计,从而学习到形状先验模型。然后,我们定义了一个能量函数来度量前背景错分的代价。该能量函数将之前学习到的形状先验模型和GrabCut算法中的颜色模型进行结合。最后,我们通过最小化该能量函数得到一个高质量的分割结果。  本文还提出一种基于两阶段检索的物体部件定位方法。我们的方法包含两个图像检索的阶段,第一个阶段进行分割,第二个阶段定位物体部件。此外,我们还提出了一种利用分割结果校正部件定位的方法。在细分类领域中,传统的基于深度学习的部件定位方法是将物体分为头部和身体两个部件,我们提出一种能够定位物体多个小部件的方法,并应用到细分类任务中。我们提出一种方法可以生成足够多的小部件的候选检测区域,然后利用深度网络结构在这些候选检测区域中找出小部件的定位结果  本文在细分类领域著名的鸟类数据集Caltech-UCSD Birds200-2011上进行了实验,前景分割、部件定位以及最终的分类结果均优于同类工作。
其他文献
从计算机软硬件开发的角度上看,如何确保计算机软件与硬件的正确性、可靠性和安全性是科学家们奋斗的终极目标。形式化方法用抽象的模型描绘所研究的系统、用逻辑公式描述所关
单点登录使得用户只需认证一次,即可访问多个关联的应用系统,在提高工作效率、降低系统管理开销、保证安全性等方面发挥的作用已经得到了广泛的认可。随着信息化进程的推进,企业
软件复杂度的增加及多核体系结构的广泛应用,使得通过传统模式检查软件正确与否变得愈加困难。本论文研究了并发程序自动分析与验证的相关理论、技术及工具。本文的工作主要关
复合式火灾探测报警控制系统将业已成熟的感温、感烟等探测技术有机地融为一体,是当今世界范围内火灾探测报警技术领域最受人瞩目的研究方向之一.该论文通过对复合式火灾探测
近年来汽车数量迅速增加,带给人们生活便利的同时,也带来了交通拥堵、环境污染等负面问题。VANET作为智能交通系统的重要组成部分,吸引了许多研究者的目光。由于VANET较高的节点
随着大规模Web应用和极限事务处理需求的不断增长,传统的关系型数据库越来越不能满足人们的需求。因为兼具内存数据库和NoSQL数据库的优点,内存数据网格(In-memory Data Grid)
随着无线互联网技术的发展和移动设备的普及,人们对位置的需求越来越强烈。GPS技术解决了室外定位的问题,却很难应用于室内环境。业界一直没有形成普适的定位方案,室内定位问题
新疆是一个多民族的聚居地,少数民族尤其是维吾尔族在新疆人口中占有很大的比例。在信息互相交融的今天,各民族之间的文化交流日益频繁,如何借助先进的信息技术完成机器翻译、跨
自计算机产生至今,用户界面的设计与开发在软件开发的生命周期中占有非常重要的地位,它的发展经历了批处理界面、命令行界面、图形用户界面(GUI)及自然用户界面(NUI)的过程。随
云存储作为云计算的一个重要领域,通过把存储作为服务提供给外界使用,使得用户不需要建立自己的数据中心,只需要向存储服务提供商申请存储服务,节约了昂贵的软硬件基础设施的投资