基于结构模型的物体检测

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：guigui1987

【摘要】

：

物体检测是从图片或者视频中判断“什么物体在什么地方”的计算机视觉问题。长久以来，物体检测被认为是计算机视觉高层语义分析中的核心问题，也是其他诸多应用问题的基础，如图片

【作者】

：

闫俊杰

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

物体检测技术形变部件模型超像素标注结构学习深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

物体检测是从图片或者视频中判断“什么物体在什么地方”的计算机视觉问题。长久以来，物体检测被认为是计算机视觉高层语义分析中的核心问题，也是其他诸多应用问题的基础，如图片搜索、人脸识别、目标跟踪以及行为识别等。物体检测技术的研究也极大促进了中、底层计算机视觉技术的发展。考虑到真实世界中的三维物体投影到图像或者视频带来的信息损失和传感器引入的系统误差、随机误差，以及物体本身的类别、视角、形变、光照、遮挡等各种因素造成的物体表象变化，物体检测是一个极富挑战的研究课题。与数据采集和存储、计算资源以及机器学习算法的发展，则为物体检测提供了诸多的方法和机遇。　　形变部件模型是物体检测领域的代表性算法之一。该模型用树形结构连接全局模板与可变部件模板来表征物体，从全局和局部两方面建模物体表象变化。形变部件模型极大地促进了物体检测领域的发展，其衍化出的诸多方法在物体检测基准数据集上取得了很好的效果。本文以形变部件模型为基础，从模型表征、模型学习、模型推断以及检测结果后处理四个方面扩展和完善形变部件模型。此外，结合结构学习与深度学习，本文提出基于超像素标注的物体检测算法。本文的主要工作如下:　　(1)在物体的表征模型方面，把原有的参数模型扩展为非参数模型与参数模型结合的方式，以此来处理更大的物体形变。具体地，提出了基于表象回归的形变部件模型，以及不同表象回归形变部件模型的级联增强。　　(2)在学习算法方面，提出了多任务的部件形变模型方法，来处理检测中不同分布的样本。具体地，首次提出多任务多分辨率模型通过联合学习分辨率相关的特征变换矩阵以及分辨率无关的共享分类器，来解决物体检测中的多分辨率问题。　　(3)在推断算法方面，分析了形变部件模型不同推断算法的速度瓶颈，并从三个方面极大地加速推断速度。具体地，提出了学习鉴别性低秩卷积核，邻域共享的级联以及基于查找表的快速梯度直方图特征计算方式。　　(4)在检测结果后处理方面，提出了建模整张图像上下文的方式来得到更加符合场景一致性的检测结果。具体地，建模拥挤场景中的表象与不同物体之间的空间关系，从而有效地推断被遮挡的物体。　　(5)提出全新的基于超像素标注的物体检测算法。在深度学习得到的表象特征的基础上，通过推断一个描述超像素的表象、超像素的空间关系等因素的能量函数来得到超像素属于某个类别的某个物体，进而得到检测结果。相比于传统方法，该方法可以得到更大的物体候选区域灵活性并且自然地利用图像的全局信息。在完成物体检测的同时，该方法可以进一步输出物体分割结果。　　本文从上述五个方面推动了通用物体检测、行人检测、人脸检测、人脸关键点定位、目标部件定位等方面的发展。在通用物体检测方面，结合深层卷积网络，在ImageNet通用物体检测任务上超越了Google最新研发的GoogLeNet检测系统性能。在人脸关键点定位和目标部件定位方面，取得了300-W人脸关键点定位比赛冠军，在LSP人体姿态估计上取得了领先性能。在行人检测方面，在Caltech行人数据集上比之前最好方法的平均漏检率低11％，在PET2009上取得了5％的性能提升。在保持精度的情况下，实现实时形状部件模型推断算法，并在人脸检测、行人检测等任务中取得了领先性能。

其他文献

京沪高速铁路客流分配模型研究

学位

客流分配广义费用灵敏度分析

变电站综合自动化系统研究与开发

该论文根据变电站综合自动化系统的功能和要求,从变电站自动化系统的体系结构出发来讨论变电站综合自动化系统的可靠性和可维护性,提出并设计了一种单元分布式变电站综合自动

学位

变电站综合自动化分布式单元Lonworks现场控制单元体系结构

集散型多通道数据采集系统

该文根据集散系统的基本原理,以进行农作物科学实验的工程背景,设计了一套集散多通道数据采集系统.该系统采用80C196单片机构成多功能控制器,实现了对光照、湿度、温度等多路

学位

集散型控制系统数据采集系统数据通信单片机系统

基于神经网络的自然语言处理研究

神经网络是模拟人类神经结构和功能的数学模型，它是近年来机器学习领域发展最为迅速的研究方向之一，在一系列人工智能的重要任务中（比如图像识别、语音识别等等），取得了突破性的成

学位

自然语言处理词语相似度词向量情感分析句子分类神经网络

S-10型天象仪控制系统的研究

该论文是课题"新型S10天象仪控制系统设计与实现"的一部分.论文的主要任务是完成控制系统的建模与结构设计、控制系统软件的总体设计与实现,以使新型的天象仪系统能够实现节

学位

控制系统数学模型应用软件天象仪控制系统实时操作系统分布式控制多线程结构

PUMA562机器人的分散预测控制

分散动态矩阵预测控制算法是一个计算得单、跟踪性能和鲁棒性能良好的优化控制算法.作为预测控制理论和实际应用研究的一个发展方向,受到广泛的注意.PUMA562机器介一个具有非

学位

PUMA562机器人分散结构预没控制

面向窄带通信信道的语音质量增强问题研究

在窄带语音通信系统中，一个重要的问题就是如何在复杂环境下充分利用带宽资源对语音信号进行有效的传输和增强处理，以保证语音通信系统中语音信号的话音质量。在实际的通信环境

学位

窄带语音通信系统语音端点检测话音质量单通道语音增强算法语音带宽扩展算法

基于模糊理论的智能综合评判系统的研究

该文概述了人工智能学科的发展历史和最新动态,介绍了一些常用的知识表示方法.通过对模糊综合评判原理的分析,借鉴国内外综合评判的常用方法,提出了智能综合评判的模型.并详

学位

智能综合评判系统模糊理论统计评判表面向对象

MRPⅡ在卷烟生产中的应用与实现

MRPⅡ(制造资源计划)是一种先进的管理思想和方法,是当今世界制造业普遍采用的计算机辅助企业管理系统.该文主要介绍了基于MRPⅡ理论和ORACLE数据库的卷烟厂生产管理信息系统

学位

制造资源计划卷烟生产管理管理信息系统数据库应用系统

液位线性系统实验装置的智能化改造

该论文阐述了液位线性系统实验装置的改造过程,主要包括控制理论的应用研究和软件开发两个方面.文中先描述了实验装置的数学模型和实际特性;然后详细阐述了常规PID控制、辩识

学位

PID控制辨识自校正控制面向对象方法

基于结构模型的物体检测

其他学术论文