图像视频中显著性、对象性和动作性检测关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：greatspy_52

【摘要】

：

近年来认知心理学和神经生物学的研究表明，人类在识别物体所属的具体类别之前，可以对其进行快速的理解。同时，选择性注意理论也表明视觉系统主要负责处理图像中的部分重要细节，而

【作者】

：

黄绍

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2017年期

【关键词】

：

图像视频显著性检测对象性检测动作性检测相似性度量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来认知心理学和神经生物学的研究表明，人类在识别物体所属的具体类别之前，可以对其进行快速的理解。同时，选择性注意理论也表明视觉系统主要负责处理图像中的部分重要细节，而忽略其余部分。以上发现促进了我们工作的开展，我们通过图像视频中显著性、对象性和动作性检测关键技术研究，以探索人类对于图像视频的主观认知机制，大量实验表明该工作取得国际领先的结果。本文的主要贡献如下:　　第一，从人类认知角度来看，显著性是指在图像中特定区域相对于其周围区域更为突出的状态或性质。近年来，大量研究者参与显著性检测的研究，并取得了令人瞩目的进展。另一方面，得益于拍摄设备和通讯网络的便捷性，海量图像被创建，传输和存储，使得准确有效地检索图像成为了当前的研究热点。我们发现人类主要基于显著区域来判定图像之间的相似性，从而提出将显著性检测与图像匹配相结合，使得检索结果与基于低层特征的传统方法相比，更为符合人类的主观感受。为了实现该目标，我们首先提出采用不同方案来形式化中心-周围假设，如基于重建残差的模型;然后基于得到的显著性图计算图像中的显著区域;最后根据显著区域的信息，采用完整区域匹配或者图匹配以度量图像间的相似性。在国际公开数据集上进行的实验表明，该方法在显著性检测和图像匹配两方面均取得令人满意的结果。　　第二，与显著性反映人类关注区域相类似，对象性表示图像中特定区域包含任意普遍性对象的可能性。显著性与对象性中存在紧密的内在联系，大量研究工作表明对象性检测可以用于显著物体提取，以得到更为准确的结果。对象性检测中的候选区域被称为对象建议，它们相互之间可以重叠，以确保图像中所有对象都能被准确检测。通过快速得到少量的对象建议，可以有效地摒弃传统对象检测识别方法中采用的穷举搜索策略，从而提高对象检测识别的效率和准确率。与传统基于彩色图像的方法不同，我们提出基于立体视觉的对象性检测，以更好应对复杂场景。我们首先利用色彩和深度信息，通过自适应变换得到与对象边界吻合的候选;然后提出由聚类层和候选层构成的层次化结构，以高效地组织所有候选;接下来提出三个立体视觉特征以计算候选的对象性得分;最后提出候选排序策略以得到对象建议。此外，我们构造了包含400对立体图像的数据集，以在室内和室外场景中评估该方法的性能，并为其他研究者提供便利。大量实验表明，该方法在使用不同数目的对象建议时，结果均明显优于目前主流方法。由于立体视觉信息可以看作是对色彩信息的补充，故我们进一步验证该方法可以与目前基于彩色图像的方法相结合，以进一步改善准确率。　　第三，受到在图像中计算对象性的启发，我们提出在视频中计算动作性，即连续视频帧片段中包含任意普遍性动作的可能性，以摒弃传统动作检测识别方法中采用的滑动窗口策略，从而改善动作检测识别的效率和准确率，在该方法中这些候选片段被称为时间动作候选(Temporal Action Proposals，TAPs)。近年来随着头戴式拍摄设备如Google Glass和GoPro的普及，国内外研究者开始探索该类设备所拍摄视频（第一人称视频）在不同场景下的应用，并取得了显著的进展。在该工作中我们主要研究第一人称视频中时间动作候选。我们首先提出根据运动信息将视频切分为动作原子;然后根据四个第一人称特征进行层次化聚类得到所有TAPs，其中为了更准确地检测拍摄者人手，我们提出基于外观和位置信息的区域增长策略;最后提出两类动作性网络（空间动作性网络，时间动作性网络）以计算TAPs的包含普遍性动作的得分，并将得分靠前的TAPs作为输出的对象建议。大量实验结果表明该方法在多个公开数据集取得优异的效率和准确率，并通过实验探讨不同动作性网络结构对于结果的影响。

其他文献

基于动态测距技术的高速公路车辆防撞系统研究

随着公路交通的快速发展,公路交通日益呈现出行驶高速化、车流密集化和驾驶员非职业化的态势,随之产生的,是造成人员伤亡和财产损失的大量交通事故。在高速公路交通事故形态

学位

动态测距高速公路车辆防撞单目视觉测距汽车识别CAN总线

基于Lotus Domino/Notes的办公自动化系统的研究与开发

随着科学技术和社会经济的发展，无论是政府机关还是工商企业对于办公自动化的要求越来越高。办公自动化系统使传统的以手工为主的办公方式和办公手段，向科学化、规范化、高效化

学位

办公自动化系统工作流技术B/S结构模式

基于有向图的数字化装配序列生成和评价研究

在规划数字化产品装配序列中,核心问题有三个:①产品装配模型的建立;②装配序列的求解;③装配序列的评价。本研究结合国内外研究现状和实际情况,对数字化产品装配序列规划中

学位

有向图装配建模序列生成模糊理论仿真分析

磁性目标物探测实验的数据管理与图形交互模拟技术研究

目标物的磁探测技术属于技术敏感领域，国内几乎没有与此直接相关的资料可查。由于目标物探测有其自身的特殊性，从某种方面看，其探测难度更大、要求更高，表现在需要近乎实时的跟踪

学位

数据库测量总场异常三维显示正演模型数据管理图形交互

自动识别算量系统VHRecQs的设计与实现

信息技术在建筑领域的应用主要集中于办公自动化、工程图设计等基础应用，在建筑流程中同样占有重要地位的审图、预算和施工阶段，计算机应用的层次还停留在比较低级的水平，计算机

学位

自动识别算量系统计算机读图算量自动识别三维结构重建建筑流程

基于HL7标准的中间件技术及其在PACS中的应用研究

医院数字化是信息化浪潮的必然趋势,当前,医院数字化过程中面临着一些急待解决的难题:信息系统集成度不高、信息的利用率不高、标准化较差等。PACS(Picture Archiving and Co

学位

医院数字化PACS系统HL7标准中间件技术

基于GPS/GIS/GSM的嵌入式报警系统研究

随着嵌入式技术、通信技术的迅猛发展和人们安全意识的日渐提高,利用嵌入式系统及其他外围芯片实现报警系统已成为可能,而且是一种发展趋势.本课题是利用当今世界最先进的卫

学位

GPSGSMGIS嵌入式报警

基于版权保护的数字内容安全安交易系统的研究与实现

随着网络和电子商务的发展,网上传播的数字内容存在着大量的盗版和侵权问题,因此对网上交易的数字内容进行版权保护,成为一个迫切需要解决的问题。但现在的数字版权保护技术

学位

数字版权安全交易安全容器版权保护身份认证

面向高维数据的聚类算法研究

该文提出一种可适用于高维数据空间的相似度和密度的度量方法(实际上它可以适用于任何维度的数据).与传统的直接采用两个数据对象之间的距离(或其它系数)来定义其相似度的做

学位

数据挖掘聚类分析维度效应相似度共享最近邻高维数据

公路工程项目管理平台的设计与实现

当今，随着Internet的快速发展，web技术凭借其实时的信息发布、动态的用户交互以及与后台系统灵活的安全连接等优点得到了广泛应用。与此同时，面向web应用程序开发的技术也得到了

学位

公路工程项目管理平台web应用程序服务器端J2EE技术

图像视频中显著性、对象性和动作性检测关键技术研究

其他学术论文