视觉场景中的前景目标发现与分割算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:nathon_zhwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数码相机,可拍照智能手机等硬件的大规模普及,以及微信,微博等互联网社交媒介的爆发式发展,互联网上的每天以惊人的速度增加的图像及视频数据量带来了巨大的挑战。一般而言,可通过提取输入图像寻找用户所感兴趣的内容,传统的基于单张图像的前景目标提取方法难以满足现有视觉处理系统的需求,因此,学者们在多张图像和视频的基础上提出了协同显著性检测和协同分割的方法。这些方法能够充分利用不同图像间前景目标的相似性,因此节省了大部分操作的时间。然而,传统的方法主要通过对底层的视觉特征进行操作,忽略了图像数据集层面所蕴含的语义信息。  本文根据基于视觉场景的前景目标发现与分割算法的特性和需求,针对不同视觉场景下多种前景目标提出解决方案,所研究的内容主要包括特征提取,显著性检测和前景目标分割。主要研究内容概括如下:  首先,对基于视觉场景的前景目标发现与分割算法相关技术进行概述,围绕特征提取,图像显著性检测和图像前景分割三个关键问题介绍各种视觉场景和多种前景目标提取相关技术,对现有的方法和技术进行了回顾和分析,并对容易混淆的术语进行定义。  其次,传统的显著性区域检测方法对低层的视觉特征进行计算,在视频显著性区域检测中,这类方法忽视了物体的运动,导致对目标物体的错误检测。本文针对这种弊病,提出了基于多层次时空能量模型的视频显著性区域检测方法,通过在输入视频的全局进行检测,提高了对运动物体估计的准确率。  再次,针对传统的图像前景分割方法一般需要用户提供交互,本文提出一种基于非刚性变换对多张输入图像进行协同分割的方法。该方法首先使用局部可变形模型检测图像中可能成为前景的区域,然后通过非刚性变换和转移学习的方法将训练图像中的前景目标投影至测试图像中的相似部分,构成测试图像中的目前景目标。本文提出的方法不需要人工交互,且能够同时处理多张输入图像中的前景。  最后,本文突破了现有的协同分割方法主要面向包含前景目标的输入图像,难以处理不包含前景目标的图像的瓶颈,提出基于视觉关注度的噪声图像过滤及协同分割方法。此方法使用深度卷积神经网络训练多个物体种类的分类器,对输入图像的语义信息进行统计并根据统计结果过滤噪声图像;与此同时,此方法将过滤后的输入图像聚为多个子类,在多个子类上建立形状先验引导协同分割,在提高处理速度的同时保证了分割结果的准确。
其他文献
  企业级应用系统已广泛应用到现代社会的各行各业,随着企业信息化程度的提高,企业级应用系统开发质量和效率与企业的发展紧密的关联起来。构件技术和.NET环境的出现为解决这
"二00七年以来,郭敬明、张悦然等一批深受中国青少年喜爱的‘八0后’作家纷纷加入中国作家协会,引发社会各界热议。对此,正在参加中国作协七届三 Since 2007, a group of 80
近期河南省夏邑县李集镇有两万亩大白菜等待销售,于是有媒体记者前去采访,并发出了“夏邑李集2万亩大白菜急寻销路”的消息。由于记者在报道中对信息把握得不够准确和全面,导
目的 探讨老年冠心病患者血清一氧化氮 ( NO) 、可溶性细胞间黏附分子 -1 ( sICAM-1) 、可溶性血管内皮细胞黏附分子-1 ( sVCAM-1) 、脂联素、生长分化因子-15 ( GDF-15) 的
软件演化己成为软件生存周期中最重要的形态之一,进入了软件的各个领域,成为了今天软件工程研究的热点领域。软件演化的过程表现出了明显不同于传统软件过程的特征。因此,对支持
航天型号软件的应用领域及运行环境复杂并且特殊,软件一旦出现问题会导致非常严重的后果,因此型号软件在型号的全生命周期都要具备高可靠性,高可靠性必须要通过充分检验测试,而传
新疆维吾尔自治区是一个以维吾尔、哈萨克、柯尔克孜等少数民族为主体的多民族地区,总人口达到1800多万,其中少数民族人口有1100多万。少数民族语言,特别是维哈柯语在人民日常生
家庭网关是用户驻地网络的关键设备之一。本文以这种用户驻地网络方案为背景,在家庭网关的设计和实现的基础上,研究了家庭网关中服务质量保证方面的相关问题,本文的主要贡献和创
学位
共产党员乌广明原是北京量具刃具厂一名电工,今年74岁了。退休后,到西城金融街街道二龙路社区报到的第二天,他就走进了制冷工艺技术学校的课堂。老马为什么刚刚退休又走进学
希望,我依然是我rn现在很多人会把主持人当作是艺人,或者冠以明星的称呼.但在伊一看来,主持人仅仅是一份职业,自己扮演着主持人这个角色,目的很明确:为节目服务,把导演的意图
期刊