基于区域回归的显著性检测

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:liongliong446
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著性检测是指通过模拟人的视觉特征提取图像中的显著区域,是计算机进一步理解和处理图像的重要预处理方式。关于显著性检测的研究已经有很多,但是关于人类视觉系统是如何捕捉到显著性区域尚未有明确的的解释。同时因为大量图像也蕴含着丰富的前后景信息,显著性检测仍然有很大的进步空间。特别是当图像包含一个复杂的场景,如何高效准确地将显著性物体提取出来仍然是一个待解决的问题。随着卷积神经网络的快速发展,显著性检测已经取得了长足的进步。计算机已经不需要提供很多的先验信息,神经网络便能从批量训练数据中提取出显著性这一特征。然而,目前很多基于深度学习的显著性检测方法虽然已经能够准确地找到图像显著性区域,但是它们有时会错误地将非显著性物体误识别为显著性物体,尤其当图像本身具有一个极其复杂的场景。为了解决这一问题,本文提出了一个两阶段的图像显著性检测方法。在第一个阶段,算法应当先尽可能地将显著性区域从原始图像中剥离出来。本文使用一个神经网络以回归包含所有显著性物体的最小显著性区域(RMSR),这个区域将包含所有的显著性物体同时尽可能的移除掉背景。通过它便能很好地解决了复杂场景下的显著性物体定位问题。随后在第二个阶段,为了尽可能多的融合多层次特征,本文提出了一个螺旋共享型神经网络以完成像素级显著性检测,其作用对象是第一阶段提取出来的最小显著性区域。通过这样一个两阶段的算法模型,我们便能够从一张极其复杂的原始图像上准确地提取出显著性物体。通过在一些公开数据集上的实验验证,我们的方法已经达到了世界领先水平。
其他文献
区块链技术是近年来的一个新兴技术与前沿热点,其中区块链隐私保护机制是一个研究热点。传统的区块链只实现了最简单的假名性,不能满足区块链用户日益增长的隐私需求。为了解决这一问题,多种区块链隐私保护机制被提出,比如混币机制、环签名机制、零知识证明机制等。基于环签名的区块链隐私保护机制是其中很重要的一种机制,它通过引入混合地址与真实输入一起形成一个环,然后生成环签名将真实输入隐藏起来。基于环签名的区块链隐
三维人体姿态识别是计算机视觉领域一个非常重要的问题,也是智能人机交互领域的核心技术之一。近年来,人体姿态识别技术发展迅速,二维人体姿态识别准确度不断提升,为三维人体姿态识别提供了新的可能。几何模型在三维计算机视觉领域具有两个主要内涵:其一是相机与成像关系的几何模型,其二是观测目标的几何模型。对于相机视角而言,现有的三维人体姿态数据集相机视角多样性有限,现有方法容易陷入视角耦合的困境,因此需要在流程
随着中国人口老龄化进程的不断加快,老龄患者对医疗的需求正在不断上升,相对应的高龄手术例数也呈逐年上升趋势,虽然当今医疗水平技术飞速发展,手术风险依旧存在。尤其对于高龄患者而言,由于身体素质原因同时伴有大量慢性病,使得手术风险大大增加,对于高龄患者的手术医生往往十分慎重。然而高龄患者对长寿的期望越来越高,想通过手术改善生活质量的意愿也越来越强烈,故在术前做好相应的风险评估显得尤为重要。传统的手术风险
随着人工智能技术的高速发展,人们对自然语言理解、解析和生成的要求也越来越多。而对于四则运算应用题自然语言描述的方法或模型这方面的研究却是少之又少。基于这样的背景条件下,通过研究四则运算应用题文本的特征属性,从中归纳总结出从数字关系到应用题文本自然语言描述的方法或模型,这为本次研究提供了意义。对四则运算应用题文本自动生成方法的研究,主要先从对四则运算表达式开始的,总结出其表达式均由最小单元复合而成。
人脸识别是计算机视觉领域中十分重要的研究方向。人脸特征作为辨识性很高的生物特征,具有非接触式、不易更改、直接等优点,广泛应用于安防、刑侦、电子认证、银行交易等领域中。目前,受限场景下的人脸识别技术发展迅速,在研究和应用上都达到了很好的效果,而随着研究的深入,自然场景下的人脸识别成为了最为广泛且十分重要的需求。受限场景对于采集环境要求较高,自然场景中往往无法满足,其采集的人脸受到多种因素的影响,如表
随着软件开发技术的不断进步,测试验证方法和手段也需要不断完善,常见的负载压力测试已被广泛应用于服务器、Web应用、各类信息系统、网络系统等领域。但是专门针对嵌入式实时操作系统的相应负载压力测试研究还不够广泛和深入。中电32所自主研发的ReWorks嵌入式实时操作系统已被广泛应用于轨道交通、信息系统和工业机器等多种行业中,并被国防军事领域的多型装备所采用,是装备国产化的典型代表。,没有考虑到该操作系
通常软件测试中大部分工作是耗时耗力,其中最代价最高的是错误的定位,而在错误定位上的技术改进能降低测试的工作负荷。目前程序错误定位的方法主要包含基于程序动静态切片,基于程序频谱的语句分析方法等。动态切片由于可以通过分析目标行变量在测试运行过程中的依赖关系,去除不影响目标行变量结果的语句,将关注点转移到相关程序语句以减少考察范围。而基于频谱的软件错误方法(SFL)源于聚类分析中的相似一致性原理,相似性
面部肌肉、神经损伤的患者会出现表情扭曲现象,严重影响了患者的日常生活。对于患者而言,长期定时前往医院进行康复状况检查,需花费大量时间金钱。并且患者面对医生时可能由于紧张、害怕等心理因素导致无法表现出最好的状态,使康复状况评估不够准确。对于医生而言,为病人评估康复状况属于重复性基础工作,占用大量门诊时间,减少接诊病人数量。另外,目前诊疗以医生主观判断为主,尚没有一套客观评价体系能够对病人训练效果进行
人体三维重建作为计算机视觉的一个子领域在最近几年发展迅速,其应用领域也愈发广泛。一方面,这项研究对人们日常生活和工作的方方面面都提供了非常多的帮助。另一方面,这项工作在科研领域也为计算机理解人体三维信息,认知三维世界提供了可能,是未来计算机视觉变革的前沿。为了解决现有的人体三维重建方法存在的耗时长,精度低等问题,本课题在已有的基于深度信息的人体三维点云重建算法的基础上提出了新的基于单目相机的人体稠