基于视觉注意力的卷积神经网络在动态场景下的显著目标检测

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lvy1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动态场景下的显著目标检测是机器视觉领域一个很有前景的研究方向,其目的是模拟人类视觉注意力机制的工作方式,从大量场景数据中快速筛选出最感兴趣的视觉信息。动态的显著目标检测任务通常面临着三大挑战,一是显著特征的定义和提取,以Itti-Koch算法为代表的传统方法过分依赖于手工设计的特征,且计算框架复杂低效。近年来卷积神经网络算法的崛起为特征提取和表示提供了新思路,即用监督学习和优化方法获取表征能力更强的抽象特征。二是动态场景下模型的运行速度,传统的方法为了得到多种显著特征,往往会串行执行多次像素级的计算操作,导致难以兼顾模型准确性和快速性。三是自上而下的注意力监督,传统的方法大多利用自下而上的低级特征,比如颜色、亮度和方向等来进行显著性检测,很难模仿人在有任务监督的情况对显著目标的检测。本文针对上述的三个挑战展开研究,主要的工作包括:首先,我们引入了在图片语义分割任务中表现很好的U-Net卷积网络,将其改良后用于显著目标检测,并优化原本的训练方法,得到一个端到端的轻量级检测模型。同时,我们采用了改进的全连接条件随机场(DenseCRF)算法对U-Net输出的显著图进行优化。其次,本文引入了一个基于自上而下视觉注意力的显著性检测方法,利用为物体分类任务训练的卷积网络,得到输入图片在指定卷积层中对某一指定类别物体的类别激活图,将其与该层输入图片的特征可视化图融合,得到一幅注意力图。将注意力图插值到原图大小并与先前的显著图线性融合成一幅焦点图,表示在有类别注意力监督的情况下各像素的显著性。在生成注意力图时,我们采用了对比抑制的操作,增强了检测指定类别目标的鲁棒性。最后,我们在四个显著性检测图片集SED2、Judd、ECSSD和PASCAL-S上的实验证明了基于改进的U-Net和DenseCRF的显著性检测模型具有全方位超越传统算法,比肩部分最新同类模型的高精度但更轻量级的优势。同时,对DAVIS动态数据集的部分场景和对实际室内外场景的实验说明我们的模型在动态场景下有很好的精度和速度均衡。对基于自上而下注意力监督的显著性检测实验说明了将注意力加入到有类别监督情况下的显著目标检测任务中能够有效地提高检测精度。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的观察唇面牙龈瘤手术围术期快速康复外科(FTS)理念护理的效果。方法随机将接受手术的114例唇面牙龈瘤患者分为2组,各57例。围术期对照组采用常规护理,观察组采用FTS理念护
目的观察系统护理对子宫内膜癌化疗患者焦虑、自尊感及生活质量的影响。方法随机将84例子宫内膜癌化疗患者分为2组,各42例。对照组实施常规护理,观察组行系统性护理。结果施
以10个白杨派无性系为试材进行盆栽试验,通过对比各无性系的盆栽苗在不同质量分数(0、0.1%、0.3%、0.5%和0.7%)NaCl单盐胁迫条件下生长和生理代谢等参数的变化,对白杨派无性系
通过阐述分析医疗器械法规、监管现状和不良事件监测工作状况,揭示出我国在医疗器械不良事件监测管理方面的不足,阐明当前开展医疗器械不良监测管理工作的必要性和迫切性,加
【目的】本文旨在研究湖南省植被变化及其对气候变化的响应,以期为湖南省生态保护提供科学指导依据。【方法】利用2000—2015年SPOT-VGT NDVI、植被类型以及气象数据,辅以最
药品群体不良事件对社会造成的影响和危害重大,尤其需要药品监管部门关注,要求及时发现、及时处理和及时控制,防止药害事件的扩大和蔓延,避免更多的患者受到伤害。为及时有效
目的探讨罗哌卡因复合舒芬太尼硬膜外麻醉应用于老年下肢骨折手术的效果。方法选取2017-05-2019-03间在舞阳县中心医院接受手术的135例老年下肢骨折患者,按不同麻醉方案分为2
随着传媒行业的发展与兴起,新闻领域也在不断的发展升级。而法制新闻报道正是新闻领域中的一个重要分支。长久以来,法治新闻报道都给人一种严肃、刻板的印象,僵化的体制与沉
近几年,随着城市经济的发展,建筑行业的发展速度也在加快,建筑物的结构也呈现出了更加多样化的发展趋势。但是,所有的建筑结构中,框架结构依然是最受人们欢迎的一种。施工人