基于特征自监督学习与增强的海面目标检测方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:lwyhunter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海洋场景感知是无人艇等海上无人装备有效完成各类既定任务的前提,而目标检测是场景感知与理解领域的基础性任务,提升海面目标检测算法的精度对提升无入水面艇的工作能力意义重大。近年来,基于深度学习的目标检测研究取得了突破性进展,在大规模标准库上取得了较好的检测识别效果。但常用的目标检测数据集中海面目标缺乏,导致目标检测模型在海洋场景中的泛化能力较弱。与此同时,由于海洋环境更加复杂多变,高质量海洋目标样本获取困难,目前可用于海面目标检测研究的数据集规模较小且存在样本分布不均衡的问题,因而基于深度学习的海面目标检测相关研究尚处于起步阶段。针对上述种种,本文致力于充分利用现有数据集提升海面目标检测任务性能,从海面目标特征学习与增强的角度,进一步探索了深度学习技术在海面目标检测领域的应用。本文的主要研究内容如下:(1)针对现有海面目标检测数据集规模较小的问题,提出了一种基于自监督表征学习的海面目标检测方法,包括自监督船舶特征学习和有监督海面目标检测两个阶段。在自监督船舶特征学习阶段,采用对比式学习方法在规模较大的无标签船舶数据集上训练船舶特征提取模型,从而在无需船舶类别标注的情况下学得具有较高样本区分度的船舶特征;在有监督海面目标检测阶段,利用前一阶段学得的船舶特征提取模型参数对目标检测模型的基础网络进行初始化,然后在有标签海面目标检测数据集上对整个模型进行有监督训练。该方法可使目标检测模型具备一定的海洋场景知识先验,有效提升了海面目标检测模型的性能。
  (2)针对现有海面目标检测数据集样本分布不均衡的问题,提出了一种基于类间特征交互增强的海面船舶目标检测方法,其核心部分为船舶目标动态表征块和类间特征交互增强模块。船舶目标动态表征块用于存储各类船舶目标的特征,依赖于预训练的海面目标检测模型进行初始化,并在后续训练过程中动态更新;类间特征交互增强模块用于自适应地从动态表征块中学习有效的辅助特征对船舶目标特征进行增强。该方法可以充分利用各类船舶目标间的相似性,提升了模型对少数类船舶目标的表征能力,进而显著提升了海面船舶目标检测任务性能。
  
其他文献
图像分割技术是各种医学图像应用的基础,分割质量的好坏直接影响图像处理的后续步骤。近些年来,随着计算机技术的快速发展,医学图像的成像方式更为丰富,提供的信息量也越来越多,为临床医学提供了巨大价值。Otsu阈值法是图像分割方法中最简单、直接、快速的分割方法,具有原理简单、易实现的优良特性。但是对于复杂图像,获取阈值的速度以及阈值质量都受到了限制,因此医学图像的阈值分割应用依然很少。为了提升医学图像阈值
眼底血管的自动分割对缩短糖尿病视网膜病变的诊断周期具有重要意义。人体眼部组织结构复杂且眼底图像在采集过程中因光照不均易混入噪声,导致现有的分割算法对血管的分割精度不高。为了解决这个问题,本文采用改进水平集的血管分割算法对眼底图像进行处理,处理过程分为预处理、血管增强和血管分割三个阶段。1.针对眼底图像存在噪声和视盘干扰的问题,对图像进行预处理。选取绿色通道图像作为待处理图像,通过灰度校正和同态滤波
学位
随着人工智能技术的不断发展,卷积网络语义分割方法逐渐进入人们的视野。相比于传统的图像处理手段,卷积网络不仅提高了性能,而且缩减了特征标注的人力。随着大数据时代的到来,海量的图像数据要求快速、准确的分割并识别图像的种类。图像的语义分割是对图像中每个像素点进行分类,并依据每个像素点的类别,用不同颜色描绘一幅分割图。图像的语义分割和目标检测在自动驾驶、医学、自动监控等领域有着广泛的应用。  本文研究了高
学位
近年来,行人再识别在安防监控、智能搜索等领域被广泛应用,因此得到了工业界和学术界的广泛关注。它源于视频监控的基本需求,即在多个摄像头场景下,检索特定的行人对象。然而,行人图像极易遭受行人姿态变化、异物遮挡、光照强度差异以及背景多变等因素的影响。因此,行人再识别是一项具有挑战性的工作。  为了克服以上问题,本文使用深度神经网络搭建深度模型,提取行人图像的深度特征,捕捉局部关系的有效信息,并且提出有效
近年来,数据流挖掘技术引起了学者们的广泛关注,其通过对大数据进行分析可以发现数据流中隐藏的有效信息,极大地便利生产生活的各个方面。然而科技的飞速发展使得数据流的种类逐渐丰富、内部的结构日益复杂、产生的速度显著提高,这些变化增加了数据流挖掘的复杂度,为原有的数据流挖掘技术带来了不可避免的挑战。因此,提升数据流挖掘的效率,提高有效信息的获取精度具有重要的意义。  作为数据流挖掘的常用方法,滑动窗口可以
近几年来,多旋翼无人机由于其结构构造简单、比较容易操控等优点得到迅速发展。随着无人机在军事和民用领域的大规模应用,其在各行业发展中扮演着越发重要的角色,其中无人机自主飞行技术是其在行业中大规模应用的关键技术之一。复杂场景下无人机的航迹规划技术直接影响着无人机自主执行任务的能力,现有实际无人机自主飞行应用中经常是飞手手动规划航线,其航线方案往往存在耗电量大、效率较低等缺点。本文将针对具体应用背景研究
机器人柔性装配技术对于提高工业产品的生产质量和效率具有十分关键的作用,为装配行业自动化和智能化发展提供技术支撑。在形状不规则、材料多样的复杂零部件装配过程中,多个部件之间配合关系复杂、空间紧凑,接触状态多样,从而导致机器人装配作业过程模型复杂度高,且难以精确建模。因此,如何处理复杂零部件装配过程中的接触多样性、状态不确定性是机器人柔性装配过程中的重要问题。本文面向复杂零部件机器人柔性装配作业需求,
学位
自然界中众多陆生腿足动物因其高度的运动灵活性和崎岖地形适应能力给予人类诸多启发。近几十年来,世界各国研究者持续进行腿足式仿生移动机器人研究,包括仿生结构、运动机理、驱动方式、能量效率、感知技术等多个方面,以期实现非结构化环境下的物资运输、工程作业、野外勘探、救援救灾等任务,弥补轮式和履带式移动方式的不足。目前多足机器人主要有双足、四足、六足等拓扑结构形式,其中四足机器人因其兼具稳定性、灵活性和运动
切换系统可精准地描述工程实际问题中出现的多模态切换及多控制器切换现象,是控制领域关注的热点.在稳定性分析方面已取得了许多奠基性成果.现实世界中的系统都或多或少地存在着非线性特征,因此对非线性切换系统的研究具有重要的理论价值和实际意义.Port-ControlledHamilton(PCH)系统作为一类重要的非线性系统具有广泛的实用性.近30年来在镇定和H∞控制方面,取得了许多突破性进展,然而对于切
基于机器视觉的交通流估计研究一直都是智能交通领域的研究热点,是解决城市交通问题的关键技术之一,具有重要的理论意义和应用价值。面向复杂城市交通环境的交通流估计面临诸多挑战:城市交通场景车辆多而密集,且存在遮挡和小尺寸目标,增加了目标特征提取处理难度;城市交通场景复杂,基于单个目标的时空关联过程复杂耗时且精度较低,难以有效实时地进行交通流估计;基于交通视频的方法仅可输出交通流参数数据,而针对可视化的交