多场景图像目标检测与角度估计方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:kxy66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测与角度估计技术是数字图像处理研究的热门之一,伴随着深度学习框架的逐渐成熟,目标检测与角度估计技术在学术界掀起了一股新的热潮。此类技术被广泛应用于诸多场景中,然而在应对不同场景需求时,目标检测与角度估计技术经常遇到信息观测维度的问题:在某些有限的信息观测维度下观测,目标之间或目标与背景之间差异较小,进而导致分辨效果较差。因此为提升目标检测与角度估计效果,需要结合场景特点,在场景内寻找最有效的信息观测维度,以最大化类别之间的差异。
  本文研究不同场景下的目标检测与角度估计方法,主要解决有限信息观测维度条件下的检测与角度估计问题,对特征与算法流程进行了技术创新,包括:医用图像贫血检测技术、声纳图像目标检测技术、声纳目标角度估计技术。具体研究内容如下
  1.在利用眼睑结膜医学图像检测贫血的场景中,研究了色彩信息观测维度问题。为了推断眼睑结膜图像与血红素值的关系,进而检测贫血症状,本文分别提出了基于高色调比例特征的快速检测算法,基于特征甄选行为的学习检测算法与基于卡尔曼滤波与非线性惩罚回归的拟合算法。论文分析并量化了色彩相似图像的相似性,首先使用RGB与HSI色彩空间中的特征,提出基于高色调比例特征的快速检测算法;其次改进了HSI色彩空间中的特征,并引入特征甄选步骤和支持向量机/浅层神经网络提出基于特征甄选行为的学习检测算法;最后将回归算法引入到检测问题中,配合以修改的卡尔曼滤波寻找图像中的内部规律,并结合本文提出的一种风险等级评估办法量化统计结果,提出基于卡尔曼滤波与非线性惩罚回归的拟合算法。论文中使用医用结膜色彩相似图像数据评估以上算法。结果表明,本论文提出的算法能够找到有效的色彩信息观测维度,增加类别之间的差异。
  2.在基于声纳图像的目标检测场景中,研究了形状信息观测维度问题。研究主要目的是从声纳图像较为复杂的背景中检测目标,本文提出了基于横纵特征向量与基于点聚集特性的算法串联机制的检测算法。具体内容为:为了去除声纳图像中的干扰,论文提出了一种基于二维小波分解的去除电磁干扰噪声的算法。算法首先找到高频分量以定位出噪声位置,并实施近邻去噪算法。为了解决声纳真实目标与背景噪声形状相似的问题,针对水下规则形状与不规则形状两大类目标,本文提出了两种检测算法:针对规则形状目标,本文采用Hough变换提取可疑目标块,并提出了有较高鲁棒性的横纵特征向量用于筛选真实目标;针对不规则目标,本文提出了一种基于点聚集特性的算法串联机制,首先根据点聚集特性提取可疑目标块,然后分别使用三类检测器,包括角点与支持向量机,高阶统计量与支持向量机以及卷积神经网络,有效排除背景干扰。利用AUV海试获得的声纳数据,评估声纳图像目标检测算法。结果表明,本文算法能够增加目标与背景噪声之间的差异,具有较高鲁棒性,并提高检测效果。
  3.在基于二阶稀疏编码的声纳目标角度估计场景中,研究了形状信息观测维度问题。本文提出了基于二阶稀疏编码的角度估计算法。具体内容为:算法在原有稀疏编码的基础上添加了空间信息,并将图像分为四个象限,从每个象限提取标准差大的相同数量的图像块,对图像块白化预处理后,用稀疏表示方法进行第一阶训练,学习每个目标的子字典;之后对子字典进行整理,去掉无用基后合并为联合字典,并通过第二阶稀疏编码训练得到最终稀疏编码。在测试阶段,基于稀疏编码系数的稀疏性,算法将联合字典对图像块的最终稀疏编码汇总并表达为全局的图像特征向量,最终利用特征向量间的相关系数实现目标角度估计。为了更好地实现算法对声纳目标的角度估计,本文对图像数据预处理、空间图像块池化、稀疏编码参数、特征向量等改进方面进行了比较分析,并使用COIL-100数据库量化了改进效果,最后通过前视声纳多角度图像验证了算法的实用性。
  论文结合多场景应用需求研究目标检测与角度估计方法,从色彩和形状等方面,丰富和完善目标检测与角度估计的信息观测维度,使用对应的数据对算法进行验证。结果表明:本论文中提出的算法在不同目标检测与角度估计场景中均能够达到良好的效果,具有较高的应用价值。
其他文献
爆破片安全装置是一种安全泄放装置,应用于航空、工业、石油等多个领域。它的工作原理是当实际工作压力超过压力容器所能承受的最高工作压力时,爆破片即刻响应,膜片破裂破损而从达到将容器内的介质及时排出,降低容器内部压力,避免整个容器因超压而爆炸,造成人员伤亡、破坏存储设备以及产生的次生灾害的后果的目的。因此设计出方便精准的对爆破片安全装置泄放量的检测方法是十分必要的。  本文首先综合比较了国内外爆破片设计
微波光子学融合了微波技术与光子技术的优点,广泛应用于微波信号的产生、处理、控制与分配等领域。其中,光电振荡器(OEO)因其超低的相位噪声性能成为了一个重要的研究热点。基于此认识,本文围绕着降低OEO噪声,进一步提高其性能开展了研究,进而探索将OEO应用于电频率梳的产生及绝对距离测量等方面。  在提高OEO性能方面:1)对OEO的理论模型进行了研究,主要分析了光幅度噪声以及闪烁噪声对OEO相位噪声的
无线电能传输(Wireless Power Transfer,WPT)技术指的是将能量通过发射器转换为其他形式中继,隔空传输一段距离后,再通过接收器将中继能量转换为电能,实现非接触式能量传输。电场耦合式无线电能传输(Electric-field coupling wireless power transfer,ECPT)是无线电能传输技术的一个新兴领域,它具有功率损耗低,电磁干扰小,能够穿越金属障
无线传感器网络是由大量具有无线通信能力和数据处理能力的传感器节点构成的自组织网络,利用其对海洋环境以及物理、化学特性进行观测,对于海洋研究具有重要的价值,得到了广泛关注。但是,由于海洋环境无线电波传播的复杂性,传统无线传感器网络的数据传输方法,尤其是节点的时间同步协议与数据可靠汇聚方法面临巨大挑战。因此,本文主要针对海洋无线传感器网络开展研究,重点关注节点的高可靠时间同步方案与可靠数据汇聚方法。具
近年来,不断提高的交通技术改变了人们出行方式,然而频繁发生的交通事故不仅严重危害了公众的生命而且往往造成较大的经济损失。据分析,多数交通事故是由驾驶员疲劳驾驶或分心驾驶导致对车辆操控能力下降造成的。为了降低人为导致的交通事故率,在驾驶员处于疲劳或分心状态时,对驾驶员的状态和行为进行检测并给予相应警告,能有效提高驾驶员的安全意识从而规范驾驶行为。基于此,本论文旨在提出高效准确的驾驶员行为识别算法来实
空间通信处理平台上存在大量的数字信号处理器如FPGA、DSP等。太空辐射粒子轰击到这些处理器后可能会使处理模块的存储数据发生改变,导致处理故障,其中最常见的故障就是单粒子效应。现代空间通信平台包含完整的发射和接收流程,其中接收处理复杂度远高于发射处理,而接收流程中复杂度最大的模块之一就是信道译码器。卷积编码作为一种纠错码是无线通信中经常使用的信道编码方式之一,接收端通常采用维特比(Viterbi)
学位
末制导雷达是导弹末端制导的跟踪雷达,而相控阵体制的末制导雷达区别于以往常规体制末制导雷达,是采用相控阵体制而建成的一种末端制导雷达。相控阵末制导雷达相较于常规体制的机械扫描末制导雷达有很多机械扫描雷达不具备的优点如:天线波束快速扫描能力、天线波形的捷变能力,空间功率合成能力、雷达天线共形能力、多波束形成能力、空域滤波与空间定向能力等。而空域滤波、波形捷变、多波束形成等能力具有很强的抗干扰能力,因此
目标检测作为一项重要的计算机视觉任务,用于对图像所包含的物体进行分类和定位。近年来,深度学习技术的快速发展使得目标检测迎来了新的契机,产生了许多经典算法。一般来说,从是否产生候选框的角度出发,可以将目标检测算法划分为两个分支:实时性良好的单阶段检测算法以及准确率相对出色的基于区域提议的算法。多尺度的目标检测一直都是这两种算法优化的基本挑战,尤其是对于小目标的检测。  本文针对特征金字塔网络(Fea
学位
随着基于位置服务需求的增长,室内定位成为国内外学者研究的重点领域。研究发现采用多传感器信息融合方法可以提高定位准确度。针对室内定位的发展趋势以及惯性和视觉定位的各自优缺点,从不同融合结构角度出发,本论文主要提出了以下三种融合定位算法:  第一种算法是利用极限学习机融合惯性和视觉信息进行室内定位。在基于单层极限学习机的视觉定位方法中,引入图像模糊判断解决采集的图像模糊时视觉定位算法误差大的问题。同时
在当今的信息化时代,随着人类对高质量图像和视频的主观需求越来越强烈,图像和视频处理技术越来越广泛地应用在各个领域。图像复原技术是指在现有硬件条件下,从软件层面对退化图像和视频进行处理,使其尽可能地复原出目标场景的细节信息以提升图像和视频质量。近年来,深度学习由于具有强大的自学能力,可以端到端地学习不同质量空间的特征映射,为图像复原领域带来了全新的发展理念。  在图像复原任务方面,现有的深度卷积神经
学位