基于红外与可见光双模图像融合的目标检测跟踪技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:teer197841
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
红外与可见光双模图像融合在机器感知中扮演着重要角色,可见光图像可以提供目标的细节信息,但成像受制于天气、光照等因素。而红外图像由于其热成像特性可以弥补这一缺点,因此融合红外与可见光双模图像可以取长补短,从而获取更为丰富的信息。近年来,目标检测跟踪在军事、民事领域发挥着关键作用,基于红外与可见光双模图像融合的目标检测跟踪技术,相比基于单模图像的目标检测跟踪有着更高的精度与更好的鲁棒性,因此极具研究价值。本文从红外与可见光双模图像融合、基于融合图像的目标检测跟踪和基于红外与可见光双模图像融合的目标检测跟踪系统设计三个方面对基于红外与可见光双模图像融合的目标检测跟踪技术展开了研究。
  首先,本文对红外与可见光双模图像融合进行研究。对传统融合算法:基于多尺度变换的双模图像融合算法进行了分析,提出了现存的缺点,并且针对这些缺点提出了一种基于深度学习的双模图像融合算法,提高了前景与背景提取的精度,解决了传统融合算法中融合规则依赖人工设计的问题。在公共数据集上的实验结果表明,本文提出的算法在多个评价指标下优于传统的融合算法。
  其次,在红外与可见光双模图像融合研究的基础上,对基于融合图像的目标检测跟踪进行研究。提出了基于融合图像的目标检测跟踪框架,制作了红外与可见光双模图像目标检测数据集,在该数据集上对4种目标检测模型进行了训练。在目标检测的基础上研究了基于检测结果的多目标跟踪算法,将跟踪问题转换为对相邻两帧目标检测结果的关联匹配问题。针对跟踪算法在实际应用中的实时性问题,提出了一种基于交并比和检测置信度的高速多目标跟踪算法。对各检测、跟踪算法进行了实验与评价,比较了各算法在双模融合图像上的目标检测跟踪性能。
  最后,本文对基于红外与可见光双模图像融合的目标检测跟踪系统设计进行研究。针对实际应用场景中的三种不同条件与需求,基于本文的研究成果设计了三套基于红外与可见光双模图像融合的目标检测跟踪系统。
其他文献
目标检测是计算机视觉领域一个热门问题,它不仅广泛地应用于工业检测和智能驾驶等实际场景,也对解决人脸检测和实例分割等更复杂的视觉问题有着重要的作用。  近年来,随着深度学习的发展,深度神经网络凭借其强大的特征提取能力和优异的表现性能被广泛地应用于目标检测任务当中,诞生了一些经典算法,并在相关领域展现出了巨大的应用价值。然而,尽管目标检测算法已经取得了巨大的成功,却仍然在尺度变化、采样等方面存在着巨大
学位
实际工程系统中往往存在未知参数、时变时滞等干扰因素,这些因素不可避免地对系统的控制效果产生影响。如何针对此类系统设计输出反馈控制器值得研究。本文基于齐次系统理论、Lyapunov稳定性理论、动态增益技术以及增加幂积分法,研究一类具有未知齐次增长率的非线性系统的输出反馈控制问题。论文主要工作如下:  1、针对一类具有时变时滞的非线性系统,考虑其全局输出反馈控制问题。由于非线性项满足上三角结构的齐次增
分布式传感器网络在环境监测、机器人协同工作、无人机编队飞行等民用和国防领域具有广泛的应用。在分布式传感器网络中,由于不同技术和部件之间的互联,以及传感器等智能体之间的互联,传输的数据容易受到攻击,从而导致传感器网络的运行遭到破坏。为了能够有效地抵御外部恶意数据注入的影响,本文设计了一种带有攻击检测的分布式滤波算法。该攻击算法可以有效识别虚假信息,维持系统安全运行。同时,考虑到攻击检测器的引入会使传
学位
字符识别、人脸识别、生物医学图像识别等图像识别技术在诸多计算机视觉领域有重要的应用价值,准确高效的图像识别是当前模式识别领域的热门研究课题。传统基于Gabor小波的图像识别方法提取的特征向量维度高,识别效果较差;近年来基于深度学习的图像识别方法取得了较好的识别效果,但仍然存在模型复杂度高、训练时间长、对外界环境变化鲁棒性差等问题。本文在对Gabor小波以及卷积神经网络深入分析的基础上,针对基于Ga
学位
视频监控作为计算机视觉领域的典型应用之一,现已广泛应用于道路安全,公共安防、智能交通等民用与军事领域。针对监控视频下的跨摄相机行人重识别技术对城市安全具有重大意义。行人重识别是指对于出现在某个监控视频中的行人,跨设备检索该行人图像,判断其是否出现在其他摄像头中。为实现监控视频中的行人重识别,本文主要完成以下几个方面的工作:  首先,本文对目前流行的基于深度学习的行人检测算法进行比较,并提出改进的S
学位
目标跟踪作为计算机视觉领域的一项重要技术,为行为识别、视觉导航、智能监控等高级应用提供了基础,然而跟踪过程中,复杂的环境变化和目标自身的形态变化都给鲁棒跟踪带来了很大挑战。TLD跟踪框架将跟踪任务分解成帧间跟踪、模型在线学习和帧内检测三个子任务,给长时间目标跟踪问题提供了有效的思路。本文围绕长时间鲁棒跟踪问题,对基于 TLD 框架和核相关滤波的跟踪算法展开了研究,主要的工作包括以下三个方面:  1
学位
复杂未知作业环境下,视觉 SLAM技术应用在穿戴式系统上往往存在定位不准、易丢失的问题。本文针对复杂多样且存在光线变化、移动物体等干扰的作业环境,研究了基于点线特征的视觉惯导SLAM技术;在此基础上,以巡检作业人员定位为典型应用场景,设计了可穿戴式定位系统,搭建了一套可穿戴式硬件平台,并开发了巡检定位功能和监控功能应用软件。  首先针对复杂作业环境的特点,提出了基于点和线段特征融合的视觉SLAM方
基于无人机或卫星航拍图像的地面目标检测识别,对于公共安全、地面侦察、交通疏导等方面都有重要意义。但是地面目标尺寸小、部分视角遮挡严重,导致目标可提取的特征少,而提升网络提取特征的能力,又会额外增加计算成本和运行时间,因此如何在提升小目标识别能力的同时减少计算量成为目前的研究热点。针对该热点问题,本文主要完成了以下几个方面的工作:  首先,分析了常用的目标检测识别框架,通过对比选择了精度较高且速度较
航拍图像与道路航标之间的配准与匹配是实现城市区域非 GPS 无人机自主定位的关键技术。基于道路航标的无人机定位技术,本质上是图像配准和匹配技术在无人机定位与导航领域的应用,其目的是实现GPS不可用环境下无人机的实时高精度定位。针对传统基于手工提取特征的多阶段图像配准与匹配算法存在精度低、鲁棒性差以及时效性差等诸多不足,本文提出基于端到端学习的道路航标配准与匹配新方案,采用深度学习技术直接建立从输入
学位
机器人智能作业需要融合力觉、视觉等多种传感器的数据信息,同时多核处理器和实时操作系统(RTOS)的发展,使任务组件一体化的机器人控制器系统软件成为一种面向未来的先进解决方案。本文围绕工业机器人控制器关键技术国产化及控制器系统软件自主可控的需求,系统地研究了基于开源RTOS的通用工业机器人控制器实时多任务系统软件的逻辑架构和智能接口技术的设计与实现。  本文首先在综述了国内外工业机器人控制器运行平台