基于特征融合与注意力机制的视频目标检测研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lmnlmnbalance
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测作为计算机视觉领域经典任务之一,广泛应用于视频监控、智慧交通、目标跟踪等领域。目前基于深度学习的目标检测方法主要包括anchor-based检测方法和anchor-free检测方法。Anchor-based检测方法使用锚框内的全局信息用于分类和边框回归,具有较高的分类准确度,然而,锚框的设置依赖于先验知识,对于一些小目标和细长目标检测效果不佳。Anchor-free方法将目标检测转化为关键点检测和关键点匹配问题,无须再设置锚点,能够取得较好的定位性能,然而,局部的关键点信息容易产生一些错误的匹配。此外,以上基于深度学习的目标检测方法都依赖于大量的标注数据。这在一定程度上限制了基于深度学习的检测方法在一些场景中的应用。针对上述三个问题,取得的主要成果如下:首先,针对anchor-based方法由于目标尺度多变,对小目标和细长目标检测效果不佳的问题,提出基于特征融合的目标检测方法,通过建立目标间的关系,对图像场景建模,引入上下文信息,辅助小目标和细长目标的检测。实验结果表明,所提方法可以有效地提升小目标检测精度,提高模型的定位能力。其次,针对anchor-free方法由于图像空间关系复杂,容易产生错误匹配问题。提出基于注意力机制的视频目标检测方法,通过引入前景分割分支,构建全局注意力图,抑制背景信息,使得模型更加关注于前景目标信息,减少目标检测分支的搜索空间。实验结果表明所提方法有利于提高模型的召回率。再次,针对基于深度学习方法依赖于大量标注数据问题,提出融合全局语义信息的少样本目标检测方法。通过引入全局特征图池化结构,加强模型学习类别无关的定位特征,学习对新类别目标的检测。实验表明所提方法对基类数据也可以有很好的检测结果。最后,根据所提方法,构建地空视频目标检测系统,结合目标跟踪技术,实现对视频中目标的自动标注、检测和跟踪等功能。
其他文献
随着人工智能技术的发展,各种基于人工智能的产品和服务逐渐在产业界落地应用,人工智能技术的崛起主要依托于深度学习模型在机器学习任务中取得的突破性进展。但是最近的研究表明,深度学习模型易受到对抗攻击的威胁,对抗攻击的研究已成为人工智能安全领域的一个热点。研究对抗攻击对于评估机器学习算法的完整性和安全性、评估模型的鲁棒性以及促进防御算法的产生都有着积极意义。在对抗攻击中,基于决策的黑盒攻击需要对模型进行
随着人工智能、大数据、云计算等信息技术不断取得突破,数字经济蓬勃发展,生产者对于生产过程中的智能信息化需求日益增长,因此,利用机器人流程自动化来提高生产效率成为了一种新趋势。然而,传统机器人流程自动化中的软件机器人智能化程度较低,对一些重复性工作进行自动化处理,灵活性差,不能应对现有应用软件上复杂多样的操作任务,无法满足智能化需求。为此,本文进行了面向典型应用的软件机器人系统的研究、需求分析、设计
为帮助语言能力和精细操作能力受损的老龄及残障人士(例如中风病人等)更简单易用的掌控载臂式轮椅机器人(Wheelchair Mounted Robotic Arms,WMRA)执行非结构化任务,本文提出一种通过激光点点取场景物品来推理动作意图、适应非结构化环境的语义激光直觉交互操作方法,并重点针对该方法中激光锁定物品涉及的激光语义、物品类别以及后续动作等“上下文”信息的快速可靠识别技术进行了研究。关
无人驾驶的相关研究是车辆工程领域研究的热点,路径规划作为无人驾驶的关键技术之一更是吸引了许多的研究者关注,但是目前大多数的路径规划研究还都主要着眼于结构化环境,而对于非结构化环境下的路径规划方法还没有很好的研究方法,因此本文对于非结构化环境下的路径规划方法展开了研究。路径规划需要在已知的环境地图中进行规划,因此本课题研究设计了建立非结构化环境地图的方法。在该方法中利用激光雷达获取环境中的原始点云数
随着人工智能技术、数字化技术的迅速发展,智能算法在虚拟装配中的应用取得了飞快的进步,利用遗传算法、蚁群算法以及神经网络算法等智能算法进行虚拟装配设计早已成为虚拟制造领域的重要研究方向。相较于其它智能算法,神经网络算法因具有良好的信息获取能力与知识学习能力逐渐成为装配规划研究的重要研究方向,但由于存在局部极值和训练效率慢问题,在虚拟装配中的应用效果存在很多不尽如人意的地方。此外,在装配序列规划方面,
随着社会的发展和经济水平的提升,人们对于地震作用的关注点已从生命安全上升至综合经济损失。基于性态的抗震设计理论突破了传统抗震设计以“保证生命安全”为主要设防目标的局限,以有效控制人员伤亡和经济损失、保障结构使用功能为目标。同时,基于位移的抗震设计方法被认为是实现基于性态的抗震设计理论最有效的途径之一。如加速度设计谱在基于力的抗震设计中的重要作用,位移设计谱是基于位移的抗震设计方法中确定地震作用的重
目前我国存在大量的偏瘫患者,但由于康复资源分配不均与康复医师严重短缺等原因,多数患者没有得到及时的康复治疗,因此设计一款适合偏瘫康复的机器人是亟待解决的问题。在此背景下,本文基于膝关节康复机器人对控制策略与控制系统等方面展开了研究,主要工作如下:首先进行了控制方案设计。简述偏瘫的特征与治疗方法,表明偏瘫患者在不同的康复阶段应采取不同的运动模式;对下肢运动展开了分析,并建立了膝关节运动学模型;提出了
由于多智能体系统具有广大应用前景,事件触发控制拥有节省通信资源等优势,因此,本文基于事件触发控制研究了多智能体系统的一致性问题很有价值和意义,主要的研究内容主要包含以下几个方面:首先,本文考虑当通信拓扑为无向连通图时,研究具有一阶积分器模型的线性多智能体系统的事件触发一致性问题。为了减少智能体之间的连续通信,对每个智能体采用了分布式事件触发算法。由给定的触发条件决定是否更新控制器并向邻居智能体传递
近些年我国在航天领域捷报频传,航天科技是当今世界最复杂、最庞大、最具风险的领域。由于航天活动的特殊性,在技术研发过程中,必须要在地面进行核心关键技术的仿真与验证。气浮台控制系统由于其制造成本较低、工作时间较长、模拟精度较高、引入扰动较小、实验平台较大等突出优势,可以被用来有效地模拟航天器姿轨控制、交会对接等重要实验。然而,现实气浮台控制系统中普遍存在执行器饱和的限制,在气浮台控制系统设计时,如果不
从上世纪末起,智能无人武器在全球范围内几次重大的局部性战争中可谓出尽了风头,而随着本世纪初人工智能技术的又一次爆发增长,人工智能技术赋能未来战场的呼声日渐高涨。的确,随着人工智能、群体智能的高速发展,智能无人武器领域出现一个新的契机:智能无人武器的集群化应用,这将给各层次对抗提供更多的战略及战术选择,也将对未来战场产生颠覆性的巨大影响。本文基于此背景,针对异构多智能体对抗问题在应用强化学习技术时存