基于注意力机制的小目标检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:luye063006300630
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频监控系统日渐完善、无人机应用逐渐普及以及5G技术日趋成熟,设备采集到的图像及视频数据飞速增长,数据处理的要求逐渐提高,检测算法也面临着挑战。目标的小尺寸降低了其检测精度,提高检测精度一般会带来计算量的大幅增长,这直接限制了检测算法的应用场景。目前各种应用中部署的目标检测算法大都执行静态推断,检测不同尺寸目标时会处理图像中的每个像素。算法在不同尺度的每个像素上花费相等的处理时间,导致整个处理过程比较低效。使用图像金字塔或者在RPN网络中增加锚点都会使这个问题更加严重。近两年针对小目标检测问题提出的算法集中在引入注意力机制方向,将目标检测的整体流程分为两个阶段。第一阶段称为区域生成阶段,在此阶段实现注意力机制,完成对目标的初步定位,第二阶段进行逐区域目标检测。利用图片背景占比较大的特点,算法通过忽略背景,获得对小目标的关注。但是他们共同的问题是实现注意力机制的方法太过复杂,模型整体速度没有得到提升甚至大幅下降,并没有完全发挥注意力机制的优势。本文提出的小目标检测算法与近两年小目标检测算法不同的是本文进一步将小目标检测流程的第一阶段分为区域感知任务和子区域生成任务,通过设计区域感知网络和子区域生成算法实现注意力机制。区域感知网络以语义分割网络为基础,旨在通过简单的模型快速获得感兴趣区域,减少总体处理的像素点数量。这可以大幅降低小目标检测的难度,最终达到加速检测流程同时保持检测精度的目的。在子区域生成算法中,针对小目标数量较多的场景,本文使用图像形态学操作和聚类算法处理尺寸不合理区域,控制区域数量和区域内目标尺寸在一定的合理范围。实验在TT100K和Vis Drone两个数据集上进行。实验结果显示本文小目标检测算法中区域感知网络和子区域生成算法的召回率明显高于直接使用目标检测模型进行检测。只针对可能存在目标的区域进行检测大幅降低了目标检测阶段对模型性能的要求,提高了检测速度并保持了高精度。在TT100K数据集上本文算法相比近两年模型,在保证精确检测结果的同时,处理速度提升十倍以上。区域感知模型大小小于10MB,平均单张图片处理时间平均仅12ms,像素点处理数量下降80%左右。同时在Vis Drone数据集上达到28.59%的AP,表明本文算法在目标密集的场景下也可以有很好的效果。
其他文献
受其它学科和众多工程技术领域应用的驱动,关于Sturm-Liouville算子的谱分布及其逆谱问题的研究已引起国内外学者的极大兴趣和高度重视.迄今为止,它已成为应用数学领域中发展
本文主要研究双周期结构和无界粗糙表面弹性介质散射问题的完美匹配层截断问题的理论分析.这些散射问题都需要在无界区域上求解散射场或者衍射场.为了使用经典的数值算法――
为了保证农业生产中农作物的产量和人类食物的供给,农药的使用不可避免。其中有机磷和氨基甲酸酯类农药在我国的使用量远高于其他农药品种,由此引发的农产品中的残留问题和引
国家教育改革的扎实推进促发了教育行业的活力。近两年来,随着新教育理念的普及,新高中课程标准的发行以及新高中教材的推广使用,教育受到了越来越多的社会和学术关注。作为
随着大数据时代的到来,大数据分析技术在商业应用、工业生产、社会服务和政府管理等各个领域得到高度重视和广泛应用,有效地提高了各行各业的决策能力、服务效率和运营管理水
本文主要研究了累积剩余熵的性质及其在投资风险中的应用,为风险投资与决策提供理论支持。第一章主要讲述累积剩余熵的发展过程以及它的发展意义。第二章主要介绍了一些经典
随着集团型上市公司的日益普及,其内部更为复杂的财务与会计问题得到了国内外理论研究的日益关注。近年来,基于双重委托代理关系和“双重披露制”探讨集团内部的财务与会计行
互联网和信息技术在通信中的作用日益增强,给人们带来各种各样便利的同时也引起了人们对信息安全和版权保护的关注。信息隐藏技术作为一种有效的手段,已经成为信息安全领域一
鸭甲肝病毒(duckhepatitisAvirus,DHAV)是小RNA病毒科(Picornaviridae)禽肝病毒属(Avihepatovirus)的唯一成员,其基因组为单股正链RNA,在我国流行较为普遍的是血清1型即DHAV-
随着互联网的发展,多媒体数据不断增长。对大规模多媒体数据进行分类是一项极具挑战性的任务,重要原因之一是多媒体数据可以同时属于多个类别。在多媒体数据中,图像占有很大