基于深度监督学习的高效红外行人检测算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:luck_mike
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测一直是计算机视觉领域的重要研究课题,无人驾驶、机器人导航、安防、智能交通等领域都需要实时准确的行人检测系统。由于可见光图像在不良照明条件下的成像缺陷,基于热成像原理的远红外图像成为基于视觉方法进行全天候行人检测的重要手段。近年以来,随着深度学习技术在计算机视觉领域的崛起,采用卷积神经网络进行行人检测的研究引起了众多学者的热切关注,并在一些细分领域取得了卓越表现。大规模的样本数据对于深度学习的效果是至关重要,但可用的已标注红外数据远少于常见的可见光数据,现行的红外行人检测方法大多先行在ImageNet数据集上预训练分类模型,随后再于红外数据集上进行检测任务的调优。但远红外的图像为单通道灰度图像,成像细节也与可见光图像迥异,加之分类模型转向检测任务的迁移学习瓶颈,这些因素极大的影响了神经网络训练结果,限制了红外行人检测系统的准确率。在实际应用中,规模更大、复杂度更高的神经网络模型已经被证实更有效,并在产品中有广泛的使用,这同时也产生了对计算能力、存储带宽的更大要求和消耗。在边缘计算场景中亟待优化。本论文主要研究工作如下:1、提出了一种基于深度监督学习的行人检测算法。在网络的骨干子网络和后端预测生成子网络中添加密集残差连接,提升网络各层间的信息流动和特征重用。使得行人检测网络可不基于可见光图像预训练模型,直接在红外数据集从零开始训练,且检测精度更高。2、针对目标检测和定位任务优化特征提取过程,在预测生成子网络中以深度可分离卷积替代传统卷积,并选用大分辨率特征图,提高了大目标的检测精度,降低了小目标的漏检率,且网络模型大小和运算开销不增反降。3、在单指令多数据流架构上对行人检测算法进行计算优化。结合硬件平台的微结构特征和相关参数制定优化策略,对核心算子深度可分离卷积进行了改写优化。采取了数据布局变换和循环重排、寄存器分块、缓存分块等措施,编写对向量化和缓存友好的代码。优化后的核心算子实际运行时间显著减少,使得本设计的目标检测网络可在终端硬件平台实现实时运行。
其他文献
研究目的:本研究通过观察孕前正常体重指数(Body Mass Index,BMI)腹型肥胖对母儿结局的影响,评估孕前正常BMI内腹型肥胖对母儿的危害,从而引起医务人员及孕产妇对孕前BMI正常
对于非聚光型太阳能集热器,真空绝热是提高其集热温度的主要手段,针对100~200℃的中温集热需求,本文对附加热阻真空管集热器和真空平板集热器进行了以下研究:采用了(?)分析的
氨氮是我国水质污染物总量控制指标,同时还是水环境质量的重要监测指标,氨氮含量常用于判断水质质量和水体受污染程度。目前监测水体中的氨氮主要采用分光光度法和氨气敏电极
字体设计是媒体内容创意的重要组成部分,但是中文字体设计费时费力、代价高昂。中文字体的自动生成有望大幅度降低字体设计成本。现有探索大多数聚焦在基于汉字合成的方法,然
基础教育改革一直是我国教育领域十分关注的问题,改什么以及如何改都需要我们在审视自身与放眼域外的同时,做出谨慎的思考。英国的基础教育改革一直走在世界的前沿,其“学院
利用沸腾床对生物质热解液加氢制备生物质汽柴油是当前最优的取代原油的技术途径。沸腾床内置轴向旋流器可实现催化剂的分离和活性恢复,开展内置旋流器的研究对反应器的开发
轨道交通在快速发展的城市化进程中占据了重要地位,而城市轨道交通车辆的安全高效运转则为社会生活提供了强有力的保障。牵引逆变器作为机车的重要组成部分,车辆运行中不间断
在唐明皇这位多情天子的人生中,杨玉环也许是最浓墨重彩的一笔,但依然难以掩去另外一名女子的光彩,这就是被称为梅妃的江采蘋。据《中国人名大辞典》载:"梅妃姓江名采蘋,福建
目前传统建筑行业的能源消耗与污染问题,已经成为我国首要解决的难题。资源大量的消耗,建设过程中产生的环境污染,违背了我国推行的可持续发展战略。绿色住宅理念正是解决这
近几年来,由于国家对纯电动汽车产业大力扶持,并且推出了许多相关的补贴政策,使得该行业的前景被大众普遍看好。但受限于当前的电池技术,车辆的续驶里程达不到用户需求。在短