基于深度学习和传统方法相结合的行人检测研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:bluebluewater
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域中长期关注的问题,而行人检测是目标检测的典型问题,在无人驾驶、智能监控、智能机器人等领域中都具有重要应用价值。历经十多年的探索,行人检测技术进步迅猛,出现了一系列的经典算法,特别是近年来,随着深度学习方法的引入,行人检测模型的精度得到了显著的提升。深度学习方法与传统算法相比,其优点是无需设计判别性特征、精度高,但同时也存在速度慢、对硬件要求高缺点而制约了其技术的产品化,这促使各类兼具速度和精度的网络模型应运而生。尽管行人检测技术日趋成熟,在当前研究中,仍旧存在诸多待解决的问题:其一,在道路场景中行人目标小,大多数行人检测框架对于小目标问题仍难以解决;其次,道路交通环境复杂,行人遮挡问题严重,干扰目标众多;其三,行人常有诸多的附加属性,如帽子、包、行李箱等,这在一定程度上增加了行人检测的复杂性。  本论文针对以上问题,对传统行人检测方法和深度学习方法进行了研究和拓展,主要贡献有:  1.针对Faster R-CNN框架难以解决小目标问题,提出了一种基于Faster R-CNN的端到端多尺度模型。该框架不需依赖额外的目标框检测算法和特征提取方式,自主地依据候选框大小学习和选择不同尺度的特征信息。网络结构简洁,易于实现和拓展。  2.对Faster R-CNN进行了拓展,引入Neural Cascade结构以解决难例选择和假阳性样本过多的问题。利用多层感知机构造多个弱分类器,并组合成强分类器,来预先判断可用候选框。利用选择的难例来训练网络,在降低网络计算量的同时使检测精度进一步改善。  3.综合考虑和分析了多种网络结构,并进行了一系列的大量实验对其性能进行评测。在一些公开的行人检测数据集上,本文提出的端到端多尺度模型在测试时间和相应的评估指标方面取得了较好的效果。同时,我们也对关键性的实验技巧也进行了总结与分析。
其他文献
作为一类由强化学习、最优控制和人工神经网络交叉融合产生的优化方法,自适应动态规划(Adaptive Dynamic Programming,ADP)通过模仿生物的学习机制与环境进行交互,利用交互数据
自平衡机器人的建模与控制问题是机器人学和控制科学研究的重要课题。柔性机器人能够从结构上模拟生物机体的柔性特性,其中柔性自平衡机器人是一个非线性、强耦合的系统,其建
数字信号处理是利用计算机或专用处理设备,通过数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理,用来获得符合人们要求的信号形式。而DSP系统则是以数字
近年来,随着虚拟现实技术以及硬件设备的快速发展,越来越多的用户能够接触到虚拟现实技术所带来的高沉浸感的交互式体验,而这种交互式体验又离不开大量的虚拟角色动画。传统的角
随着海洋开发的发展,人类对海洋作业任务的深度及安全性提出了更高的要求。搭载在7000米载人潜水器的深海微型ROV,是载人潜水器伸出去的机械手,大大强化了载人潜水器的作业能
学位
瞬变电磁法是在接地导线或不接地回线中通以脉冲电流(常为矩形波、半正弦波、梯形波)作为激发场源使地下产生一次脉冲磁场,来激励探测目的物感生二次电流,在脉冲间隙通过接收线
学位
仿生眼是智能机器人系统中必不可少的组成部分。目前,国内外关于仿生眼的研究主要集中于仿生运动和视觉感知机理方面,但如何将目标三维信息与仿生眼的仿生运动控制进行有机结合
网络控制系统(NCS,Networked Control System)是指传感器、控制器和执行器机构通过通信网络形成闭环的控制系统。在网络控制系统中,网络成为一种媒介实现分属于不同区域里的
随着深度网络的提出,人工神经网络(ANNs)又一次取得了重大的研究进展。ANNs已经应用到许多领域,比如智能感知,系统辨识和控制,决策制定和数据挖掘。然而,ANNs具有一个致命的缺陷,即
随着电力系统中非线性负载的大量应用,电网谐波污染日益严重,谐波成为影响电能质量的主要因素之一。有源电力滤波器是近年来发展快速的一种能够动态抑制电网谐波的电力电子装