论文部分内容阅读
近年来,各大互联网公司将战略目标投向自动驾驶汽车,掀起了自动驾驶技术在世界范围内的研究热潮。在自动驾驶的应用场景中,城市道路等复杂场景下的自动驾驶更具有挑战性。车辆实现自动驾驶的关键在于对行驶环境中目标的识别,而车辆行驶在城市道路环境中主要需要关注的目标是车辆和行人。车辆和行人目标是影响自动驾驶车辆控制决策的关键环境信息。为此,本文针对行驶在复杂道路场景下的自动驾驶车辆,设计适用于车载图像的目标检测模型。针对车载图像中遮挡频繁、姿态多变的目标检测问题,传统的目标检测方法在精度上难以达到自动驾驶要求。为此,选择基于卷积神经网络的深度学习方法,在基于区域卷积神经网络的两阶段检测方法和无目标候选区域提取的单阶段检测方法中,选择在精度上保持与两阶段检测方法相近,在速度上有明显优势的SSD单阶段检测方法。在对比研究目标检测方法的基础上,选择在PASCAL VOC数据集上检测性能优异的SSD300检测模型作为基础模型。分析KITTI车载图像数据集和PASCAL VOC数据集中目标样本的区别,提出了考虑目标像素占比的模型设计方法、考虑目标信息分布的模型设计方法和考虑目标高宽比的模型设计方法,并据此设计了适用于KITTI车载图像的KITTI_SSD650*150检测模型。为验证检测模型设计过程中所使用的模型设计方法的有效性,设计了多组对比实验。通过SSD300模型与KITTI_SSD300模型在KITTI数据集上的检测性能对比,验证了考虑目标像素占比的模型设计方法是有效的。通过KITTI_SSD300模型分别与KITTI_SSD512模型和KITTI_SSD650*150模型在KITTI数据集上的检测性能对比,验证了考虑目标信息分布的模型设计方法和考虑目标高宽比的模型设计方法是有效的。检测模型在KITTI数据集上的检测性能(mAP)由SSD300模型的35.12%提升到KITTI_SSD650*150模型的77.27%。