论文部分内容阅读
自卷积神经网络成功应用于计算机视觉领域以来,计算机视觉技术得到了长足的发展。相比于传统人工提取特征的方法而言,神经网络具有更加强大的特征提取能力和回归拟合能力,因此能够满足更高的性能要求。在计算机视觉领域中,许多研究工作均是基于公开数据集开展的,而实际场景要远比公开数据集表现的场景复杂,所以,往往要针对具体的需求对已有算法进行修正。本文所设计的用于实际路况场景下的多级交通标志文字检测算法是在通用物体检测算法的基础上进行改进的,达到了工业界实用的要求,具体内容可分为两大部分。第一部分是交通牌文字检测算法的设计,该部分旨在设计一个用于检测交通牌区域中文字的检测器。具体而言,交通牌文字检测算法是在SSD(Single Shot MultiBox Detector)以及RetinaNet的基础上进行开发的,本文首先在SSD上进行改进,然后对改进后的设置进行对比性实验以验证改进的意义,最后将改进的方法迁移到RetinaNet上,取得了更好的实验结果。该部分的改进工作主要分为两点,第一点针对通用物体检测算法NMS(Non-Maximum Suppression)阶段中IOU(Intersection-Over-Union)计算方式不能在保证较高检测精度的条件下抑制框内框现象的问题,将IOU计算方式改为IOB(Intersection-Over-Bounding Box)计算方式;第二点则是针对SSD这种多尺度特征预测的方式,根据不同尺度特征的感受野的不同以及数据集中不同尺度范围内标定框高宽比分布的不同,对不同的预测分支设置不同的高宽比参数,相比于TextBoxes方法而言,检测效果相当,但需要的先验框数量大大减少。第二部分是多级目标检测算法的设计,该部分旨在将交通标志检测算法与交通标志文字检测算法级联起来,形成一个多级交通标志文字检测算法流程。在实际路况场景下采集的图片中,有时候交通标志文字区域所占的面积相比原图而言是非常小的,如果此时直接使用单级文字检测算法作用于原图,检测性能将大打折扣。针对这一问题,本文设计的多级交通标志文字检测算法将首先对原图进行交通标志检测,然后对交通标志检测的结果进行投影变换,根据投影变换后的结果再进行交通标志文字检测,最后将交通标志文字检测的结果映射回原图,得到最终的交通标志文字的检测信息。