论文部分内容阅读
21世纪以来,国家经济快速增长,汽车数量持续升高,构建智能交通系统将是未来的趋势。车牌的识别作为关键环节,在减少交通量和提高交通效率方面起着积极的作用。利用深度学习实现车牌识别,对降低交通管理复杂度、协助管理人员提高效率具有重要现实意义。本文以神经网络为基础,相关研究共包含三个方面:车牌定位、矫正和字符识别,具体内容及工作如下:
在车牌定位方面,针对图像中可能存在多车辆、车牌占据图像中较小的情况,在车牌定位之前增加车辆定位,去除非车辆的区域,有效降低了无车牌图像对车牌定位的影响。对于车牌定位,本文以Tiny-YOLOv3为基础,重新设计了网络,对原网络结构剪枝,并且增加了残差结构,降低了计算复杂度近2G/FLOPs,同时网络权重降低了近50%,从而构建了LP-YOLO模型结构。另外,使用K-means++对车牌数据集聚类,得到用于训练的锚框。实验表明,本文车牌定位方法的精准率较Tiny-YOLOv3有1%的提升,召回率有2%的提升,检测时间降低了1/3。
在车牌矫正方面,车牌矫正用来修正定位到车牌可能存在倾斜的情况。通过改进VGG16,构建车牌矫正网络CorrectNet,利用该网络实现预测车牌四个角点位置,并使用透视变换实现矫正车牌。最后,在108张倾斜车牌图像上测试,正确矫正车牌105张,正确率为97%。
在字符识别方面,以YOLOv3结构构建了多种不同的字符识别网络,并且通过比较,得到了适用于本文字符识别的最佳网络结构。最终得到的网络结构中增加了SPP、SAM模块,对网络结构进行剪裁、压缩。针对本文数据集,同样使用K-means++算法得到字符数据集的锚框,获得与字符识别匹配的Anchor。为了加强多种类别损失的均衡性,运用了Focal loss优化策略。最终得到的网络模型大小较YOLOv3降低了约3倍,计算量降低了近4倍。实验表明,CR-YOLO较Tiny-YOLOv3精准率提升2%,召回率有较大幅度提升,为10%;精准率与YOLOv3持平,召回率有2%提升,检测时间大幅降低为1/2。
最后构建了用于整体测试的538张数据集,该数据集包括正面、倾斜、暗光环境下,蓝、黄、绿三种底色的不同种类车辆的图像。并且与其他方法在此数据集上的蓝色车牌上进行了测试,并得到对比结果。另外,单独将本文方法在此测试集上测试,得到识别准确率分别为:正面94.1%、倾斜90.7%和光线较暗83.3%。
在车牌定位方面,针对图像中可能存在多车辆、车牌占据图像中较小的情况,在车牌定位之前增加车辆定位,去除非车辆的区域,有效降低了无车牌图像对车牌定位的影响。对于车牌定位,本文以Tiny-YOLOv3为基础,重新设计了网络,对原网络结构剪枝,并且增加了残差结构,降低了计算复杂度近2G/FLOPs,同时网络权重降低了近50%,从而构建了LP-YOLO模型结构。另外,使用K-means++对车牌数据集聚类,得到用于训练的锚框。实验表明,本文车牌定位方法的精准率较Tiny-YOLOv3有1%的提升,召回率有2%的提升,检测时间降低了1/3。
在车牌矫正方面,车牌矫正用来修正定位到车牌可能存在倾斜的情况。通过改进VGG16,构建车牌矫正网络CorrectNet,利用该网络实现预测车牌四个角点位置,并使用透视变换实现矫正车牌。最后,在108张倾斜车牌图像上测试,正确矫正车牌105张,正确率为97%。
在字符识别方面,以YOLOv3结构构建了多种不同的字符识别网络,并且通过比较,得到了适用于本文字符识别的最佳网络结构。最终得到的网络结构中增加了SPP、SAM模块,对网络结构进行剪裁、压缩。针对本文数据集,同样使用K-means++算法得到字符数据集的锚框,获得与字符识别匹配的Anchor。为了加强多种类别损失的均衡性,运用了Focal loss优化策略。最终得到的网络模型大小较YOLOv3降低了约3倍,计算量降低了近4倍。实验表明,CR-YOLO较Tiny-YOLOv3精准率提升2%,召回率有较大幅度提升,为10%;精准率与YOLOv3持平,召回率有2%提升,检测时间大幅降低为1/2。
最后构建了用于整体测试的538张数据集,该数据集包括正面、倾斜、暗光环境下,蓝、黄、绿三种底色的不同种类车辆的图像。并且与其他方法在此数据集上的蓝色车牌上进行了测试,并得到对比结果。另外,单独将本文方法在此测试集上测试,得到识别准确率分别为:正面94.1%、倾斜90.7%和光线较暗83.3%。