基于CNN跨层特征融合的门牌号码识别方法

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:wcp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符是表达信息的重要方式之一,字符识别被广泛应用于门牌号码识别、车牌号码识别、档案检索、各类印刷品识别、邮政区域编码识别等领域。由于磨损、倾斜、遮挡、光照等外界因素的干扰,以及字符自身的多样性,使得准确、快速地识别自然场景中拍摄的字符,仍然存在很多现实问题。作为深度学习的一种常见网络模型,卷积神经网络被成功应用于图像分析与理解领域。本文以Google拍摄的街景门牌号码数据集(Street View House Number,SVHN)为研究对象,探索基于卷积神经网络的街景门牌号码识别的新方法和新技术。主要工作如下:(1)论述门牌号码识别技术和卷积神经网络的研究现状,并对卷积神经网络的组成模块及训练过程进行说明,对比分析LeNet-5模型、AlexNet模型、GoogLeNet模型和ResNet模型的特点和网络结构。(2)根据SVHN数据集的特点,提出一种基于卷积神经网络结构优化的门牌号码识别方法。该方法首先分析卷积神经网络结构设计过程中,激活函数、池化方式、滤波器大小、卷积层个数以及权值初始化方式对网络性能的影响;然后构建了 SVHN数据集中识别结果较为理想的卷积神经网络模型;最后,利用该模型完成特征提取,用SoftMax分类器进行特征分类,并最终给出10类门牌号码的识别结果。实验结果表明,所构建的卷积神经网络在模型训练稳定时,对SVHN测试集的识别率达到93.8%,识别效果高于HOG方法、KM-SVM方法、CNN-HMM方法、CNN-SVM方法,D-DBN方法以及基于DBN、SDAE和LeNet-5的识别方法。(3)传统卷积神经网络只将全连接层所映射的特征送入分类器中进行分类,忽略了网络前端所映射的细节信息。针对此问题,我们提出基于加权跨层特征融合的门牌号码识别方法。该方法首先利用主成分分析(Principal Components Analysis,PCA)方法对池化层的融合特征进行降维;然后根据各融合特征在网络识别过程中的贡献率给予权值,并将加权后的特征融合在一起;最后将融合后的特征送入SoftMax分类器,得到最终10类门牌号码的识别结果。实验结果表明,所提方法的训练时间为2.2小时,对SVHN测试集的识别率提高到95.6%。
其他文献
根据Curiosity China发布的《2016年微信用户数据报告》显示,微信每个月的活跃用户数量为5.49亿,用户覆盖200多个国家,其用户群数量十分庞大。微信的私密性、互动性和即时性
本文详细叙述了对原转鼓式硫磺结片机使用过程中存在问题的改进。并通过实践证明,改进后的结片机硫磺结片质量和产量均有所提高,转鼓的运行周期也得到了延长。
针对某型涡扇发动机低压压气机导流叶片角度控制工作原理中的一些误区、盲点以及实际应用中经常出现的故障现象,对发动机综合调节器进行了模拟仿真试验,得到了原理研究参考中
在根据相似理论放大的模型上,测量了带60°肋壁的内流通道中沿主流流向分布的各气膜孔的流量系数(Cd).实验在内流通道进口雷诺数为20 000~80 000、通道总出流比为0.30~0.60
本文介绍了GE公司的研发中心、研发体系,以及该公司技术创新项目的过程管理.
本文较为详细地介绍了中国燃气涡轮研究院"三大规范"编制与实施过程中的目标的确定、总体规划、采取的措施、应用效果、存在的问题及解决方法,可为同行编制"三大规范"提供借