论文部分内容阅读
从复杂的图片背景中提取文本信息一直是计算机视觉中的热点与难点问题。近年来,随着卷积神经网络在图像识别研究的突破性进展,传统的人工提取图像特征方式逐渐为深层网络学习特征方式所取代,而应用卷积神经网络(CNN)的场景文本识别方法也越来越受到广泛的关注。为此,提出了自然场景下基于卷积网络结构的数字识别改进方法。该方法能够对目标区域进行检测,并进行端到端的数字字符识别训练,数字识别部分提取的特征还可用来初始化目标检测的网络部分,以减少特征的重复提取并提高训练速度。需要处理的图像输入无需固定格式,只需输入原始