自然场景图像中汉字的识别研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:meixueer2972
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子智能设备的普及,人们获取自然场景中的图像越来越方便,研究识别自然场景图像中的汉字也逐渐成为热点问题。针对目前一些方法中识别效率低下、准确率不高、拟合较差等问题,本文从汉字的检测定位与识别两方面进行分析研究。在汉字的检测定位方面,采用边缘增强的最大稳定极值区域方法,用HOG算子来提取自然场景图像中汉字的梯度信息,增强汉字区域的对比度,结合颜色聚类与启发式规则,进一步剔除图像中的背景信息。然后,采用笔画宽度变换的方法对汉字候选区域进行精剪,并对原方法中梯度方向的夹角范围进行调整,再结合形态学中的闭运算,消除汉字内部的微小孔洞。最后,通过计算汉字连通区域中笔画宽度的方差与变异系数,进行汉字连通区域的提取与合并。对比实验结果表明,本文的方法在准确率和召回率方面表现优异,综合F值明显高于其他算法。在汉字的识别方面,先引入减聚类算法来确定K-means算法的初始聚类中心及其个数,再用K-means算法确定RBF神经网络的径向基函数中心,然后用改进后的RBF神经网络设计了一个汉字分类器。之后,设计了一个12层的深度卷积神经网络模型来进行汉字块的识别。最后,在汉字识别的后处理过程中,把前面的结果进行综合调整修正。两组对比实验结果表明,本文的汉字分类器有着较高的准确率,同时,深度卷积神经网络模型对汉字也具有更好的拟合性。
其他文献
计算机技术和互联网应用的迅速开展与快速进步的同时,信息面临着被窃取的风险。图像信息需要面对被恶意流传、不法窃取以及监听等严重问题。光学信息安全技术具有高鲁棒性、
作为数据分析与处理领域一个最基础的问题,数据的表示形式被广泛的研究。真实的数据存在着多维因素的约束,具有复杂的内部结构。由于这些数据表现出高维度的性质,向量和矩阵
十九大报告提出,我国社会主要矛盾已经转变为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。分析福祉供需匹配的空间关系是当前深入推进区域协调发展和全面建
背景邻苯二甲酸二(2-乙基)己酯[di(2-ethylhexy1)phthalate,DEHP]为代表的邻苯二甲酸酯类塑化剂是公认的环境内分泌干扰物(environmental endocrine disrupting chemicals,EE
图像在传输或存储等过程中会产生噪声,根据图像噪声和图像信号之间的加乘关系,可以分成加性和乘性两种噪声。近年来,出现了许多用于去除加性噪声的变分模型。但是对彩色图像
随着5G移动通信时代的到来,同时同频全双工技术作为提升频谱利用率的重要技术之一,日益成为业界关注的焦点。然而,由于收发天线距离较近且发射信号和接收信号之间的功率差异
近年来,鄱阳湖区的经济发展水平快速提高,人民生活得到明显改善。进入新时代,随着鄱阳湖区居民对美好生活的需要日益增长,如何有效提升鄱阳湖区居民福祉产出效率,这对于鄱阳
近些年随着物联网的快速发展对通信电路提出了更高的要求,不仅需要电路结构简单化,尺寸小型化,同时也要求电路功耗小,这就产生了反向散射无线电的解决方案。反向散射通信技术
几丁质又称为甲壳素或甲壳质(chitin),是一种由N-乙酰氨基葡萄糖以β-1,4糖苷键连接而成直链状高分子生物多聚体,广泛存在于自然界中。几丁质是大多数真菌细胞壁的主要成
会议
制造业在国民经济中占据主导地位,新中国成立以来尤其是改革开放以后,素有“工业关节”之美誉的轴承相关制造业在我国发展势头强劲,但由于其在生产过程中可能出现各种缺陷,轻