基于Hough变换的神经网络表格字符识别技术的研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:a13456400000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际工作应用中,有很多要处理的数据是各种表格文本。表格文本作为一种常见文本,是日常工作中处理得比较多的一种文本,广泛应用于各种场合,例如:各种银行票据、税务、财务报表、图书卡片、人事档案及考勤表等。因此,表格字符的自动识别技术有着很大的研究和应用价值。 本文对表格字符的自动识别技术进行了一些研究和探讨,首次提出了一种新的基于Hough变换和BP神经网络的字符识别方法。该方法利用Hough变换的点——线对偶性,结合字符的结构特点,对识别字符进行Hough变换,将字符在参数空间中共线点的个数及其元素在图象空间中对应的位置坐标,作为BP神经网络识别系统的特征输入矢量,大大减少了字符特征矢量的维数,全面反映了字符点阵的总体分布情况极其形状的本质特点,简单易行,同时具有良好的稳定性。另外,本文对上述方法进行了扩展和改进,设计了增加骨架细化处理的印刷体字符识别系统和结合字符边缘特征的字符识别系统。进一步减少了字符的冗余信息,降低了特征矢量的维数。在保持了原始字符图象重要的几何和拓朴结构特征的基础上,进一步消除了噪声干扰,使字符的结构特点更加清晰,更利于本文的基于结构特点的特征提取,提高了识别率。同时,减少了系统的运算量,提高了字符识别速率。系统的测试结果表明,上述方法是可行有效的。 本文提出的基于Hough变换和BP神经网络的字符识别方法,是对字符识别技术进行的一些积极的探索,具有一定的扩展空间,还有待完善,如果与其它字符识别方法相结合,预计会取得更好的识别效果。
其他文献
该文的主要工作包括:1、查阅了大量国内外有关数据仓库和数据挖掘技术的相关资料.2、对现今流行的数据挖掘工具进行了比较研究.3、对相关的统计分析方法进行了学习和研究.4、
该文在分析数据挖掘、联机分析的主要技术、应用状况、研究热点的基础上,提出了将联机分析和数据挖掘有机结合起来的体系结构--联机分析挖掘.首先针对具体应用数据的特点以及
作者参与并长期主持了北京工业大学和北京灵思系统公司合作的基于Linux的嵌入式浏览器项目的开发.目前我们的嵌入式浏览器产品openEye已应用到灵思公司的机顶盒和Windwos终端
模型检查是一种重要的自动验证技术,是通过显式的状态搜索和隐式不动点计算来验证并行系统的性质,以保证设计的正确性.该文主要研究了并行系统的模型检查验证技术.并且通过对
该文的重点是研究面向概念的软件设计方法即通用编程(Generic Programming)思想,研究标准模板库的结构和设计思想,介绍一种形式化的概念描述语言Tecton,对概念进行规范和描述
航天、航空产品的复杂程度和现代化程度的不断提高,使得其设计、研制和维护日益依赖于先进的试验与测试手段。计算机网络技术的飞速发展与分布计算理论的日趋完善,为研究先进的
该论文主要以福田公司的CC为研究课题,探讨了CC实施的全过程.论文第1章首先介绍了CRM的概念和发展,并提出CRM的系统模型和应用系统结构,讨论了CRM与ERP、SCM及BI之间的区别和
随着网络的发展,路由器不仅需要进行路由查找,还需要完成数据包过滤、QOS、流量计费等额外服务;另外随着高速网络技术的发展,路由器对输入数据包的的处理速度成为网络整体速
各个领域都会产生大量的时序数据,产生时序数据的系统包括经济学,医学,无线传感器网络,气象学,冶金学等等。虽然有很多研究工作用于分析不同领域的时序数据,但是很少有工作从系统内
近十几年来,计算机网络经历了飞速的发展,但是伴随而来的是日益严重的拥塞。拥塞控制,是保证网络鲁棒性的关键因素,也是各种管理控制机制和应用的基础,同时又牵涉到网络运行的经济