基于Hough变换的神经网络表格字符识别技术的研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户：a13456400000

【摘要】

：

在实际工作应用中，有很多要处理的数据是各种表格文本。表格文本作为一种常见文本，是日常工作中处理得比较多的一种文本，广泛应用于各种场合，例如：各种银行票据、税务、财务报表、

【作者】

：

彭明明

【机构】

：

汕头大学

【出处】

：

汕头大学

【发表日期】

：

2003年期

【关键词】

：

Hough变换 BP神经网络字符识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在实际工作应用中，有很多要处理的数据是各种表格文本。表格文本作为一种常见文本，是日常工作中处理得比较多的一种文本，广泛应用于各种场合，例如：各种银行票据、税务、财务报表、图书卡片、人事档案及考勤表等。因此，表格字符的自动识别技术有着很大的研究和应用价值。本文对表格字符的自动识别技术进行了一些研究和探讨，首次提出了一种新的基于Hough变换和BP神经网络的字符识别方法。该方法利用Hough变换的点——线对偶性，结合字符的结构特点，对识别字符进行Hough变换，将字符在参数空间中共线点的个数及其元素在图象空间中对应的位置坐标，作为BP神经网络识别系统的特征输入矢量，大大减少了字符特征矢量的维数，全面反映了字符点阵的总体分布情况极其形状的本质特点，简单易行，同时具有良好的稳定性。另外，本文对上述方法进行了扩展和改进，设计了增加骨架细化处理的印刷体字符识别系统和结合字符边缘特征的字符识别系统。进一步减少了字符的冗余信息，降低了特征矢量的维数。在保持了原始字符图象重要的几何和拓朴结构特征的基础上，进一步消除了噪声干扰，使字符的结构特点更加清晰，更利于本文的基于结构特点的特征提取，提高了识别率。同时，减少了系统的运算量，提高了字符识别速率。系统的测试结果表明，上述方法是可行有效的。本文提出的基于Hough变换和BP神经网络的字符识别方法，是对字符识别技术进行的一些积极的探索，具有一定的扩展空间，还有待完善，如果与其它字符识别方法相结合，预计会取得更好的识别效果。

其他文献

数据仓库和数据挖掘技术的研究

该文的主要工作包括:1、查阅了大量国内外有关数据仓库和数据挖掘技术的相关资料.2、对现今流行的数据挖掘工具进行了比较研究.3、对相关的统计分析方法进行了学习和研究.4、

学位

数据仓库数据挖掘BootstrapsR语言

基于数据仓库的联机分析挖掘

该文在分析数据挖掘、联机分析的主要技术、应用状况、研究热点的基础上,提出了将联机分析和数据挖掘有机结合起来的体系结构--联机分析挖掘.首先针对具体应用数据的特点以及

学位

多维关联规则增量式数据仓库联机分析挖掘

基于Linux的嵌入式浏览器的实现

作者参与并长期主持了北京工业大学和北京灵思系统公司合作的基于Linux的嵌入式浏览器项目的开发.目前我们的嵌入式浏览器产品openEye已应用到灵思公司的机顶盒和Windwos终端

学位

浏览器嵌入式系统Linux

并行系统的验证技术

模型检查是一种重要的自动验证技术,是通过显式的状态搜索和隐式不动点计算来验证并行系统的性质,以保证设计的正确性.该文主要研究了并行系统的模型检查验证技术.并且通过对

学位

混合自动机模型检查组合验证定理证明自动验证技术

基于形式化方法的通用编程技术及其应用

该文的重点是研究面向概念的软件设计方法即通用编程(Generic Programming)思想,研究标准模板库的结构和设计思想,介绍一种形式化的概念描述语言Tecton,对概念进行规范和描述

学位

通用编程形式化方法TectonAES二叉树

分布式协同综合虚拟试验与测试系统的通信与调度技术研究

航天、航空产品的复杂程度和现代化程度的不断提高，使得其设计、研制和维护日益依赖于先进的试验与测试手段。计算机网络技术的飞速发展与分布计算理论的日趋完善，为研究先进的

学位

分布式试验与测试系统虚拟共享内存中间件通讯管理与调度

支持CRM的客户呼叫中心系统的研究与应用

该论文主要以福田公司的CC为研究课题,探讨了CC实施的全过程.论文第1章首先介绍了CRM的概念和发展,并提出CRM的系统模型和应用系统结构,讨论了CRM与ERP、SCM及BI之间的区别和

学位

客户关系管理呼叫中心自动呼叫排队交互式语音应答计算机电话集成

元组空间在位并行包分类算法中的应用

随着网络的发展,路由器不仅需要进行路由查找,还需要完成数据包过滤、QOS、流量计费等额外服务;另外随着高速网络技术的发展,路由器对输入数据包的的处理速度成为网络整体速

学位

路由查找数据包分类位并行元组空间

挖掘多维相关时序数据中的内部动态

各个领域都会产生大量的时序数据，产生时序数据的系统包括经济学，医学，无线传感器网络，气象学，冶金学等等。虽然有很多研究工作用于分析不同领域的时序数据，但是很少有工作从系统内

学位

时序数据内部动态特征混合模型快速分解算法

控制理论在ATM网络拥塞控制中的应用研究

近十几年来，计算机网络经历了飞速的发展，但是伴随而来的是日益严重的拥塞。拥塞控制，是保证网络鲁棒性的关键因素，也是各种管理控制机制和应用的基础，同时又牵涉到网络运行的经济

学位

ATM网络ABR业务拥塞控制控制理论数学模型

基于Hough变换的神经网络表格字符识别技术的研究

其他学术论文