名片OCR识别知识后处理

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:win13790
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文针对日文名片自动录入设计了一套实用的OCR识别知识后处理系统.该文在对日文名片的特点进行分析的基础上,提出了基于名片内容的识别算法.并对常用的OCR知识后处理算法进行了分析,在此基础上提出了一种更适合日文名片的统计结合规则的OCR知识后处理方法.在Windows系统下利用VC++编程语言,实现了基于PC机和PDA两种不同机型的名片识别知识后处理系统. 在系统实现过程中,该文按照模块化的思想设计并实现了日文名片识别知识后处理系统.为了提高系统的识别准确率和OCR识别引擎的输出首选正确率,该文建立了多级反馈机制和各种识别算法的相互验证机制.最后该文对系统进行了详细的测试,并对系统的部分错误识别原因进行了详细的分析. 该课题的研究开发是一个具体的实用课题研究,在研发过程中得到了日本佳能公司的资助,并有幸成为了佳能公司日本总部名片识别系统的一部分. 名片内容识别和OCR知识后处理技术是中文信息处理领域中一个重要的研究方向,它的发展还需要更多学者、专家的参与和关注,不断加以完善.
其他文献
本论文详细描述了T2181 DSP处理器系统结构的设计和实现。论文分析了当前数字信号处理器系统结构的发展,结合以往进行的处理器研究工作,提出了针对DSP应用特点的处理器系统结构
随着集成电路设计能力和制造能力的进步,系统芯片设计规模越来越大,功能也越来越复杂,功能验证已经成为制约系统芯片开发的重要因素。FPGA(FieldProgrammableGateArray)原型验证
随着计算机技术、通信技术的日臻成熟和广泛应用,互联网自90年代初开始得到迅猛发展,互联网上信息资源越来越丰富.但是在浩如烟海的互联网信息世界中,人们寻找有用信息存在着
电力系统调度自动化中的监控系统(SCADA)经过20多年的发展,以往的系统限于历史条件,大多是面向具体的功能应用设计、开发的,其系统的开放性、可扩充性和二次开发等方面都存在
近年来,随着图形处理器在计算系统中的应用越来越广泛,图形处理器驱动程序的设计与开发显得格外重要。图形处理器驱动程序是图形应用程序对图形处理器硬件的编程接口的实现,它对
随着移动互联网应用的迅猛发展,作为应用开发中重要一环的界面开发面临着越来越突出的一些挑战:如何对界面进行全面而有层次的描述,以应对越来越繁杂的界面应用需求;如何复用其
根据北京市商业银行网络现状和信用卡系统的特点,该文作者提出了网络管理系统和信用卡系统升级改造的方案,并具体负责将信用卡系统从现在的PC Server的SCO Unix环境移植到AS/
粗糙集理论是八十年代初由波兰数学家Z.Pawlak提出的一个分析数据的数学理论,粒化计算是近年来新兴的一个软计算方法.该文以粗糙集理论和信息颗粒、粒化计算理论为基础,对粗
关联规则挖掘最早由Agrawal、Imielinski和Swami于1993年提出.1994年,R.Agrawal和R.Srikant提出了有名的Apriori算法.随后,人们提出了大量有关关联规则的算法,很多属于Aprior
在世界各国,电子政务都一直被列为"信息高速公路"的五个应用领域之首.电子政务是经济与社会信息化的基础.政府作为国家组成及信息流的"中心节点",在社会信息化的进程中起着重