印刷体简、繁体汉字文本识别实用系统

来源 :第三届中文信息处理国际会议 | 被引量 : 0次 | 上传用户:kelu1fu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文叙述了一个印刷体简、繁体汉字文本识别实用系统,该系统是在BI-2型系统基础上,基于改进的汉字识别特征点方法实现的。该系统可以识别简体字、仿宋、楷、黑四种体单体或多体混排的各种文本以及明、楷、仿、黑四种繁体汉字文本。经65万字测试,对中等印刷质量汉字识别率达到98.7℅。系统有版面分析,识别结果自动纠错和自学习功能。文章对识别原理、主要技术及系统构成进行了阐述。(本刊录)
其他文献
音乐具备美的品质,不但具有广泛的社会功能,还有娱乐的、教化的、审美的积极意义,同时具有净化人的心灵、陶冶情操、启迪智慧的作用。因此,音乐对于和谐校园的建设,从人健康
本文论述了高等学校的定位概念、服务方向、类型以及办学特色的定义、内容;并以徐州医学院为例重点论述了高校办学定位、办学理念、办学特色对高校发展的重要意义;指出高等学校
德国盆景艺术家沃特·坡尔的盆景作品得到了国际的广泛认可,他的作品于自然的形态中追求艺术的美感,每件作品都倾注了他几年乃至几十年的心血,这种对艺术的执着追求,让人不禁
汉字识别后处理中,当候选字集不含有正确字时,文本识别率的提高受到很大限制,该文基于噪声信道理论,提出一种扩充候选字集的方法,使候选字集尽可能地包含有正确字。非训练样本测试
为了提高手写文稿识别系统的识别率,在单个汉字识别基础上,利用上下文信息,对系统的单个汉字识别结果讲后处理。首先根据汉字单字识别的可信度和类似度判断该汉字是否进入后处理