论文部分内容阅读
该文叙述了一个印刷体简、繁体汉字文本识别实用系统,该系统是在BI-2型系统基础上,基于改进的汉字识别特征点方法实现的。该系统可以识别简体字、仿宋、楷、黑四种体单体或多体混排的各种文本以及明、楷、仿、黑四种繁体汉字文本。经65万字测试,对中等印刷质量汉字识别率达到98.7℅。系统有版面分析,识别结果自动纠错和自学习功能。文章对识别原理、主要技术及系统构成进行了阐述。(本刊录)