印刷体汉字图像处理及基于结构特征相似字识别的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xiang88_77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了一组基于数学形态学的字符图像处理算法:膨胀腐蚀算法的改进——比例胀蚀算法、去噪算法、平滑模板选取、基于区域扩散搜索的K值去边算法,并且针对经常出现的空心字和粘连字,通过分析汉字字符的轮廓面积比变化规律,提出一种多尺度的数学形态学算法——限制外围扩散的多级级联填充算法,这些算法在实际应用中,取得了良好的效果. 汉字识别的难点之一就是相似字的识别,而采用统计模式识别方法难以区分相似字.基于部分空间法是识别相似字的原理性方法,该文提出一种基于特征点矢量的结构模式识别方法.通过对字符的良好细化,位置归一化等方法,分析和提取字符的位置方向特征向量,提出一种模糊匹配识别方法.该方法对字符的字号和字体不敏感,在实践中取得很好效果.针对有限拓扑结构的字符集(ASCⅡ码)的特征点类型位置区别比较大的特点,通过对匹配算法的改进,提出一种带拒识功能的精确识别方法,对机打数字、字母、金融符号都有根高的识别率. 特定领域的汉字图像处理和相似字的识别是汉字识别的难点,该文提出了一组面向特定领域的汉字字符图像处理算法和基于方向特征点的针对相似字集和有限拓扑结构字符集的结构特征识别方法,具有很好的实用价值.
其他文献
Kademlia是2002年由Petar等人提出的通过分布式哈希表(Distributedhashtable,DHT)构建的DHT网络,凭借简洁高效的搜索机制,在当前互联网上得到了大规模部署和应用。以eMule和BitT
中国企业信息化总体上还仍然处于初级发展阶段,大多数企业在企业信息化建设中面临着许多困难,由于专业知识的贫乏,面对快速发展的技术、频繁推陈出新的产品、飞速升级的软件
该文提出的求解数值多目标优化问题的新的演化算法不仅具有搜索的遍历性与收敛的单调性等特点,所求出来的解集也具有良好的分布性,是一种鲁棒的求解多目标优化问题的通用算法
近年来,以用户产生内容和社交关系为主要模式的社交化媒体服务取得了迅速发展,以微博为代表的各类社交化媒体服务逐渐成为人们日常生活中不可或缺的一部分。微博不仅成为分享心
报表系统是对数据进行加工的系统之一,它在数据转为信息直至知识的过程中起着重要的作用.该文研究的目标是实现一个基于web的报表系统,它使人们能更加灵活、方便地设计报表.
在移动互联网的发展大潮之下,人们的生活越来越多地被各种各样的电子设备所包围,我们的办公、娱乐等生活的各个方面被越来越多地电子化。同时,数据挖掘与机器学习的迅速发展使得
现代计算机系统普遍采用多级层次化高速缓存结构来弥补处理器和内存之间的性能差距。随着处理器和内存之间性能差距的不断增大,高速缓存对处理器性能和能耗的影响也不断增大,高
该文研究的加密数据库技术,将加密技术结合到关系数据库中,对数据库中的敏感数据进行加密,确保这些数据对于数据库管理员、数据库入侵者都是无效信息,而备份介质丢失造成的信
随着计算机技术在政治、经济、军事等领域日益普及和广泛应用,社会生活对计算机系统的依赖逐渐加深,信息安全事件对社会的影响日益严重,信息系统的安全问题比过去任何时候都显得
在电子商务活动过程中,企业与企业之间需要交换各种数据,这些数据分别由不同的应用产生,具有不同的数据格式和商业意义。如何在企业之间传输和处理这些数据,实现商务流程的自动化