在联机手写中文识别中一种针对8方向特征提取的改进算法

来源 :中国中文信息学会二十五周年学术会议 | 被引量 : 0次 | 上传用户:yufeng_09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这篇论文中,我们为联机手写识别提出了一种新的特征提取算法,它是针对我们以前用8-方向特征的工作[2]一种改进方案.这个新方法和老方法关键一点不同在于,在新方法中,非线性变化后的联机手写字符轨迹上每个特征点上的方向并不是由它本身决定的,而是通过找到非线性变化前后轨迹之间的对应关系后,最终轨迹的方向取了非线性变化前的方向.这点改进带来了约10%的错误减少率.我们的新方法不仅指出了前人在提出非线性归一化用于中文字符识别时候的考虑不周之处,还给出非线性归一化在联机手写字符中使用的时候的一种弥补方案.除此之外,在这篇文章中我们还将更加详细的解释联机手写中文识别中预处理的过程,并且补充一些最新的实验结果.我们最新的实验在不仅在香港大学手机和PDA联机中文手写数据库得到了验证,并且在日本Nakayosi和Kuchibue数据库也得到了验证.在日本数据库上的实验结果显示,利用我们的特征提取方法,即使我们使用最简单的1个模板的最小误差分类器或者1最近邻分类器,针在Kanji的识别已经好于以前文献里用功能更强的分类器的识别结果.
其他文献
本文提出了一种基于规则的多层过滤进行机器翻译的方法.该方法实现了英语人名向维吾尔语的自动翻译.该方法不同于传统的机器翻译方法,它不需要建立丰富,完整的词库.本机器翻
会议
在科技文献中存在大量的中英文与公式的混排现象,如果在识别前能正确把它们进行区分并使用不同的0CR将可以极大地提高文档的识别正确率.本文通过结合两个不同的OCR识别结果以
碳酸镧(lanthanum carbonate)是一种新型非钙、非铝的磷结合剂,主要通过抑制胃肠道对血清磷的吸收起到降低血磷的作用,尤其适用于不能使用含钙磷酸盐结合剂的慢性肾病矿物质
特征降维问题是汉字识别研究的重要内容.本文将测地路径(geodesic paths)与非参数化降维相结合,提出了优化的降维方法.为解决大规模模式识别问题,本文同时给出了算法的化简策
目的 预测和对比单用二甲双胍血糖控制不佳的中国2型糖尿病患者加用利拉鲁肽或西格列汀的长期健康结果.方法 患者基线特征、治疗方案、治疗效果等数据来源于LIRA-DPP-4 CHINA
本文重点研究语音识别系统中信号的抗噪性前端处理方法.将线性预测(LP)分析与形态滤波结合作为语音识别的前端处理方法,并选用具有抗噪性的MFCC特征参数.将上述方法应用于基
随着计算机技术的迅速发展,各民族文字都面临着"信息化".西部大开发策略的实施,给我们少数民族文字的信息化带来了政策上的支持.为了把大量的书籍、报刊、单据、报表等"电子
语音识别是当今研究的热点,预处理技术是语音识别中的非常重要的环节.对于藏语语音识别的预处理研究,除了数字化语音信号必要的预处理技术外,本文重点研究藏语语音识别单元的
羟考酮为阿片 μ受体和 κ受体激动药,可以通过静脉或硬膜外给药.羟考酮硬膜外给药可增加局麻药的镇痛效果,减少胎儿体内代谢产物的蓄积.目前羟考酮硬膜外镇痛多用于剖宫产或
新的《航空卫生工作规则》颁布实施以来,为保证飞行安全,结合工作特点,积极探索新经验,总结以下做法。1 遵循一个原则坚持以《中国人民解放军空军航空卫生工作规则》为指导