联机手写日文字符串识别

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:woaixuyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字识别作为模式识别的一个重要应用领域,在过去的几十年中已经取得了非凡的成就。单个字符的识别率非常高,已经达到了实际应用的需要,并被广泛地应用于电脑汉字输入、手机、PDA等产品。随着时间的推移,单字识别已经无法满足人们的需要。整行文字、整段文字甚至整篇文本的识别已经成为人们新的需求。   整行文字的识别即字符串的识别是整篇文本识别的基础。虽然前人在字符串识别的研究领域做了大量的工作,但是时至今日,字符串的识别仍然没有达到实际应用的需要,还存在着识别精度不高、切分错误多、识别效率低等缺点和不足。字符串识别的主要难点是字符在被识别之前不能准确地切分,一般的解决方法是把字符切分和识别统一起来,通过组合搜索得到最优的切分和识别结果。本文主要针对字符串识别中的识别精度和搜索效率问题展开研究,并将有关方法用于日文手写字符串识别。   本文的工作主要包括以下三个方面:   一、本文将几何上下文信息与单字识别信息和语言上下文信息一起加入到字符串识别系统的路径评价准则,包括单字几何信息(一元几何信息)和字间几何信息(二元几何信息),提高了字符串的切分和识别精度,取得了很好的效果。   二、针对目前基于联合切分识别方法的字符串识别系统在搜索最优路径方面存在的搜索效率问题进行了研究,实现了字符同步搜索和时间同步搜索两种模式,并对这两种模式进行了深入分析和比较;同时提出一种改进的路径评价准则,使得动态规划算法可以应用于字符串识别过程中的最优路径搜索。   三、字符串识别系统中所用到的各种评价信息在度量尺度上不统一,本文采用置信度转换的方法,将分类器的输出(距离相似度量)转换成概率的形式,使参数调整更为方便。
其他文献
以太网以其成本低廉、开放性和兼容性好等优点,目前已成为使用最为广泛的网络通信技术,是商业领域中网络通信市场的主要占有者。随着其速率的不断提高和全双工交换技术的运用
睡眠是一项非常重要的生命过程,是人体重要的生理活动,它与人的健康、学习、生活、工作等之间的关系甚为密切,但至今人类对其了解还很少。失眠是一种最为常见的睡眠障碍性疾
基于结构光系统的物体三维轮廓测量技术,由于具有测量速度快、非接触式等好的特性,因而在科学和商业领域得到了广泛的应用。一个基本的结构光系统包括一个相机和一个光栅条纹投
近红外光谱(简称NIRS)作为一种现场、快速、无损、无污染的绿色分析技术,近年来,被广泛应用于石油化工、食品药品、制药等行业。随着精密分析仪器的广泛使用,产生的高维、海量NIRS
随着人机交互技术的发展,越来越多的实际产品中采用了较传统方式而言更为友好的人机交互形式。而语音合成技术,作为人机交互技术中的关键技术之一,已经被广泛的应用到许多嵌入式
从二维图像恢复三维物体可见表面的几何结构(称为三维重建)是计算机视觉的主要目的之一。三维重建的一个关键步骤—图像对应点的确定也是计算机视觉中的一个基本问题。目前国
学位
自20世纪90年代中期开始,非真实感绘制(NPR)逐渐成为计算机视觉和计算机图形学的研究热点之一。   非真实感绘制和传统真实感绘制的研究内容不同,其研究的目标不在于绘制结
当前,开发具有完全自主功能的智能移动机器人尚未成熟,但是通过Internet提供的方便开放的人机交互接口,在机器人的遥操作过程中融入操作者的智能与经验,使移动机器人具备在室内不
人类与灵长类的视皮层目标识别性能远远优于最佳的机器视觉系统。因此,自上个世纪50年代起人们开始关注生物视觉启发的计算机视觉模型的研究。1999年,Riesenhuber和Poggio提出
说话人的地方口音、非母语口音是汉语普通话语音识别系统实现推广应用面临的具有挑战性的问题。云南是一个多民族的省份,大多数民族有自己的语言,少数民族在全省各市县均有分布