手写汉字识别的特征提取与分类算法的研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:pkbaby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写汉字识别是模式识别领域中复杂而具有挑战性的一项重要课题。对人工智能,模式识别,计算机理论,心理学,语言学等领域有着重大的影响。虽然目前手写汉字识别的产品很多,但是多数是基于PC机的联机手写汉字识别或基于OCR技术的脱机字符识别。随着PDA,掌上电脑及手写手机的兴起和普及,对于基于嵌入式系统的手写技术的要求也就日益突出。 本课题是在S3C2410A硬件平台上构建了一个嵌入式联机手写体汉字输入、识别、显示系统。本系统以触摸屏作为基本的信息输入设备,完成图像的采集、信息的输入等,用三星公司的制造的一款型号为LQ3600-PE1的3.5寸TFT液晶屏作为输出。采集数据及数据预处理方法是:当触摸屏幕时,在规定时间内尽量采集数据,而不规定采集的次数,并且将所采集的数据都存到320*240的数组中,最后将采集的数据进行滤波,膨胀,腐蚀和细化等处理。这种做法的优点在于:尽量避免了由于抖动,书写的速度快而造成的数据丢失。 汉字特征直接反映着汉字形体整体或局部分布状况,良好的特征应该使同一种汉字的不同书写样本之间的差异性尽可能小,而在不同汉字之间的差异性尽可能大,根据手写体汉字的特点,对特征提取进行了分析研究,提出了,粗外围的特征、背景特征、弹性网格全局方向特征和层次轮廓特征,实验表明所提取的几种特征是有效的。 最小距离分类器在特征空间中,用一个基准模板作为某一模式类的代表,把待识别样本的特征向量与此基准模板之间的距离作为实现分类判决的依据。在统计模式识别方法中,往往把各类特征向量的统计平均值作为该类模式的基准模板,各待识别别样本的特征向量与此基准模板进行比较。用于比较的距离度量,根据问题的不同,可以有多种选择。本文提出了多级分类的并-串集成策略作为判别的方法。本系统以粗外围特征和背景特征作为粗分类的特征,分别用街区距离和欧式距离作为此特征判别的方法作为第一级粗分类特征。提取全局方向网格特征作为第二级粗分类特征。细分类特征采用层次轮廓特征,用局部最优匹配作为此特征判别,实现细分类功能。
其他文献
随着多功能多种类的通信应用层出不穷,人们在享受更为便捷、丰富和舒适通信质量的同时,也更多地会遇到声回声问题的困扰。回声消除技术能有效地解决免提电话、视频会议、长距离
信号融合是高层次的共性关键技术,在军事和国民经济领域有着广泛的应用前景.该文对检测和集团层信息融合中的一些关键技术以及传感器引导进行了较为深入的研究,提出了多种新
多/双基地雷达,是发射机和接收机分置的一种雷达体制,因为在现在战争中的“四抗”(抗标隐身技术、抗综合性电子干扰技术、抗低空超低空突防技术和抗反辐射导弹技术)作用而
语言是人类进行交流的重要手段,让机器听懂人类的语言,与人类进行自然的人机对话一直是人类的梦想。近年来语音识别技术的研究取得了很大的进展,基于语音识别技术的智能化设备将
齐鲁胜地,物华天宝,人杰地灵。受历代丰腴文化的浸润,这块土地上培育造就了众多星光耀眼、引人瞩目的文人墨客。当代中国画名家王本诚先生,就是其中的一位。王本诚,字大愚,迂
软件无线电平台如今广泛的运用在无线通信领域的各个方面,因为软件无线电平台具有开发成本低,开发灵活,兼容性好等特点,软件无线电平台在通信领域广泛使用。由于软件无线电平
雷达伺服系统特性的自动化测试对于系统的调试、维护等都具有十分重要的意义。系统特性包括:时域特性和频域特性。 传统的测试方法是时域、频域特性分别测试。 时域特性
本论文以基于USB接口的生理数据采集系统的研制过程为主要内容,详细阐述了利用南京沁恒电子有限公司的USB接口芯片CH372与ATMEL公司的AT89C52单片机实现上位机通过USB接口与下
本文所述的激光模拟打靶多路数据采集处理系统是在现有RS-485串行通信理论的基础上,根据部队实际群体训练需要,自行设计研发的一种多路串行通信系统。该系统分为两大部分:激
随着网络和计算机技术的发展,自动测控系统逐渐趋于网络化,以TCP/IP为协议栈的10M/100M以太网通信成为最近几年来比较流行的网络通信技术,广泛运用于自动化控制领域。 本文围