基于SVM-GA的小字符集脱机手写汉字识别

来源 :西华大学 | 被引量 : 0次 | 上传用户:zhensa9d
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字是历史悠久的中华民族文化的结晶,闪烁着中国人民智慧的光芒。汉字识别是一种难度非常大的模式识别。其中脱机手写汉字识别是目前最为困难也最具挑战性的研究课题。在办公自动化,机器翻译等方面,脱机手写体汉字识别也有着广泛的应用前景。因此对于脱机手写体汉字识别的研究不仅拥有深刻的理论意义,更包含着巨大的实用价值。本文探讨的主要内容是基于小字符集的限制性脱机手写体汉字识别,实验选取国标GB2312-80一级字库中的100类汉字,每类汉字采集108个样本,共10800个汉字样本。涉及的内容如下:首先,本文用专门设计的表格对年龄分布在18~60岁的不同职业、学历和性别的人群的手写体进行样本采集。专用表格使得在满足识别需要的前提下,简化了预处理步骤,提高预处理效率。特征提取是汉字识别过程中的关键环节。本文采用基于弹性网格划分的四方向线索分解特征。其中分别用基于笔画方向法和模糊子笔画提取法来对汉字笔画进行四方向分解,可在一定程度上避免基于轮廓的方法敏感于不同手写汉字笔画宽度与书写变形不足,又能改善基于细化的方法中所导致的模糊笔画以及低分辨率手写汉字笔画信息的丢失。支持向量机是在统计学习理论基础上发展出的一种性能优良的学习机器,其根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以求获得最好的推广能力。支持向量机始终存在的一个问题是它的执行效果依赖于参数的设置,其中包括惩罚因子和核函数,但却没有一个合适的理论来指导如何寻找适应于具体的样本数据的参数。本文将改进的自适应遗传算法跟支持向量机相结合,设计了一种自动优选支持向量机模型参数的方法。该方法根据适应度值自动调整交叉概率和变异概率,减少了遗传算法的收敛时间并且提高了遗传算法的精度。将该方法应用于脱机手写汉字的识别,结果表明由该方法所得的SVM具有较好的泛化能力。
其他文献
会议室作为一个单位商讨议题、研究决策、制定方案的办公场所,是一种非常重要的公共资源,其使用率相当高,当各个部门有重重要会议需要召开时,难免会引起会议室的使用冲突。为了避
随着全球信息化脚步的不断加快,人们对信息数据的要求越来越高,随着数据库技术的发展,如何在多元化的计算环境、分布式的网络环境中存取大量的、分布的信息以实现数据的共享,成为
学位
随着计算机网络的发展,人们的通信交流都发生了很大的变化,不再受地理位置的影响,可以很方便地通过计算机网络来共享数据、通信交流。网络服务应用系统正成为人与人之间联系的纽
贝叶斯网络是表示变量间因果概率的一种图形模型,以其坚实的理论基础、知识结构的自然表述方式、强大的推理能力成为人工智能领域中处理不确定性信息的有效工具。动态贝叶斯网
主动服务是一种可根据用户需求进行服务定制的Web服务,其实现机制是程序挖掘,它的实现涉及程序的复用和重组。构件技术的出现和发展,为实现主动服务开辟了可行的道路。组织一个
随着3G技术的日臻成熟,高数据吞吐的优势使得无线网络与移动手机的融合成为必然趋势,目前智能手机的不断普及,移动应用的需求也与日俱增。移动互联网因其具有随身性、可鉴权
在现代处理器开发中,早期空间探究设计是一个重要的因素。多核处理器的趋势导致了大规模体系结构底层的复杂性和异构性。随着多核处理器时期的到来,体系结构的设计、评价和最
随着网络的不断发展,安全的重要性越来越突出,原有的防火墙已经难以单独保障网络的安全,入侵检测系统开始发挥出不可替代的作用。然而,现有的入侵检测系统在有效性、适应性和
无线传感器网络从概念出现开始就引起人们广泛关注并被寄予厚望,在最近的几年内,各种无线传感器网络产品不断投入到生产、生活、科研等应用中,尤其近期温家宝总理关于“感知
IEEE 802.15.4标准是提供给低速率、低功耗和低成本设备使用的短距离无线通信协议并定义了低速无线传感器网络的MAC层和物理层规范。本文通过深入研究该协议标准,在低功耗的