基于无监督学习字典的多文种文本无关笔迹识别

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:lyaner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能终端的不断普及,越来越多的设备每天采集海量的笔迹数据,笔迹数据的智能化分析已经成为一种趋势。其中笔迹识别作为笔迹智能化分析的一个热点,在信息安全、刑事鉴定、文物鉴定中有着广泛应用,因此得到了学术界和工业界的关注。  本文在学习国内外研究笔迹识别的基础上,重点研究了基于无监督学习字典的多文种文本无关笔迹识别。基于边缘概率分布的笔迹识别是一种传统人工设计特征的图像识别方法,本文首先使用该方法进行实验,然后研究了基于独立成分分析(IndependentComponent Analysis,ICA)字典模型的笔迹识别,并提出了基于稀疏自编码(SparseAutoencoder)字典模型的笔迹识别算法。基于边缘概率分布的笔迹识别首先使用边缘概率分布描述子对窗口块中笔迹图像提取特征,然后将所有窗口块的特征统一形成图像的特征长向量,最终使用KNN最近邻算法进行识别。基于独立成分分析字典模型的笔迹识别首先使用原始笔迹图像对ICA模型进行无监督训练,然后利用训练好的ICA模型结合词袋模型训练出字典,最后结合ICA模型和字典得到原始笔迹的特征描述并用分类器分类。基于稀疏自编码字典模型的笔迹识别首先利用稀疏自编码模型无监督地训练出笔迹权重,再结合所提出的词带模型算法框架训练字典。基于稀疏自编码模型算法在笔迹图像上提取的特征表现突出,与传统方法相比,本算法具有更高的识别率。  本文在HIT-MW中文笔迹数据库、IAM英文笔迹数据库以及它们的混合数据库上使用文中的方法进行实验,通过实验结果的分析对比,证明本文所提出的基于稀疏自编码字典模型的笔迹识别算法的有效性,在HIT-MW和IAM数据库上分别达到了95.44%和96.8%的首选识别率。同时本文对算法中影响识别率的因素做了细致的实验研究,分析了包括窗口大小、窗口数量以及实验原始数据量对识别率的影响。
其他文献
声子晶体是两种或两种以上的弹性材料按周期排列所组成的人工复合结构,由于其丰富的带隙特性在很多领域得到关注。作为一维压电声子晶体,声表面波器件在射频信号处理方面已得到
目的:探讨分析体外冲击波碎石治疗泌尿结石的临床效果.方法:选取本院收治的120例泌尿结石的患者为观察对象,结石大小
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
目的:探究采用高效液相色谱法(HPLC)的全自动血红蛋白分析仪进行血红蛋白分析联合地中海贫血基因检测对地中海贫血患者的诊断价值.方法:选取我院2016年1月—2018年12月间在我
目的:探讨血管内超声指导导丝通过技术开通冠状动脉慢性闭塞性病变的效果.方法:选取56例冠状动脉慢性闭塞性病变患者进行研究,随机分成对照组和观察组,各28例,对照组采取常规
目的:探讨委中放血配合腰部斜扳法治疗急性腰扭伤的临床效果.方法:选取我院2018年8月-2019年5月收治的急性腰扭伤患者116例,按双盲法分为参照组和研究组各58例.参照组实施红
为了满足人们日益增长的通信需求,移动通信系统正朝着高速、宽带、大容量、多业务和低成本的方向飞速发展,长期演进系统(LTE)即是上述趋势的产物。链路白适应技术作为一项LTE
目的:探讨对痔病患者行弹力线套扎吻合器以及胶圈套扎吻合器治疗的临床效果.方法:选择我院所收治的痔病患者,共117例,本次研究时间于2018年1月到2019年9月之间,将在期间患者
目的:研究社区干预对控制手足口传染病的效果.方法:以A市某社区2016年09月-2019年09月内搜集的500例儿童为研究对象,利用随机数表法将之分为对照组(250例)和实验组(250例).对
摘要:在初中时,他们是所在学校的骄傲,凭借自己的努力考上了梦寐以求的北中。但上了高中,跟城市的孩子相比,他们在学习上尤其是英语的很多不足开始暴露。本文通过跟踪调查,持续关注这一群体在初高中的衔接阶段高一这一学年英语学习方面所面临的问题并以此为契机,探讨解决这一问题的方法。学困生的形成有多方面的原因,笔者在此选择了占主要地位的社会原因、家庭原因及学校原因,通过调查问卷,与个别学生谈话,多年的教学记录