文本无关的维吾尔文笔迹鉴别方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:juhong0226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学的迅速发展,笔迹鉴别技术在信息安全、刑事侦查和经济安全等相关领域发挥了至关重要的作用。我国是一个多民族国家,维吾尔族是人口较多的少数民族之一,其主要分布于新疆地区。为满足我国多文种信息处理的迫切需要,提高新疆地区电子化水平,同时也为其它少数民族语种的笔迹鉴别研究作借鉴,维吾尔文笔迹鉴别技术成为近年来研究的热点。在线笔迹鉴别技术受设备、使用场所、获取途径等方面的限制。离线笔迹鉴别技术分为文本相关法和文本无关法。文本相关法依赖于精确的字符标记和切分,这类技术目前尚不成熟。因此,本文从文本无关角度进行研究。  目前文本无关的维吾尔文笔迹鉴别技术可分为两类:一类是全局特征提取法,该方法将笔迹作为纹理进行分析。另一类是局部特征提取法,该方法将笔迹局部像素的组成形式、出现频率等作为鉴别依据,较符合维吾尔文笔迹的特点。现有方法对旋转较敏感,笔迹图像发生旋转时,其特征提取过程受到影响,导致识别率降低。  根据维吾尔文笔迹特点,为进一步提高其识别率,本文主要研究内容如下:  ①为避免全局特征提取方法中笔迹纹理依赖于字符间组合形式导致识别率较差的问题,本文以笔迹局部像素的组成形式为基础,结合维吾尔文笔迹连写频繁的特点,提出一种利用笔迹下拐点分割笔迹轮廓并构建Codebook作为书写风格代表的方法。通过实验证明,该方法相比目前几种局部特征提取方法(网格窗口微结构特征、四维笔画方向特征、倾斜度方向特征和边缘笔画特征)中效果较为优秀的网格窗口微结构特征的识别率高,是一种符合维吾尔文笔迹特点的鉴别方法。  ②为克服笔迹图像旋转对特征提取和识别率造成的影响,本文提取笔迹中具有较好旋转不变性的SIFT特征,但其对于纹理丰富的图像效果较好,维吾尔文笔迹图像的纹理种类相对较少。另外,其关键点梯度方向和幅值由灰度值计算得到,为避免书写环境对笔迹信息的影响,本文采用二值笔迹图像。SIFT特征的效率受到一定影响。为进一步提高识别率,将其与一种简单的局部窗口特征结合。通过实验表明,该方法有效克服了笔迹图像旋转对笔迹鉴别造成的影响,是一种鲁棒性较好、识别率较高的方法。
其他文献
在如今信息爆炸的互联网时代,随着web文本数量的规模不断增大,人们要从这些海量的文本信息中快速有效地找到自己想要的信息,仅靠人工的分类方法是行不通的,而文本聚类技术正好凭
国民经济动员的目的是为了维护国家安全和非战争军事行动的需要,不断提高国民经济应急处理突发事件能力,将平时状态转换到战时状态时国民经济所进行的一系列活动,这个过程涉及军
自我复制是自然界中生物最基本的特点之一,是人工生命研究的重要内容。对自我复制的研究,不仅有助于探索生命的规律,促进生物学的发展,而且对新一代纳米计算机的实现起到推动作用
主题爬虫有选择性地采集互联网中网页资源,这些网页资源都必须是用户所给定主题相关的,即网页内容是用户所感兴趣的。在经典主题爬虫中,如果文档词项集与主题词项集没有相同词项
无线传感器网络(Wireless Sensor Networks, WSNs)是一种飞速发展的新兴网络,是将传感器节点随机部署在指定区域并自组织成的无线多跳通信网络。WSNs综合了传感、信息处理和嵌
随着计算机设备的不断更新换代和网络全球化的快速发展,数据库技术得到了越来越广泛的应用,数据库共享已经变成了一种普遍现象,越来越多的个人信息记录被不同的部门和机构大量收
近年来,无线传感器网络已经广泛应用于各种领域,且应用类型多种多样。无线传感器网络没有固定的基础设施,由一定数量的无线传感器组成。这些传感器节点是可移动的,带有RF收发器等
随着多媒体技术和计算机网络的发展,在数据库技术与计算机视觉的共同作用下,图像检索已经成数字图像处理的一个重要领域和研究热点。基于内容的图像检索技术优于传统的检索方法
近年来,由于互联网资源的逐渐多样化与分布式存储,基于P2P技术的分布式FTP搜索引擎已成为FTP资源搜索的研究热点,其中,索引技术一直是提高FTP检索效率的关键。针对FTP资源检
近年来,数字图像真实性的检测和判定已经逐渐成为图像自动化处理领域的一个重要分支。它非常广泛地应用于现代社会生活的各个方面,如司法取证,商标防伪,医学图像检测等。数字图像