论文部分内容阅读
随着计算机科学的迅速发展,笔迹鉴别技术在信息安全、刑事侦查和经济安全等相关领域发挥了至关重要的作用。我国是一个多民族国家,维吾尔族是人口较多的少数民族之一,其主要分布于新疆地区。为满足我国多文种信息处理的迫切需要,提高新疆地区电子化水平,同时也为其它少数民族语种的笔迹鉴别研究作借鉴,维吾尔文笔迹鉴别技术成为近年来研究的热点。在线笔迹鉴别技术受设备、使用场所、获取途径等方面的限制。离线笔迹鉴别技术分为文本相关法和文本无关法。文本相关法依赖于精确的字符标记和切分,这类技术目前尚不成熟。因此,本文从文本无关角度进行研究。 目前文本无关的维吾尔文笔迹鉴别技术可分为两类:一类是全局特征提取法,该方法将笔迹作为纹理进行分析。另一类是局部特征提取法,该方法将笔迹局部像素的组成形式、出现频率等作为鉴别依据,较符合维吾尔文笔迹的特点。现有方法对旋转较敏感,笔迹图像发生旋转时,其特征提取过程受到影响,导致识别率降低。 根据维吾尔文笔迹特点,为进一步提高其识别率,本文主要研究内容如下: ①为避免全局特征提取方法中笔迹纹理依赖于字符间组合形式导致识别率较差的问题,本文以笔迹局部像素的组成形式为基础,结合维吾尔文笔迹连写频繁的特点,提出一种利用笔迹下拐点分割笔迹轮廓并构建Codebook作为书写风格代表的方法。通过实验证明,该方法相比目前几种局部特征提取方法(网格窗口微结构特征、四维笔画方向特征、倾斜度方向特征和边缘笔画特征)中效果较为优秀的网格窗口微结构特征的识别率高,是一种符合维吾尔文笔迹特点的鉴别方法。 ②为克服笔迹图像旋转对特征提取和识别率造成的影响,本文提取笔迹中具有较好旋转不变性的SIFT特征,但其对于纹理丰富的图像效果较好,维吾尔文笔迹图像的纹理种类相对较少。另外,其关键点梯度方向和幅值由灰度值计算得到,为避免书写环境对笔迹信息的影响,本文采用二值笔迹图像。SIFT特征的效率受到一定影响。为进一步提高识别率,将其与一种简单的局部窗口特征结合。通过实验表明,该方法有效克服了笔迹图像旋转对笔迹鉴别造成的影响,是一种鲁棒性较好、识别率较高的方法。