论文部分内容阅读
随着手写文字识别技术的快速发展,阿拉伯语文字分类已日益引起研究者的关注。有两种阿拉伯语文字识别系统:联机和脱机文字识别。对于联机文字识别系统,需要使用特殊的数字化笔和绘图板来输入文字。在联机文字识别系统中,当使用设备获取输入时,我们可以观察到笔顺,压力和行程。然而,脱机文字识别无法获取上述信息,这使得脱机文字识别对研究者更具挑战性。 尽管根据地区的不同有不同的阿拉伯语口语,但存在一个标准的阿拉伯语用于阿拉伯世界各地的官方沟通,称为现代标准阿拉伯语(MSA)。阿拉伯字符的文本与其他语言有相似性,相似性最高的是波斯语,乌尔都语和阿拉伯语。随着时间的推移,书面阿拉伯语有了一些变化。所以通过使用某些技术,MSA可用于识别古阿拉伯文本。 很多种语言都使用阿拉伯语来书写,如波斯语,乌尔都语,辛达语,Jawi语,Pishtu语,俾路支语,奥斯曼语,柏柏尔语,哈萨克语,Dargwa语。阿拉伯语包含28个字符,其中16个字符包含点(点的数量可以从1个到3个,点可以在字符的上侧或下侧),这些字符的组合构成了单词。每个字母可以有多达四个不同的形状,根据其在单词中的位置而不同,即开头,中间,结尾或独立。阿拉伯语的书写有草书风格,所以阿拉伯文字分类需要特殊的分类框架。 为识别阿拉伯语语言,必须识别文字,数字和孤立的字符。阿拉伯语的预处理对于分类的作用非常重要,因此我们应用预处理步骤以提高识别率。一些数据集需要不同的预处理步骤例如分割,平滑,去除噪声,细化等。在特征提取步骤之前应用预处理可以提高识别率。我们使用的一个数据集PATS-A01,只需要将阿拉伯文字的一行分割成单词,因为该数据集是计算机生成的阿拉伯文本。 稀疏表示(SC)被用于计算图像表示,因为SC可以得到较低的重建误差。最后图像统计数据清楚地表明图像块是稀疏信号。选择性稀疏编码已被用来作为替代传统的矢量量化方法,以提取图像块的外观描述。通过使用稀疏编码,我们还可以在几个空间尺度上实现最大局部池,以包括矩和尺度不变性。 在这篇论文中,我们提出了一个使用稀疏编码和空间金字塔匹配(SPM)的阿拉伯语文本分类框架,使用线性支持向量机进行分类。SPM将每个特征集合映射到多分辨率直方图,该直方图在最精细的层次上保留了个体特征。然后使用加权的直方图相交计算来比较直方图金字塔。为了评估我们所提出的框架,我们使用4个公开的数据集:IFN/ENIT,PATS-A01,IFHCDB,ISI Bangla numeral。实验结果表明,我们提出的架构优于用于阿拉伯文字分类类的经典方法。