Recogniton of OfF-line Arabic Words using Sparse Coding with Spatial Pyramid Matching

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:mahuan616520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着手写文字识别技术的快速发展,阿拉伯语文字分类已日益引起研究者的关注。有两种阿拉伯语文字识别系统:联机和脱机文字识别。对于联机文字识别系统,需要使用特殊的数字化笔和绘图板来输入文字。在联机文字识别系统中,当使用设备获取输入时,我们可以观察到笔顺,压力和行程。然而,脱机文字识别无法获取上述信息,这使得脱机文字识别对研究者更具挑战性。  尽管根据地区的不同有不同的阿拉伯语口语,但存在一个标准的阿拉伯语用于阿拉伯世界各地的官方沟通,称为现代标准阿拉伯语(MSA)。阿拉伯字符的文本与其他语言有相似性,相似性最高的是波斯语,乌尔都语和阿拉伯语。随着时间的推移,书面阿拉伯语有了一些变化。所以通过使用某些技术,MSA可用于识别古阿拉伯文本。  很多种语言都使用阿拉伯语来书写,如波斯语,乌尔都语,辛达语,Jawi语,Pishtu语,俾路支语,奥斯曼语,柏柏尔语,哈萨克语,Dargwa语。阿拉伯语包含28个字符,其中16个字符包含点(点的数量可以从1个到3个,点可以在字符的上侧或下侧),这些字符的组合构成了单词。每个字母可以有多达四个不同的形状,根据其在单词中的位置而不同,即开头,中间,结尾或独立。阿拉伯语的书写有草书风格,所以阿拉伯文字分类需要特殊的分类框架。  为识别阿拉伯语语言,必须识别文字,数字和孤立的字符。阿拉伯语的预处理对于分类的作用非常重要,因此我们应用预处理步骤以提高识别率。一些数据集需要不同的预处理步骤例如分割,平滑,去除噪声,细化等。在特征提取步骤之前应用预处理可以提高识别率。我们使用的一个数据集PATS-A01,只需要将阿拉伯文字的一行分割成单词,因为该数据集是计算机生成的阿拉伯文本。  稀疏表示(SC)被用于计算图像表示,因为SC可以得到较低的重建误差。最后图像统计数据清楚地表明图像块是稀疏信号。选择性稀疏编码已被用来作为替代传统的矢量量化方法,以提取图像块的外观描述。通过使用稀疏编码,我们还可以在几个空间尺度上实现最大局部池,以包括矩和尺度不变性。  在这篇论文中,我们提出了一个使用稀疏编码和空间金字塔匹配(SPM)的阿拉伯语文本分类框架,使用线性支持向量机进行分类。SPM将每个特征集合映射到多分辨率直方图,该直方图在最精细的层次上保留了个体特征。然后使用加权的直方图相交计算来比较直方图金字塔。为了评估我们所提出的框架,我们使用4个公开的数据集:IFN/ENIT,PATS-A01,IFHCDB,ISI Bangla numeral。实验结果表明,我们提出的架构优于用于阿拉伯文字分类类的经典方法。
其他文献
选票识别是计算机选举系统用以支撑选举服务的关键技术之一,其由若干选票图像处理算法按执行顺序组合而成。作为选票识别中的算法,倾斜校正用于检测选举系统采集到的选票图像倾
随着信息化技术的不断发展,人们越来越多的将各种重要文档通过计算机编辑,通过互联网或者通过打印机打印后进行交流和传播。这些数字化技术和作品为人类生活带来便利的同时,
学位
侧信道攻击的出现打破了传统黑盒密码模型对攻击者能力的约束。传统黑盒模型中,攻击者只能获得密码设备的输入和输出;而在侧信道攻击模型中,攻击者还可以获得关于密码设备运
随着图像采集设备的快速发展,通过互联网共享的图像日益增多,图像数据动辄以TB计。需要有效地管理在线和离线的图像资料库。所以区分不同类别的图像是一项重要的工作。在计算
随着计算机三维可视化技术的发展,计算机辅助的三维颅面复原技术成为研究热点。颅面复原是对未知的人类颅骨进行面貌复原的技术,该技术主要用三维可视化技术对三维数据进行数
高分辨率的海量地形数据能够反映地形表面网格的细节特征,在军事环境模拟和地质灾害(如地震、泥石流)等研究领域有着重要的分析和监测应用。因为海量地形对应于地形表面均匀
距离变换是计算图像中每个点到最近的特征点的距离,将原本无意义的孤立的特征点表示为特征点与背景点的距离关系。距离变换对图像作出了更为丰富的表达,后续方法可以根据需要
随着普适计算的发展,上下文感知作为普适计算的核心部分,越来越得到大家的关注。上下文感知研究的是如何获取上下文、上下文的表示、以及上下文的推理等,其目的是为了利用上
数字图像处理系统在大图像处理性能与数据展示效果方面具有一定的缺陷,综合考虑系统本身的GIS背景以及GIS技术面向海量数据的特性,本文拟通过引入GIS技术来弥补这些缺陷。经