风格对抗网络和孪生网络在手写中文字符识别中的应用

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:Dream_624727
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写中文字符识别在文档检索、邮政分拣、票据转录等任务中有着广泛的应用。传统字符识别大多采用人工设计的特征,并在此基础之上利用机器学习模型对其进行分类。传统识别方法经过长时间研究取得了良好的进展,但是识别效果依然无法满足实际需求。近年来,随着GPU、TPU等并行计算硬件的发展以及深度学习理论研究的深入,基于深度学习的手写中文字符识别研究受到学术界的重视,其性能明显超过传统方法。然而,现有的深度学习模型也存在着不足,一是模型容易陷入对训练样本书写风格的过拟合,这将导致其在新书写风格样本上的分类性能大打折扣;二是现有的模型大多只适用于训练时确定了固定分类类别的闭集字符,对于闭集之外的新字符类别无法进行分类,这大大限制了模型的应用场景。为了解决上述问题,本文将深度学习中的风格对抗网络和孪生网络应用于手写中文字符识别任务,具体的研究工作如下:1.针对书写风格变化对识别性能产生影响的问题,提出了风格对抗网络SAN(Style Adversarial Network),通过字符识别与书写人识别的对抗训练,使得模型更好地抽取到书写风格无关的字符特征,从而提高模型的泛化性能。该网络包括三部分:特征提取器、字符分类器和书写人分类器。在特征提取器和书写人分类器之间加入梯度反转层GRL(Gradient Reversal Layer),使得反向传播时,特征提取器的参数朝书写人分类器梯度的负方向更新,从而抑制书写风格的过拟合倾向。模型在数据集ICDAR2013上取得了 97.27%的识别率,相比非风格对抗网络的模型高出0.39%。2.针对现有的网络只适用于类别预先确定的闭集问题,提出了适用于开集字符识别的孪生网络(Siamese Neural Network),该网络在训练阶段学习手写字符与字符判别模板之间的相似度,在预测阶段将手写字符多分类任务转换为手写字符与字符判别模板之间的多个二分类任务,从而实现开集上的字符识别。孪生网络具有两条结构不同、不共享权重的子网络,以此来适应不同的输入。通过在CASIA-HWDB1.0-1.2以及ICDAR2013上进行的一系列实验证明,本文提出的孪生网络在一级字符闭集的3755分类和二级字符闭集的3008分类任务上,准确率比现有最好的方法分别提高了 0.41%和1.9%。3.对适用于开集字符识别的孪生网络进行改进,提出了基于软注意力对齐的孪生网络 SNN-SAA(Siamese Neural Network-Soft Attention Alignment).软注意力对齐机制能够学习到手写字符和字符判别模板的相似特征的对应关系,从而更好的进行二者的相似度度量。软注意力对齐层通过计算手写字符和字符判别模板的注意力矩阵,对二者特征进行加权调整,从而使模型学习到相同笔划之间的相似性。通过在CASIA-HWDB1.0-1.2以及ICDAR2013上进行的一系列实验证明,加入软注意力对齐的SNN-SAA在一级字符闭集的3755分类和二级字符闭集的3008分类任务上,准确率相比非软注意力对齐模型分别提高了 4.92%和7.55%。
其他文献
近年来,随着社会的不断发展与进步,社会生产力水平不断提高,人类改造自然的能力逐渐增强,生态问题逐渐出现,生态系统的保护逐渐成为当今世界重点关注的话题。大连市为解决城
目的:黑色素瘤(malignant melanoma,MM)是一种高度恶性的皮肤肿瘤,占皮肤恶性肿瘤的第3位。具有转移早、侵袭性强、预后差的特点。黑色素瘤的发病率及死亡率在近30年来逐年上升
tRNA中存在着大量的转录后修饰,这些修饰是由四种基础核苷Uridine、Cytidine、Guanosine和Adenosine衍化而来。它们的存在对tRNA的结构和功能有很大的影响,其中碱基或核糖的
禽流感(Avian Influenza,AI)是由正粘病毒科流感病毒属A型流感病毒引起的家禽和野禽的一种从呼吸系统到全身败血症等多种疾病综合征,其中高致病性禽流感被国际兽医局列为A类
黑老虎是五味子科南五味子属植物冷饭团Kadsura coccinea(Lem.)A.C.Smith的根和藤茎,别名冷饭团、大钻,布福娜等;气香味辛、微苦,性温。在民间常用于治疗胃、十二指肠溃疡、
约束矩阵方程问题是指在满足一定约束条件的矩阵集合中求出方程的解.不同的约束条件与方程都将产生新的研究问题.约束矩阵方程在结构设计、参数识别、自动控制、振动理论、非
电力系统安全稳定运行是经济、社会发展的基础,但现代电网日益庞大的规模和繁杂的结构为其安全稳定形势带来挑战,随着风电并网容量增加,电压稳定问题更为突出。且电网结构或
边坡失稳是一种严重的地质灾害,灾害一旦发生就会造成大量人员伤亡与巨大财产损失,因此边坡稳定分析对于土工结构设计与灾害防治至关重要。同时,一些学者也认为,土压力与地基
盾构技术的不断发展和城市化进程的加快使得地下管网设施逐步完善,除地铁以外,盾构隧道开始被广泛应用于输水管道,水资源调配和蓄水排水等输水隧道越来越多。输水隧道可将水
在自然语言处理领域,实体间关系抽取技术通过检测非结构化数据中实体对间包含的关系类型,生成对应的实体-关系三元组结构化数据,它能极大提升后续信息抽取任务的工作效率,因此一直受到研究者的关注。传统有监督关系分类模型主要依赖的高质量训练数据集通常难以获取,因此基于远程监督的方法被广泛运用于实体关系抽取任务,该方法在少量已标注数据的基础上,快速生成大规模现实语料的关系标签。然而与有监督数据集相比,由于模板