深度神经网络在维汉机器翻译中的应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ahmat716
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以深度神经网络为代表的新一代人工智能技术,已经为图像处理和语音识别等领域带来了颠覆性的变革。作为人工智能领域最为火热的研究方向之一,机器翻译迎来了前所未有的发展契机。工业界和学术界都认为,深度神经网络技术能够帮助机器翻译取得更好的结果。  神经网络技术在机器翻译上的应用分为两种类型:一种是利用神经网络技术优化改进传统的机器翻译系统,另一种则是拥有全新架构的神经机器翻译系统。传统的统计机器翻译模型由语言模型、翻译模型、调序模型等组成,前一种方法利用神经网络技术优化这些模块,后一种方法直接通过深度神经网络编码输入的句子信息并解码生成译文。  维汉机器翻译作为机器翻译领域的一个分支,有着语言跨度大、语言形态信息丰富等特点。由于维吾尔语句法分析、词法分析等语言学研究的滞后,难以通过加入语言学特征改善基于统计的维汉机器翻译模型性能,影响了维汉统计机器翻译系统译文质量的提升。  基于深度神经网络技术,本文针对维汉机器翻译所面临的译文语序问题和未登录词问题,提出了以下解决方案:  1.基于深度学习的调序规则表优化模型  针对维汉机器翻译中的译文语序问题,本文提出了一种基于深度学习的调序规则表优化模型。该模型由生成模块,判别模块和基于最小差异的过滤策略组成。生成模块利用递归自动编码机向量化调序规则,判别模块使用多层感知机对调序规则进行打分评价,基于最小差异的过滤策略针对调序规则表进行优化过滤。使用本模型优化后的调序规则表重新训练调序模型用于解码,可以加快维汉机器翻译最终的解码速度和提升最终的译文质量。  2.基于注意力的维汉神经机器翻译模型  针对维汉机器翻译中的长距离调序问题,本文提出了一种基于注意力的维汉神经机器翻译模型。该模型在一般的基于注意力的神经机器翻译的基础上进行改进,引进了外界的先验知识。基于注意力的维汉神经机器翻译模型在解码输出译文阶段,综合引入的外界汉语语言模型得分和神经机器翻译模型得分选出最优的候选译文。本模型有效的解决了维汉机器翻译中的长距离调序问题,适用于非规范性文本的翻译,比如口语翻译。  3.基于指针神经网络的维汉机器翻译框架  针对维汉机器翻译中的未登录词问题,本文提出了一种基于指针神经网络的维汉机器翻译框架。该框架由前处理模块,改进的基于指针的神经机器翻译模型和后处理模块组成。前处理模块规则化维吾尔语,使用修改过的语料训练一个改进的基于指针的神经机器翻译模型和一个短语翻译模型。改进的基于指针的神经机器翻译模型在转换网络的选择策略上偏向于指针网络,这使得指针网络的功能更加强大。后处理模块首先使用训练好的神经机器翻译模型将维吾尔语句子翻译成粗糙的译文,然后用训练好的短语翻译模型将粗糙的译文重译为最终的译文。该框架可以有效的解决维汉机器翻译中的未登录词问题,并改善译文质量。
其他文献
对于高分航空遥感图像的交通信息提取而言,对车辆目标的位置、朝向角和类别三要素的估计是开展后续一系列智能信息提取任务的基础和前提。对于现阶段常见的高分航空遥感图片而
维吾尔族和哈萨克族分别是新疆第一和第二大少数民族。维吾尔文与哈萨克文分别是新疆维吾尔族与哈萨克族群众在日常学习、工作和生活中使用的主要文字。新中国成立以来,我国的
社会化生产是人类社会生产力发展到高级阶段的必然形式。传统产业如机械制造业、化学工业、电子产业等都先后进入社会化生产阶段。在软件领域,为了解决“软件危机”问题,人们提
主题模型作为一种能够挖掘文本语义的技术受到了研究者的青睐,并且在业界得到了广泛的应用。在社交网络等领域中,主题模型是文本分类,检索以及推荐等应用的一项重要技术。  随
计算机系统的性能是评价计算机系统的重要指标,是用户和企业在选购和使用计算机系统时必须考虑但又很难把握的因素,这促使着性能评价作为一个新兴计算机技术并在不断发展。为了
沈阳海关计算机应用工作近几年发展较快,关区网络建设也已具有了一定的规模.依托此网络体系关区内应用了报关单联网数据传输,办公自动化关区连网等应用项目.沈阳关区网络应用
随着Internet/Intranet技术及应用的发展,很多企业建立了自己的计算机网络,并实现了与Internet的互联,网络安全就成为一个需要迫切解决的问题.防火墙作为保护企业内部网的主
随着因特网的高速发展,信息过滤技术已成为当今计算机信息处理领域最热门的技术之一.在该论文中,系统地介绍了作者作为主要人员参与研制的文本过滤系统FDFilter的主要框架和
该文首先介绍了什么是地理信息系统,它研究的主要内容和实现的方法.然后在第二章介绍了专家系统的结构、原理以及农业专家系统近年来的发展情况,并探讨了地理信息系统与专家
传统的计算机图形学在生成真实感图像上遇到了很大的障碍,这里主要有两个方面的原因,首先是因为物体的表面模型很难准确获取,其次是由于绘制过程计算比较复杂.基于图像的建模