国内几种翻译软件AI同传及语音翻译质量评估分析

来源 :校园英语·月末 | 被引量 : 0次 | 上传用户:beefshen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】AI同传的出现为翻译行业发展注入了新动力,同时也引起业内学者与专业译员们的极大关注:AI同传未来发展前景如何,翻译质量有无保证,能否取代人工翻译?此类讨论将研究者的视线聚焦在AI同传的核心技术——神经机器翻译上。在人工智能与大数据飞速发展的当今,越来越多的综合方法可应用于神经机器翻译技术的更新与完善。本文以3款融合AI技术的翻译软件为例,选取实用性原文素材为研究对象,参考权威口译质量评估标准,建立起一套评价标准,得出结论:AI同传及语音翻译译文仍未达到人工水平并存在较大差距,融合AI技术的神经机器翻译仍存在改进空间,如扩大语料库、增强学习功能与联想功能等。
  【关键词】AI同传;神经机器翻译;口译质量评估
  【作者简介】赵玉蓉,杨鑫,刘欢,龙玟月,杨茜,安超,阮先玉,西南石油大学。
  【基金项目】本文由2019四川省级大学生创新创业训练计划项目“大数据背景下AI同传翻译质量研究”(201910 615049)、西南石油大学第18期(2018-2019年度)课外开放实验重点项目(KSZ18C01)资助。
  一、引言
  自2016年起谷歌率先推出神经网络机器翻译系统NMT(Neural Machine Translation),机器翻译(Machine Translation)技术领域开始发生重大变革,机器翻译质量实现了大幅度提升。借助飞速发展的人工智能技术,国内各大互联网公司加快研發推广步伐,竞相推出融合了AI技术的翻译产品和服务。融合了AI技术且易获取的口译软件在得到广泛使用的同时也收获了大量反馈信息,无论是应用于口译实战,还是应用于大众生活,其翻译质量参差不齐,得到了褒贬不一的评价。
  二、国内几种支持AI技术的翻译软件翻译原理——神经机器翻译(Neural Machine Translation,简称NMT)简介
  神经机器翻译在翻译建模上不借用其他手段,只采用神经网络完成源语言到目标语言的转换。随着信息技术的进步、语言学理论的发展和人工智能技术的飞跃,引入神经网络的机器翻译对提高机器翻译效率和质量做出了重大贡献。但是,经典的机器翻译模型是一种通用的模型,并不完全针对机器翻译任务本身而设计,导致神经机器翻译仍然存在一些问题亟待解决。
  三、研究方法
  1. 使用软件与素材。本文选用3种为大型会议提供过AI同传服务的翻译软件(腾讯翻译君、讯飞听见、搜狗翻译),人声录入原文,将软件译文与标准译文对照,进行初步分析。
  本文选取的现场原文素材以及配套权威标准译文,内容涵盖国际会议演讲或致辞、历年政府工作报告、总理答记者问等。素材特点为:选词意义准确,表意清晰。多采用书面词汇、政治术语及复杂且长但逻辑性强的句式结构等,措辞严谨、精准,绝不会出现模棱两可、易生歧义等语句,文体正式化和语体口语化兼备的特点上。
  2. 分析理论——杨承淑的口译质量评估标准。台湾辅仁大学杨承淑提出的“量化”和“质化”理论是认可度较广的一种口译质量评估标准,评估项目及评分占比为:忠实(准确、完整)占50%,表达(明确、流畅)占30%,语言(语法、选词、风格)占20%,时间控制(原文与译文的时间比)以总分为基础上下浮动2%。由于该理论的对象为口译专业考试,在考试过程中时间有限的情况下,将时间控制一项纳入质量评估有一定的必要性。但在本项目研究中,对于时间控制没有过高要求,因此不做为重要评估标准参考。
  四、译文质量分析
  1. 译文错误类型及译文质量量化表。为了确保译文对比质量,本团队前期先完成6期素材的录入、整理和分析,总结出几种频繁出现的错误类型。在完成译文错误类型归纳的基础上,参考杨承淑的口译质量评估标准,制定出一套适用于本研究的评分标准,采用扣分制,对10期译文打分。错误类型、扣分细则及评分表如表1所示。
  2. 无错句的案例。无错句分为零翻译、完全相同翻译和基本标准翻译。零翻译指原文不需要做翻译处理,译文只需与原文保持一致,本素材译文中不存在此情况。完全相同翻译指的是机器译文与标准译文完全相同,可直接采用的情况。基本标准翻译指的是机器译文虽然与标准译文基本相同,有修改的余地,但不做改动也能表意清晰顺畅的情况,亦可直接采用或稍做修改。
  (1)完全相同翻译。
  原文:中华人民共和国成立70周年。
  标准:the 70th anniversary of the founding of the People’s Republic of China
  三个软件:the 70th anniversary of the founding of the People’s Republic of China
  (2) 基本标准翻译。
  原文:我们已经走上一条符合中国国情、适合时代要求的正确道路。
  标准: We have embarked on a right path that fits China’s conditions and is in keeping with the trend of the times.
  三个软件:We have embarked on a correct path that conforms to China’s national conditions and meets the requirements of the times.
  3. 典型的有错句案例。
  (1)词汇错误——用词(组)不当,导致语义错误或者偏差,与原文意思不符。
  例:将“位居前列”译为 “ranking first”(名列第一),与原文意思有出入。
  原文:国内生产总值达到67.7万亿元,增长6.9%,在世界主要经济体中位居前列。   标准:GDP reached 67.7 trillion yuan, representing an increase of 6.9% over the previous year-a growth rate faster than that of most other major economies.
  搜狗:The gross domestic product ...... ranking first among the world’s major economies.
  腾讯:The gross domestic product (GDP) ...... , ranking first among the world’s major economies.
  讯飞:......, an increase of 6.9%, ranking first among the major economies in the world.
  (2)句法错误——语法错误。
  例:使用现在分词做状语将“回顾历史”译为 “looking back on history”,但主句的主语为the economic globalization,不能与该状语构成主谓关系,是明显的语法错误。
  原文:回顾历史,20世纪兴起的经济全球化,起初只是西方发达国家、或者说是地中海文明的经济全球化。
  搜狗:Looking back on history, the economic globalization that arose in the last century ......
  ——生硬直译,导致不能表意。
  原文:坚决打好蓝天保卫战。
  标准:We will make our skies blue again.
  讯飞:Fight against the blue sky!
  (3)段落错误——语义分析错误,导致表意有误。
  例:将“背水一战”译为 “the spirit of the first World War”,对该词组语义理解有误。
  原文:您在报告里讲改革要有壮士断腕的决心、背水一战的气概
  腾讯:In your report, ...... the determination of a strong man to break his wrists, the spirit of the first World War......
  (4)其他错误。原文:40年来,达沃斯小镇以其独特魅力,已经成为中国观察世界、交流思想、阐述主张和谋求共识的重要平台。
  标准:Over the past four decades, Davos, this lovely small town ......
  讯飞:the Davos small town apparatus apparatus has been so attractive ......(乱译)
  4.定量分析。本文10期素材统计得出素材原文小句总句数为508句,各软件所译有错误译文小句总句数统计情况为:搜狗154句、腾讯187句、讯飞162句,基本标准译文小句总句数统计情况为:搜狗99句、腾讯95句、讯飞120句。
  按评估标准对十期素材进行打分,并计算平均分,所得结果如下:搜狗88.35分,腾讯87.85分,讯飞85.1分。
  5.原因分析。(1)词汇。词汇的问题在于英语词汇普遍一词多义,AI口译软件无法准确选取最恰当的词义,这是机器翻译历来为人诟病的弊端之一。从本项目研究过程来看,基于深度学习的神经机器翻译在这方面已有一定改观。(2)语料库。AI口译软件译文中许多类型的错误都是由于语料库的明显不足。由于语言具有动态性,而神经机器翻译为了加快训练速度,会将双语词典限制在一定范围之内,语料不足必然导致翻译质量的降低。(3)语法。AI口译软件翻译单句的语法结构与源语语法形式一致,而未顺应目标语言的语法内涵,造成一些明显的语法错误,无法将原文隐性逻辑理清理顺并体现在译文语法结构中。(4)语境。胡壮麟曾将语境归纳为三类:语言语境即语篇的上下文,情景语境即语言交流的环境、方式、条件和参与者等,文化语境即语言产生的人文背景等。语境本身就很复杂,对于神经机器翻译来说,无疑更是巨大的挑战。首先,在语言语境方面,AI口譯软件译文缺少衔接词,连贯性较差等问题,一方面可能与神经机器翻译的源语分析能力有关,神经机器翻译无法识别分析词汇或各句语境的统一关系或独立关系;另一方面与其可译句子长度的受限有关,由于句子长度限定在一定词数范围内,同一语境下超出限制部分的词句无法整合到同一逻辑关系或语法结构中,导致断句错误等问题。其次,在文化语境方面,即结合源语文化背景处理译文方面,由于文化是多种因素结合的产物,其蕴含在语言中的广度与深度表达,要求译员要具备丰富的文化常识和敏锐的学习观察能力。神经机器翻译具有一定的长时记忆,对于文化常识也有一定的内存储备,但根据分析过程中出现的诸多问题来看,这种记忆联想和学习能力还远远不够。
  五、结论
  1. 综合评价结果。参照翻译理论和口译质量评估标准,本文从词汇、句法、段落以及软件自身其他问题四个方面,将三个软件的AI同传及语音翻译译文与标准人工译文进行对比分析,得出定量和定性分析结果显示,三种软件的AI同传及语音翻译质量基本在同一水平。整体上,人工翻译译文质量优于三个软件的AI同传及语音翻译译文质量,后者翻译质量仍有待提高。2.研究启示。(1)提高神经机器翻译源语分析能力是解决神经机器翻译诸多问题的根本。目前针对该问题,改善注意力机制已成为研究热点。将大数据应用到神经机器翻译系统中,其语言学习能力或许能得到增强。(2)扩充神经机器翻译语料库规模。当前神经机器翻译为了加快训练速度,将语料库规模限制在一定范围内,也限制了系统的联想预测能力。(3)AI口译结合人工翻译及译员不断自我提升的必要性。本文认为,神经机器翻译与译后编辑结合,能大大节省译员的时间与精力,并有效检验、修正机器译文的错误。这不仅对翻译标准研究提出了要求,还对译员个人素质与技能水平做出了要求。AI口译的进步必然与人工翻译的进步紧密相连。 3.本项目的局限性由于时间、精力、能力和篇幅有限,另外出于便利统计和整理的目的,本文仅能通过案例研究的方式对三种软件的AI同传或语音翻译质量进行评估,样本类型不够丰富,量化数据只作为一项参考指标,意在探寻量化分析的可能性。因此,本文建议未来研究可由翻译界和其他相关学界专家合作进行,融合多学科研究方法,将翻译与科学技术尤其是AI技术紧密结合,建立实用可行的评估模型,积极探索AI同传及语音翻译质量评估与改善的新途径。
  参考文献:
  [1]姜敏浩.政府工作报告特点及英译策略研究[J].学周刊,2015(30): 18.
  [2]杨承淑.口译教学研究:理论与实践[M].北京:中国对外翻译出版公司,2005.
  [3]李梅,朱锡明.英汉机译错误分类及数据统计分析[J].上海理工大学学报(社会科学版),2013,35(03):201-207.
  [4]孙逸群,周敏康.机器翻译质量综合评价方法研究[J].中国科技翻译,2017,30(02):20-24.
其他文献
【摘要】采用信息化技术手段融入英语课堂教学,革新传统的教学方法,可以增强英语课堂学习的趣味性和实效性。在日常的 英语课堂教学 活动中,适当运用信息技术手段整合网络优质教学资源,活化英语课堂教学内容,优化英语课堂教学结构,建设英语资源库供学生开展网络学习,提高学生英语学习的课外学习能力,拓展英语课后学习的深度和广度。  【关键词】教学手段;教学设计;英语课堂;信息技术  【作者简介】陶季芳,江苏省泰
【摘要】一直以来,高职学生有英语基础薄弱,学习兴趣不高等问题。加之,传统课堂教学法以教师为中心,难以提高學生的英语综合能力。为改善现状并解决问题,通过分析和探讨交际法的应用途径,本文认为在高职英语教学中应用交际法,可以帮助学生明确学习动机,加强语言应用能力。  【关键词】交际法;高职英语;教学;应用;分析  【作者简介】任艳,包头职业技术学院。  引言  为了培养出拥有跨文化交际能力的复合型技能人
【摘要】随着经济发展和科技进步,移动学习已然成为当代大学生日常学习英语词汇的普遍方式。本文以南昌某高校大学生为调查对象,通过问卷调查收集数据并对数据进行分析,呈现出各大词汇学习软件在当代大学生移动学习中的应用情况,继而分析了词汇学习软件的优势和劣势,并提出了相应的建议。  【关键词】英语词汇学习;学习软件;移动学习  【作者简介】张栋城,胡妮,裘以韬,李清燕,王慧玲,皮常鼎,孙嘉朗,南昌航空大学外
【摘要】插图在小学英语对话教学过程中的应用,能够直观的呈现出文本中表达的内容,具有情景延续的功能,并且小学英语教材中的插图使静态化教学转变成动态化教学,通过以图助导、以图助读、以图助说、以图助写的策略,激发学生对英语对话学习的兴趣,提高英语学习的质量和效率。本文主要分析了小学英语对话教学中,教师如何使用插图开展英语教学。  【关键词】小学英语教学;英语对话教学;插图应用策略  【作者简介】韩红英,
【摘要】随着新课改深入发展,教学手段及育人思想得以变革,为实现教育目标,培养学生核心素养奠定基础,其中新课标要求扩充学生英语词汇量,适当引导学生阅读英语课外文学,拓展英语知识吸纳途径,有效培养学生跨文化意识,提高学生英语听说读写等能力,使学生英语核心素养得以提升。本文通过对新课标高中学生英语词汇量与阅读能力之间的关系进行分析,以期为提高高中英语教学综合质量提供依据。  【关键词】新课标;高中英语;
【摘要】沉浸式教学法起源于六十年代的加拿大,是一种全新的第二语言教学模式。沉浸式教学法旨在为目标语言创设环境,让目标语语言习得从无意识输入到有意识的输出。再通过听、说、读、写和情景实践活动,让语言习得自然地融入到沉浸式教学法的语言环境中,进而逐步发展学生的语言运用能力,形成目标语言的思维习惯,达到灵活运用目标语言的目的。本文介绍了初中英语教学中使用沉浸式教学法的理论依据,阐述了教学实践中运用沉浸式
【摘要】根据主题分类有效记忆词汇能摆脱传统的记忆模式,变被动记忆为主动学习、积极探索,帮助学生改进词汇记忆策略,鼓励他们多思考、多积累,从而找到适合自已的最佳记忆方法。  【关键词】主题分类;联想记忆;词汇网络;有效记忆;核心素养;语言运用能力  【作者简介】孙丽萍,滨州一中。  前言  衡量英语能力高低的标准之一是词汇量的大小。然而,大部分高中生在学习英语词汇时靠死记硬背,既低效又无趣。因此,培
【摘要】本文采用问卷调查的方式,以英语学习逆商与英语成绩的相关性为研究目的。对700名黔南地区高中生进行了问卷调查。研究发现:1.高中生英语学习逆商与英语成绩呈现正相关关系。2.在影响范围这一维度当中,结果显示该维度对学生英语成绩的影响可忽略不计。  【关键词】逆商;高中生;英语成绩  【作者简介】周洪丽,黔南民族医学高等专科学校。  一、研究背景  美国学者Paul于1997年,基于当时世界上著
【摘要】英语是一门语言类学科,教学语言类学科最主要的就是培养学生在听、说、读、写四个方面的能力。在素质教育的背景下,英语教学需要教师以学生为主体,并根据教学内容,选择学生感兴趣的教学方式,充分发挥学生在课堂的主观能动性,从多个方面培养学生的语言能力。  【关键词】小学英语;语言能力;提升  【作者简介】马文婷,银川西夏德胜小学。  在全球化的背景下,英语作为一门国际通用语言,其重要想不言而喻。长期
【摘要】将人工智能技术应用于高职英语教学互动当中,推动着教学模式创新的步伐,改变了学生的学习方式,同时,有效的提高了课堂效率。本文就人工智能技术在高职英语教学互动中的运用为研讨对象,对其具体的实施策略进行简单的论述。  【关键词】人工智能;高职英语;实施策略  【作者简介】吴敏,西安铁路职业技术学院。  随着人工智能技术的出现,标志着人们的文明又进入了一个新纪元,随之而来的是各种高科技产物,如电子