基于依存的机器翻译自动评价方法

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zeroii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着机器翻译的不断发展,机器翻译评价技术也在不断发展中。最早出现的机器翻译评价方法是人工评价,人工评价方法的优点是能够得到准确的结果,但是也存在很严重的缺点。比如,采用人工评价方式需要耗费大量的人力和时间,并且评价结果不能在机器翻译研究开发过程中频繁使用。另一个问题是人工评价具有主观性,导致评价结果的一致性较差,比如,对于同一个句子,不同的评价人员可能给出不同的评价结果。人工评价方法的缺点限制了机器翻译的发展,而自动评价方法能够避免人工评价方法的缺点,速度快,成本低,对机器翻译的发展起到了很大的促进作用,已成为机器翻译发展的关键因素。目前,主流的机器翻译自动评价方法大都是通过比较机器译文和参考译文之间的相似度,来评价机器译文的翻译质量,这些方法还存在一些缺点。基于词汇的评价方法由于受到N-gram的限制,不能捕捉长度大于N的匹配子串。基于句法的评价方法需要对可能存在翻译错误的机器译文做句法分析,受限于句法分析的准确度。另一个问题是,这类评价方法中用到的子结构需要人工定义,并且不能表达出句法树中全部的信息,有一部分信息还会被重复计算。针对现有自动评价方法存在的这几个问题,我们提出了三种新的自动评价方法。  由于目前基于词汇的评价方法大都是基于N-gram的,这限定了机器译文和参考译文中可获取到的匹配子串的长度最长为N,大于N的匹配子串则不能捕捉。本文根据这个问题提出了基于译文完整性的评价方法,该方法根据机器译文中匹配上的词汇的分布情况计算其熵值,熵越大,说明匹配上的词汇在整个机器译文中的分布越分散。相反的,熵越小,说明匹配上的词汇在整个机器译文中的分布越集中。越集中的分布对应的译文越完整,流利性也越好。一个好的评价方法既要考虑译文的流利度,又要考虑忠实度,因此该方法中还加入了一元的F值用以捕捉对忠实度的评价。实验证明,该方法在目标端为英语和其他语言的语言对上都得到了较好的相关性。  基于词汇的评价方法主要考虑机器译文和参考译文在词汇片段上的相似性,忽略了对句法层面的评价。基于句法的评价方法引入了句法信息,但是他们大都使用机器译文和参考译文两端的句法树,而机器译文端潜在的翻译错误会导致句法分析的正确率降低,从而限制了句法信息作用的发挥。本文根据这个问题提出了基于依存相似度的评价方法。这种评价方法只对参考译文进行依存分析,使用参考译文的依存树和机器译文的串来计算相似度。实验证明,此方法在目标端为英语和其他语言的语言对上都得到了较好的相关性。  目前基于句法的评价方法需要人工在参考译文或机器译文的句法树中定义一些子结构,通过对比抽取的子结构的相似度来判断机器译文的质量。这些子结构一般会有长度限制,不能表达出句法树中全部的信息。另外,有一部分信息还会被重复计算,例如在一个节点同时支配几个子节点的情况下。为了避免这些问题,我们提出了一种基于依存分析模型的评价方法,该方法不需要人工定义子结构,而是由参考译文的依存树来训练依存分析模型,再使用该模型对机器译文进行依存分析,得到依存分析模型的分数,根据该分数就可以判断机器译文句子结构的正确性。为了同时捕捉词汇的相似度,该方法还加入了对一元F值的评价。实验表明,基于依存分析模型的评价方法在与人工评价的相关性上达到了较高的水平。
其他文献
土地评价是土地利用与规划的关键步骤,是土壤科学研究的主要内容之一。土地评价一直是一个较为复杂的问题,不同地区对农业生产具有不同的影响因子,各影响因子对不同的生产目标又
互联网作为一种交互式媒体,被越来越多的人用来表达自己的观点和态度。这些带有倾向性的主观性语言集中在Blog、论坛和留言之中,包含有大量信息,自动挖掘其中的观点和态度,具有十
科学数据网格是在中国科学院科学数据库海量数据资源的基础上,利用先进的数据网格技术,连接分布在全国四十多个研究所而建设的一个面向大规模分布式异构数据资源的共享平台和应
学位
随着计算机网络性能的不断改进以及虚拟现实技术的广泛应用,越来越多的工程协作编辑以及军事仿真演练系统都开始依赖于虚拟仿真平台。如何构建一个能够适应在目前网络条件下实
近年来,随着大数据时代的到来,构建面向开放网络的知识库已成为国内外工业界和学术界研究的一个热点。虽然目前国内外多个研究机构建立了很多知识库,但是这些知识库对开放网络的
网络技术的高速发展与普及使其成为信息交互的主要手段。随着网络规模的渐大,接入网络中设备的数量和种类也随之越多,然而,这些资源并没有得到充分的利用。如果能有效地利用这些
信息检索系统使用日益复杂的模型及技术寻求改进检索结果的质量,在所有查询上取得了更好的平均检索性能的同时,某些查询可能会得到远远差于基准结果的检索结果,这些难以预期的检
随着信息网络时代的演进,信息数据量呈爆炸式增长,每年的增量率在60﹪以上,并且这个速度还在不断增长.数据的爆炸性增长导致存储环境的复杂,管理难度越来越大.与此同时,数据的
学位
随着计算机技术的发展和进步,应用程序所使用的内存空间越来越大。程序所使用的数据不可避免地要存放在速度较慢的大容量存储设备中,而大容量存储设备的访问速度与处理器的执行