汉英机器翻译的自动评测研究

来源 :东北大学 | 被引量 : 0次 | 上传用户：qwedddessf

【摘要】

：

随着近年来机器翻译的新一次研究浪潮的兴起,研究人员已经认识到机器翻译评测对机器翻译的关键技术及市场推广的重要推动作用.该文主要讨论的就是汉英机器翻译评测方面的研究

【作者】

：

孙连恒

【机构】

：

东北大学

【出处】

：

东北大学

【发表日期】

：

2003年期

【关键词】

：

自然语言处理机器翻译评测 n-gram共现

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着近年来机器翻译的新一次研究浪潮的兴起,研究人员已经认识到机器翻译评测对机器翻译的关键技术及市场推广的重要推动作用.该文主要讨论的就是汉英机器翻译评测方面的研究工作和成果.当前,评测的研究方向主要集中在两个方面:一是评测什么.二是怎样评测.很多组织相继制定出评测的框架及具体的评测方法,如ISO9126框架、EAGLES的主体框架模型、还有就是南加州大学信息科学学院制定的FEMTI评测框架.这些框架的都很看重对评测的需求定义,因为只有明确需求之后,评测才对评测的使用者有价值.在评测的具体方法部分,研究人员都在向着自动化的评测方向进行努力.许多语言处理中的技术都被应用到机器翻译的评测中来.这些方法包括:编辑距离、n-gram共现统计、未被翻译的词的数目、名词实体翻译、句法正确性、领域术语翻译、信息单元翻译等,但是这些译文评测的技术还是不能完全的替代人工评测,需要做的工作还有很多.汉英机器翻译在国内的计算语言学研究一直是一个重要的领域.由于汉语自身具有的特点,汉英机器翻译必须包括一些特殊的处理模块.对这些处理模块的评测也就成了汉英机器翻译评测独特的地方.汉英机器翻译评测包括:分词与词性标注评测、短语结构分析标注评测、译文质量评测.在OpenE评测系统中,译文质量的评测采用了一种新的评测方法,这种新的方法以BLEU和NIST的基于n-gram共现的评测框架为基础,同时加入了新的片段权重自动计算方法.这种权重计算方法不但使用了一个参考译文库用于统计片段的局部出现频度,而且还使用了一个大的全局语料库用于统计片段的正常出现频度,而权重的计算就是由局部频度和正常频度组合之后计算出来的.实验证明,这种新的权重计算方法能够有效的探测片段的重要程度,对机器翻译的译文评测来说是比较适用的.

其他文献

消息中间件的研究及在多银行代缴费平台中的应用

该论文是结合沈阳供电公司利用多银行代缴居民电费的具体项目完成的.在项目实施前的调研阶段,详细了解了供电公司居民电费收取的现状和银行利用中间业务平台进行代收代付业务

学位

消息中间件MQSeries分布式应用代收代付

人工神经网络在入侵检测中的应用

本文是在天涯科技公司入侵检测系统算法设计的基础上完成的。主要研究人工神经网络非线性数学模型和计算方法的计算机程序实现，为实现复杂入侵检测信息的非线性整合处理提供技

学位

神经网络(ANN)BP算法入侵检测专家系统

松下网络OCR后处理系统

该论文描述了一个专为松下网络OCR引擎开发的OCR后处理系统.这个OCR引擎使用的是比较新但还不成熟的技术,现在它的词层识别正确率仅有50％.我们的OCR后处理系统是用来提高OCR引

学位

OCR后处理统计语言模型编辑距离大规模加标语料

可视化的光谱分析

该文综述了光电光谱分析技术的现状和未来发展趋势,阐述了可视化技术的概念及其发展趋势,进一步提出开发可视化的光谱分析应用软件是当前发展光谱分析技术所面临的课题之一.

学位

可视化光谱分析数据传输Null调制解调器拟合工作线校准工作线

水电仿真中主变压器系统的设计与实现

丰满水电仿真系统的开发目标是建立一个对实际电厂水力发电机完全仿真的环境，用于对学生进行培训，达到完成培训后即可上岗工作的要求。全套仿真系统基于计算机进行开发，采用了先

学位

水电仿真建模面向对象建模主变压器系统

基于电子商务标准cnXML的分布式注册机制研究

目前采用注册中心方式的电子商务注册机制主要有独立的注册库/知识库机制以及集中式注册中心机制。本方案主要采用了分布式的技术特点，基于cnXML标准体系的注册规范和消息服务

学位

电子商务cnXML分布式注册机制体系架构

面向流处理引擎Mars的容错机制研究

近年来互联网上数据的急速增长，其中很大部分是流数据，具有无序性、突发性、易失性、无限性等特点。流数据有较强的时效性，其实际价值随着时间的流失而减少。为了应对流数据的处

学位

流数据计算平台Mars引擎容错机制

基于深度学习的多模态情感识别算法研究

学位

UniEAP1.7组件框架分析及改进

UniEAP1.7是东软股份公司研究开发的通用企业应用平台框架.本论文主要是按照J2EE的多层模型来分析UniEAP1.7框架,并针对其存在的缺点提出改进方案.第一章主要讲述本课题的研

学位

UniEAP1.7(UniversalEnterpriseApplicationPlatform)UniEAP1.7(UniversalEnterpriseA

操作系统图形用户界面的研究与实现

图形用户界面提供了一种良好的用户与应用程序之间的交互机制，通过它，用户可以用鼠标、键盘等输入设备对屏幕上显示的构成用户使用界面的窗口、按钮、图标等界面构件进行直接操

学位

图形用户界面窗口管理中文信息处理鼠标驱动程序

汉英机器翻译的自动评测研究

其他学术论文