汉英机器翻译的自动评测研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:qwedddessf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来机器翻译的新一次研究浪潮的兴起,研究人员已经认识到机器翻译评测对机器翻译的关键技术及市场推广的重要推动作用.该文主要讨论的就是汉英机器翻译评测方面的研究工作和成果.当前,评测的研究方向主要集中在两个方面:一是评测什么.二是怎样评测.很多组织相继制定出评测的框架及具体的评测方法,如ISO9126框架、EAGLES的主体框架模型、还有就是南加州大学信息科学学院制定的FEMTI评测框架.这些框架的都很看重对评测的需求定义,因为只有明确需求之后,评测才对评测的使用者有价值.在评测的具体方法部分,研究人员都在向着自动化的评测方向进行努力.许多语言处理中的技术都被应用到机器翻译的评测中来.这些方法包括:编辑距离、n-gram共现统计、未被翻译的词的数目、名词实体翻译、句法正确性、领域术语翻译、信息单元翻译等,但是这些译文评测的技术还是不能完全的替代人工评测,需要做的工作还有很多.汉英机器翻译在国内的计算语言学研究一直是一个重要的领域.由于汉语自身具有的特点,汉英机器翻译必须包括一些特殊的处理模块.对这些处理模块的评测也就成了汉英机器翻译评测独特的地方.汉英机器翻译评测包括:分词与词性标注评测、短语结构分析标注评测、译文质量评测.在OpenE评测系统中,译文质量的评测采用了一种新的评测方法,这种新的方法以BLEU和NIST的基于n-gram共现的评测框架为基础,同时加入了新的片段权重自动计算方法.这种权重计算方法不但使用了一个参考译文库用于统计片段的局部出现频度,而且还使用了一个大的全局语料库用于统计片段的正常出现频度,而权重的计算就是由局部频度和正常频度组合之后计算出来的.实验证明,这种新的权重计算方法能够有效的探测片段的重要程度,对机器翻译的译文评测来说是比较适用的.
其他文献
该论文是结合沈阳供电公司利用多银行代缴居民电费的具体项目完成的.在项目实施前的调研阶段,详细了解了供电公司居民电费收取的现状和银行利用中间业务平台进行代收代付业务
本文是在天涯科技公司入侵检测系统算法设计的基础上完成的。主要研究人工神经网络非线性数学模型和计算方法的计算机程序实现,为实现复杂入侵检测信息的非线性整合处理提供技
该论文描述了一个专为松下网络OCR引擎开发的OCR后处理系统.这个OCR引擎使用的是比较新但还不成熟的技术,现在它的词层识别正确率仅有50%.我们的OCR后处理系统是用来提高OCR引
该文综述了光电光谱分析技术的现状和未来发展趋势,阐述了可视化技术的概念及其发展趋势,进一步提出开发可视化的光谱分析应用软件是当前发展光谱分析技术所面临的课题之一.
丰满水电仿真系统的开发目标是建立一个对实际电厂水力发电机完全仿真的环境,用于对学生进行培训,达到完成培训后即可上岗工作的要求。全套仿真系统基于计算机进行开发,采用了先
目前采用注册中心方式的电子商务注册机制主要有独立的注册库/知识库机制以及集中式注册中心机制。本方案主要采用了分布式的技术特点,基于cnXML标准体系的注册规范和消息服务
近年来互联网上数据的急速增长,其中很大部分是流数据,具有无序性、突发性、易失性、无限性等特点。流数据有较强的时效性,其实际价值随着时间的流失而减少。为了应对流数据的处
学位
UniEAP1.7是东软股份公司研究开发的通用企业应用平台框架.本论文主要是按照J2EE的多层模型来分析UniEAP1.7框架,并针对其存在的缺点提出改进方案.第一章主要讲述本课题的研
图形用户界面提供了一种良好的用户与应用程序之间的交互机制,通过它,用户可以用鼠标、键盘等输入设备对屏幕上显示的构成用户使用界面的窗口、按钮、图标等界面构件进行直接操