论文部分内容阅读
随着近年来机器翻译的新一次研究浪潮的兴起,研究人员已经认识到机器翻译评测对机器翻译的关键技术及市场推广的重要推动作用.该文主要讨论的就是汉英机器翻译评测方面的研究工作和成果.当前,评测的研究方向主要集中在两个方面:一是评测什么.二是怎样评测.很多组织相继制定出评测的框架及具体的评测方法,如ISO9126框架、EAGLES的主体框架模型、还有就是南加州大学信息科学学院制定的FEMTI评测框架.这些框架的都很看重对评测的需求定义,因为只有明确需求之后,评测才对评测的使用者有价值.在评测的具体方法部分,研究人员都在向着自动化的评测方向进行努力.许多语言处理中的技术都被应用到机器翻译的评测中来.这些方法包括:编辑距离、n-gram共现统计、未被翻译的词的数目、名词实体翻译、句法正确性、领域术语翻译、信息单元翻译等,但是这些译文评测的技术还是不能完全的替代人工评测,需要做的工作还有很多.汉英机器翻译在国内的计算语言学研究一直是一个重要的领域.由于汉语自身具有的特点,汉英机器翻译必须包括一些特殊的处理模块.对这些处理模块的评测也就成了汉英机器翻译评测独特的地方.汉英机器翻译评测包括:分词与词性标注评测、短语结构分析标注评测、译文质量评测.在OpenE评测系统中,译文质量的评测采用了一种新的评测方法,这种新的方法以BLEU和NIST的基于n-gram共现的评测框架为基础,同时加入了新的片段权重自动计算方法.这种权重计算方法不但使用了一个参考译文库用于统计片段的局部出现频度,而且还使用了一个大的全局语料库用于统计片段的正常出现频度,而权重的计算就是由局部频度和正常频度组合之后计算出来的.实验证明,这种新的权重计算方法能够有效的探测片段的重要程度,对机器翻译的译文评测来说是比较适用的.