论文部分内容阅读
该文从如下几个方面进行了研究:1.研究了英汉双语语料库词汇对齐技术.分析了词汇对齐需要解决的关键问题.提出了N-gram模型和迭代策略相结合的统计词汇对齐方法,有效地解决了间接相关问题,在提高统计正确率的同时实现了多词单元对应及领域新词、术语翻译的自动获取.在此基础上,综合利用词典和语言学知识实现了基于混合策略的英汉双语语料库词汇对齐.2.研究了英汉双语语料库结构对齐技术.探讨了双语语料库结构对齐的难点,提出了一种单语句法分析指导的英汉双语语料库结构对齐方法.以统计的双语语言模型-反向转换文法为基础,通过将英语句法分析知识融入到双语模型中,实现英汉双语的结构对齐.该方法充分利用现有的英语句法分析研究成果,避开了汉语句法分析的难题,同时保证了双语结构对齐的语法合理性,有效地提高了结构对齐的正确率.3.在词汇对齐和结构对齐基础上研究了翻译知识的自动获取方法.利用词汇对齐结果对现有的翻译词典进行扩充和完善,增加了新词和译文,并获取了初步的译文选择知识.利用结构对齐结果实现了短语翻译实例的自动获取.提出了基于双语语料库的结构翻译模板和译文选择模板自动获取方法,研究了基于语言学知识和错误驱动的机器学习算法的模板冲突消解策略.提出了基于双语结构对齐的汉语句法分析知识自动获取方法,为汉语句法分析的研究提供了一个崭新的思路.4.建立了基于双语语料库的翻译知识自动获取平台,利用该平台获取的翻译知识实现了一个英汉机器翻译原型系统.探讨了翻译系统的基本框架、翻译流程以及翻译过程中自动获取知识的调用策略.通过对机器翻译结果的评价验证了获取的知识的有效性和该文知识获取方案的可行性.