论文部分内容阅读
现代社会中,人们的跨语言交互需求日益增多,计算机辅助的跨语言交互系统成为研究者们关注的热点。然而,由于系统处理自然语言的能力不足而产生的系统错误严重影响了系统性能,大大降低了其实用性。以人机对话的方式实现跨语言交互系统的错误纠正,为解决该问题提供了一个新的思路。本文针对跨语言交互中的错误检测和纠错对话问题,从口语翻译质量评估和错误检测、人机对话管理、纠错对话话语生成等几个方面展开深入研究,并最终建立纠错对话系统,实现了跨语言交互过程中的纠错。论文在该领域的贡献和创新点主要包括:
1.提出了基于循环翻译特征的口语翻译质量在线评估和错误定位方法。本文从循环翻译过程中提取口语翻译置信度特征,使用基于支持向量回归(SVR)的机器学习方法对人工主观译文质量评分结果进行拟合,实现了无参考译文口语翻译质量在线评估。根据该评估结果,本文进一步提出了翻译错误定位方法。实验表明,系统计算的翻译置信度得分与人工主观评测得分之间具有较高的相关度。循环翻译特征能够显著提高翻译置信度计算的准确度,基于SVR的机器学习方法可以有效拟合人工主观评测结果,并具有良好的推广能力。
2.提出了基于动态贝叶斯网络(DBN)的人机对话管理方法。本文将人机对话管理问题描述为包含用户话语输入信息的DBN模型,对话策略的生成不仅依赖于当前系统状态,同时也依赖于当前用户话语。系统状态、对话策略和用户话语都被看作DBN模型中的随机变量,模型参数即为表达随机变量依赖关系的条件概率分布,可以从对话语料中自动学习得到。DBN模型中,系统状态和用户语言的建模可以不依赖于话语语义表示或任务知识,因而可以作为一种与特定任务无关的通用对话管理方法。针对特定任务的实验结果表明,基于DBN的人机对话管理模型显示出较好的对话策略选择能力。
3.提出了基于统计的澄清式疑问句生成方法。该方法针对话语中的错误部分动态生成澄清式疑问句,系统可以据此发起纠错对话。本文提出两种方法对澄清疑问模式建模,分别是截取模型和对齐泛化短语模型,实现句子规划;提出利用统计机器翻译方法将澄清疑问模式转换为澄清式疑问句,实现表层生成模型。实验证明,在给定话语错误定位信息的条件下,澄清式疑问句生成模型可以有效模拟口语中的澄清提问形式,模型可以针对不同的错误情况生成合理的澄清式疑问句。
4.结合上述研究成果,建立纠错对话系统,实现跨语言交互过程中错误纠正。本文从四个方面描述该系统架构:语音识别和口语翻译错误检测、纠错对话策略生成、纠错对话话语解析、以及基于DBN模型的纠错对话管理。针对不同错误环境下的纠错实验表明,该系统可以有效检测跨语言交互过程中的系统错误并可以通过纠错对话有效实现错误纠正。