跨语言交互中的错误检测及纠错对话问题研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:edu009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会中,人们的跨语言交互需求日益增多,计算机辅助的跨语言交互系统成为研究者们关注的热点。然而,由于系统处理自然语言的能力不足而产生的系统错误严重影响了系统性能,大大降低了其实用性。以人机对话的方式实现跨语言交互系统的错误纠正,为解决该问题提供了一个新的思路。本文针对跨语言交互中的错误检测和纠错对话问题,从口语翻译质量评估和错误检测、人机对话管理、纠错对话话语生成等几个方面展开深入研究,并最终建立纠错对话系统,实现了跨语言交互过程中的纠错。论文在该领域的贡献和创新点主要包括:   1.提出了基于循环翻译特征的口语翻译质量在线评估和错误定位方法。本文从循环翻译过程中提取口语翻译置信度特征,使用基于支持向量回归(SVR)的机器学习方法对人工主观译文质量评分结果进行拟合,实现了无参考译文口语翻译质量在线评估。根据该评估结果,本文进一步提出了翻译错误定位方法。实验表明,系统计算的翻译置信度得分与人工主观评测得分之间具有较高的相关度。循环翻译特征能够显著提高翻译置信度计算的准确度,基于SVR的机器学习方法可以有效拟合人工主观评测结果,并具有良好的推广能力。   2.提出了基于动态贝叶斯网络(DBN)的人机对话管理方法。本文将人机对话管理问题描述为包含用户话语输入信息的DBN模型,对话策略的生成不仅依赖于当前系统状态,同时也依赖于当前用户话语。系统状态、对话策略和用户话语都被看作DBN模型中的随机变量,模型参数即为表达随机变量依赖关系的条件概率分布,可以从对话语料中自动学习得到。DBN模型中,系统状态和用户语言的建模可以不依赖于话语语义表示或任务知识,因而可以作为一种与特定任务无关的通用对话管理方法。针对特定任务的实验结果表明,基于DBN的人机对话管理模型显示出较好的对话策略选择能力。   3.提出了基于统计的澄清式疑问句生成方法。该方法针对话语中的错误部分动态生成澄清式疑问句,系统可以据此发起纠错对话。本文提出两种方法对澄清疑问模式建模,分别是截取模型和对齐泛化短语模型,实现句子规划;提出利用统计机器翻译方法将澄清疑问模式转换为澄清式疑问句,实现表层生成模型。实验证明,在给定话语错误定位信息的条件下,澄清式疑问句生成模型可以有效模拟口语中的澄清提问形式,模型可以针对不同的错误情况生成合理的澄清式疑问句。   4.结合上述研究成果,建立纠错对话系统,实现跨语言交互过程中错误纠正。本文从四个方面描述该系统架构:语音识别和口语翻译错误检测、纠错对话策略生成、纠错对话话语解析、以及基于DBN模型的纠错对话管理。针对不同错误环境下的纠错实验表明,该系统可以有效检测跨语言交互过程中的系统错误并可以通过纠错对话有效实现错误纠正。
其他文献
学位
21世纪伊始,月球探测进入了又一个活跃期,各航天大国开始了以重返月球为目标的新的探月行动,已经发射的多个月球探测器,外星球采样要面临地球上一般不会遇到的两个问题。第一个是
月球车是用于月面巡视的移动机器人,是人工智能、自动控制、机器人、信息科学及计算机技术等多学科的结晶,具有重大的科研和应用价值,受到了包括中国在内的世界各国的重视。在月
在工业4.0和“两化融合”的背景下,大量传统IT技术、通信协议和通用设备被引入工业控制系统(Industry Control System,ICS)中,使得工控系统更加开放。同时,工业控制系统与上层管
双轮机器人的概念于20世纪90年代提出来,属于轮式机器人的范畴。因其结构简单、运动灵活、适合在狭小的空间内工作,在民用、军用、航天上有着广泛应用前景。它的平衡原理来源
近二十多年来,应用Rice算法一直是星载图像无损压缩领域中的一个重要研究课题,以美国为代表的发达国家有超过25颗卫星采用了该算法。如何应用、改进并硬件实现该算法具有非常重
人体头部和手臂位姿跟踪是增强现实系统的关键技术之一,头部位姿跟踪是增强现实中虚实融合绘制的基础,手臂跟踪对于实现良好的人机交互体验有着至关重要的作用。本论文的研究
动态不确定环境中多移动机器人自主规划方法是多移动机器人系统研究的重要内容之一。如何将机器人自身的本体(动力学)能力,以及周边动态环境作为约束,使多个机器人以团队的形
数据采集系统作为振动噪声测量中的重要工具,被广泛应用于社会生产建设中。随着嵌入式技术的发展,便携式数据采集系统成为数据采集系统的主要发展方向。相比其它数据采集系统
现代工业过程朝着规模化、大型化、复杂化方向发展。对于现代工业生产过程而言,发生任何一个微小的故障都极有可能会造成巨大的经济损失以及人员伤亡。确保生产过程安全运行,对