论文部分内容阅读
北京2008年奥运会是中国历史上第一次主办的奥运会,届时来自世界各地的有着不同文化背景的中外友人将云集北京,参与体育竞技、组织工作及观光活动,北京将成为世界关注的焦点。根据“科技奥运促进人文奥运”的重要理念和《北京奥运行动规划》制定的重要目标,北京在确保奥运会顺利进行的同时,也要为社会公众提供丰富、便捷、易于获取的信息服务。因此,集成了自然语言理解、对话管理、信息抽取等技术的对话系统将以奥运为契机,成为首都信息服务建设的重要组成部分,这也是本课题的研究内容。
课题的主要研究目的是利用首都信息发展股份有限公司在对话管理与信息处理方面的技术积累,通过新的对话管理流程,实现一个以自然语言问答形式为公众提供多主题信息查询服务的人机对话平台。本文是在奥运多语言综合信息服务系统前期研究成果的基础上进行的阶段性研究,依靠奥运综合信息资源库的资源支持,课题成果最终服务于北京2008年奥运会,为大众提供全面周到的城市信息与奥运信息服务。
本文通过深入研究对话系统所涉及的关键技术,仔细分析用户和系统需求,制定了人机对话平台的总体设计方案。根据形式语言与自动机理论,在系统中实现了基于规则匹配与参数提取的自然语言理解方法。凭借首信公司在对话管理方面的研究成果,结合树结构的主题管理方法与可追溯的历史管理策略,完成了基于槽和任务的对话管理模块设计,建立了规则库、参数库、语料库和信息数据库,并采用Web Service方式发布服务。最终,通过系统测试给出了性能评价和问题分析。