面向智能应答的语料库构建研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:arile1027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着自然语言处理技术的越来越成熟,市场上的应答机器人产品也越来越多,其中比较具有代表性的应答机器人产品有苹果的Siri、微软的小冰、亚马逊的语音助手Alexa等等。研发应答机器人的关键内容在于应答语料库的构建,目前市场上应答语料库的构建方法主要有基于知识检索的检索式构建方法、基于人工模板的情景式构建方法、基于深度学习的生成式构建方法。然而,对于单一基于知识检索构建、基于人工模板的情景式构建或者基于深度学习的生成式方法构建的应答语料库远没有达到期望的效果,同时应答内容缺乏对某一领域的专业性。针对目前市面上的应答语料库构建方法不实用,达不到预期效果、应答内容缺乏对某一领域专业性的共同缺点,提出了一种混合式的智能应答语料库构建方法的改进方案。本文提出的混合式的智能应答语料库构建方法是基于深度学习的生成式应答语料库构建方法结合基于AIML的情景式应答语料库构建方法。即它具备了基于AIML的情景式应答语料库在软件工程领域答疑的精准性,同时也具有基于深度学习的生成式应答语料库在日常应答中表现出来的专业性(对上下文内容的理解记忆能力)。本文基于深度学习的生成式应答语料库构建方法,充分利用了深度学习中基于Attention机制的双向LSTM编码模型知识原理来训练生成式应答模型并生成日常对话,同时本文针对AIML的情景式应答语料库(基于人工模板的情景式构建方法)无法友好的支持中文的缺陷,通过重构AIML解释器让AIML的情景式应答语料库可以更好地支持中文,从而将软件工程问答内容编写入AIML应答库,进而具备软件工程领域的答疑解惑能力。本文将这种混合式的智能应答语料库写成了两个对应的API接口的形式(基于深度学习的生成式应答语料库接口、基于AIML的情景式应答语料库接口),通过Android客户端以及PC端向用户展现出来。在保证软件工程领域答疑、日常应答的同时,智能应答语料库嵌入了资源管理语料化模块对手机资源管理及操作语料化,即可用语音来操控和管理手机应用,让智能应答语料库内容变得更加丰富。
其他文献
词语相关度计算,即度量两个词语表达意义的近似程度。它是自然语言处理领域的一项基础性研究,对文本分类、自动问答、词义消歧、机器翻译等上层任务有着重要的影响。词语的表示学习是词语相关度计算中一项基础而核心的工作,获取高质量的词语表示是提高词语相关度计算结果的有效方式。本文试图从提高词语的表示学习质量这一角度出发进行相关研究,在非独立同分布学习理论(not independent and identic
高校辅导员是大学生思想政治教育的一支骨干力量,他们在大学生的成才中,扮演着政治上的引导者、思想上的教育者、行政上的管理者和道德文化的传播者等多重角色。因此,在工作
全站仪和VRS-RTK测量技术各有优缺点,充分了解其特点,结合实际的测量工作,利用其各自的优势,既可获得高精度的测量成果,也可节省大量的测量成本。
我非常热爱现实主义油画。油画到目前发展过程中,经历了很多的艺术流派,他们各自也有不同的特点。依我看来,油画的发展都借鉴和吸收了现实主义绘画中的精髓,更加适应当代社会
<正>2009年是华南农业大学百年校庆,恰逢百年一遇的金融危机。在祝贺华南农业大学百年校庆的同时,谈谈高等教育如何应对金融危机,尤其是农业院校应如何抓住这一机遇,开拓创新
蚕业产业化经营是社会主义市场经济发展的要求,是蚕丝业可持续发展的需要。它的内涵是以市场为导向,以蚕农为基础,以龙头企业或合作经济组织为依托,以经济效益为中心,以系列化服务
从2000年中共中央十五届五中全会首次在政府文件中正式提出“文化产业”的概念,到十八大报告高度重视文化建设,提出将文化建设作为五位一体布局中的重要一环,再到十八届六中
目的为验证新型钙离子拮抗剂尼索地平的临床降压疗效。方法采用随机双盲对照法,临床口服尼索地平(10~20mg,Bid)与尼群地平(10~20mg,Bid)对75例轻中型原发性高血压患者进行对比研究。结
本文指出,近期由外语界内部争议所引发的轩然大波缘于英语专业与专业英语之间的疆域纷争和相互误解。就其实质而言,两者之间的界限划分与厘定是本次论战引发的最根本和最迫切
2012年台湾大选的结果预示着海峡两岸将会在今后的一段时期内"共发展、求和谐"。随着,两岸经贸往来的增加,民事纠纷也会不断增加,这就迫切需要解决两岸司法协助的问题,保护当