基于深度学习的上下文感知和主题融合的机器问答研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhaoct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据和深度学习技术发展的带领下,神经网络机器问答系统的交互水平得到了长足进步,该领域也越来越引起人们的注意,深度学习神经网络的飞速进步也极大地推进了人机对话系统的落地进程。随着人们生活的智能化,智能对话设备不断进入人们的视线,为人们提供信息服务,交互操控和聊天娱乐等功能。本文主要研究神经网络问答模型融合主题模型的问答系统,传统神经网络运用到开放问答领域存在很多问题,其中之一就是容易生成简单宽泛且无区别性的回复,原因是模型在生成回复时既不能感知上下文又没有外源知识的补充。为了让神经网络问答系统能够生成丰富多样的响应,本文从神经网络Seq2Seq问答模型和主题模型方面展开研究:(1)LDA是一种提取文本主题词的算法,通过中文语料库训练的LDA模型能够把每组对话当作短文本进行主题词提取,将LDA提取的主题词引入到神经网络Seq2Seq问答模型作为外源知识,因此问答模型除了能够学习训练语料库的问答模式外,还可以动态地利用主题词来生成回复,促使生成的响应内容丰富多样。(2)将提取的主题词融合到神经网络Seq2Seq问答模型得到神经网络主题问答模型,并在自制的中文语料库上训练。传统的神经网络Seq2Seq问答模型难以感知上下文,本文对该模型进行改进,加入了联合注意力机制,该注意力机制包括主题注意力机制和双向注意力流机制。该机制可以让解码器在生成答案时可以有效地利用上下文语义和主题语义,促使生成的回复与上下文相关性更强并且与主题相关。(3)启发于机器理解领域问句与上下文之间的处理机制,将双向注意力流网络引入神经网络Seq2Seq问答模型提出了注意力增强主题模型。双向注意力流机制的输入包括经过问句编码器编码的上下文部分和问句部分,由于上下文不同词对问句的生成起着不同的作用,上下文经问句编码器编码的中间向量通过问句注意力机制来关注不同词的重要性,最后通过上下文编码器流入到双向注意力流网络。双向注意力流机制能够捕捉上下文与问句之间的联系,使得解码器能够生成与问句更密切的回复。最后经自制的语料库训练该模型,实验结果对比其他主流问答模型验证了该模型的有效性。
其他文献
【正】 明初建都金陵。永乐四年至十八年(1406—1420年),大兴土木,经营北京宫室,规划庞大,实施项目遍及城郊各处。明清故宫——紫禁城,就是那时北京大建设的重点建筑。紫禁城
中国古代心理疗法始终坚持心身并治、治养结合的原则,而且整体观念和辨证论治仍然是中医进行心理治疗的优势和特色,同时将养生思想融入其中使之具有更加广泛的内容,从而形成
目的:以艾叶总黄酮为主要原料药研制一种便携式的新型热灸贴膏,并对其质量的稳定性、安全性、体外释放度及体外透皮特性进行研究,为艾叶热灸贴膏产品的研发提供前期参考资料
目的:观察1997、2001、2007三年代大益的生熟普洱茶对模型小鼠单核-巨噬细胞系统功能的影响。方法:采用腹腔注射环磷酰胺诱导免疫低下小鼠,用小鼠碳粒廓清法、免疫器官重量法
目的:探讨用宽心安神配方颗粒治疗冠心病心绞痛合并失眠的临床效果。方法:将2017年1月至2017年10月期间在江苏省中医药研究院心内科就诊的47例冠心病心绞痛合并失眠患者随机分
果汁饮料因其独特的天然风味,维生素C含量丰富,因而受到越来越多消费者的青睐。由于维生索C具有增强抵抗力,维持人体正常的新陈代谢,维持骨骼和血管的正常生理作用的重要功能。因
近年来,我国国民经济持续快速发展,公路客运枢纽站建设也得到了快速的发展。经济的增长同时也带动了交通运输业的繁荣发展,但随着客运人流量逐渐递增,现有客运枢纽站已无法满
目的:建立拟血管性痴呆(VD)的动物模型,探讨针刺对VD大鼠模型的学习记忆行为、脑内NO含量、NOS活性及VD大鼠血液流变学的影响.方法:选用纯系健康雄性Wistar大鼠36只,随机分成
月经来潮意味着我们少女已长大成熟。这一时期我们特别关注:经期如何护理?如何自我保健?尤其是该如何选择和使用卫生巾?这些都是我们非常关心的问题。因为这些问题是关系到我
哮喘是呼吸系统常见的病证,以呼吸困难为特征,甚至张口抬肩、喉间哮鸣、不能平卧,严重者可致虚脱。“喉间有声者谓之哮,气促而无声者谓之喘”,临床上常哮喘并见。可发生于任何年龄