基于深度神经网络的智能问答系统研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wanghuaimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络上的海量数据已成为问答系统研究的沃土。从1999年开始,信息检索评测组织(Text Retrieval Conference,TREC)和其他的一些著名评测组织,如NTCIR(NACSIS Test Collections for IR)和CLEF(Cross Language Evaluation Forum)设立了开放域问答的评测任务,这些举动大大推动了开放域问答系统方向的发展。目前,问答系统方向的研究已经成为自然语言处理领域中热门的研究方向,受到广大学者的强烈关注。  本文主要研究了问答系统的问题分类技术和基于端到端记忆网络的问答系统改进和原型实现,旨在提升现有的问答系统的效果并进一步探索问答系统领域更复杂的任务。具体来说,包括以下三方面的研究工作:(1)问题(句子)分类技术研究与改进。当前基于卷积神经网络(Convolutional Neural Network,CNN)的句子分类技术,只是单纯把每个单词的词向量表示堆叠在一起后送入卷积神经网络。我们提出将词频特征追加在词向量后面,同时把句子进行分割,以获取更多的边缘信息,实现更好的分类效果。实验结果表明我们提出的两种改进方案在整体性能上均优于原始的CNN模型;(2)基于记忆网络问答系统的研究及改进。我们分析了目前端到端记忆网络结构的局限性,模型中涉及到的注意力(Attention)机制计算方法是将两个句子中所有词向量相加得到句向量,然后通过求内积计算相关度再进行归一化处理得到的权重值。我们认为单词是文本的最小单元,所以提出增加额外的Attention计算方法,对数据集中的问题句子提取关键词,计算关键词与Memory模块里的句子中每个单词的相关度再进行归一化得到权重。将改进的模型在bAbI20数据集上进行大量实验,相对于原始模型有更好的问答任务准确率;(3)问答系统原型实现。对现有开源问答系统进行调研和分析,构建了问答系统架构和流程,设计了系统界面,并以(2)中改进的记忆网络作为模型实现了一个问答系统原型,系统可支持用户上传新的数据集和设置模型参数重新训练网络等功能。  总之,本文对问答系统领域及涉及的技术进行了研究和探索,研究成果可以有效提高问答系统的效果,对于问答系统研究具有一定的参考价值。
其他文献
指令调度依据机器资源特征和程序属性,通过调整指令的执行次序来提高指令级并行度,是一种重要的编译优化技术。一般地,指令调度考虑的机器资源主要是计算部件。本论文在指令调度
网格系统中存在种类繁多的应用与资源,它们不同的管理方泫给网格系统的设计增加了复杂性,也给用户使用网格带来了困难。同时,资源服务化的趋势虽然使网格系统的构建更加规范,但也
无线传感器网络被认为是全球未来十大技术之一。由于它在许多领域具有重要的科研价值和巨大的实用价值,在基础理论和工程技术两个层面向科技工作者提出了大量挑战性问题,从而引
随着互联网技术的日益成熟,即时通信技术发展迅速。即时通信技术以其双向互动的交流方式吸引了大量用户,它的出现给人们带来了极大的便利。Jabber技术是目前发展最快、研究最
面对网络视频数据的爆炸式增长,人们迫切需要研究基于内容的视频检索技术。然而,视频的内在语义即人们对视频数据的理解与其表现形式即人们提取的二进制底层特征之间存在语义鸿
无线自组织网络具有广阔的应用前景,因而受到越来越多的关注。拓扑控制是无线自组织网络研究中最基本的问题之一,它对于节省能量、增大网络容量、减小通信干扰等具有重要意义
近十几年来,演化算法已逐步发展成为解决多目标优化问题的理想方法,特别为求解大规模复杂的多目标优化问题提供了有效的研究方法,因而多目标优化问题已成为演化算法领域的研究热
信息技术的飞速发展与数字资源数量的爆炸式增长,使传统的以关键字为检索为手段的信息获取技术日益不能满足人们的需求。在这种情况下,个性化服务应运而生。推荐系统是实现个性
随着VoIP技术的不断发展,标准SIP终端的功能越来越丰富。作为一个自主研发的标准SIP终端,SIPHello的功能从简单的语音通话和即时消息等功能,发展到复杂的在线消息订阅和视频
随着数学和信息技术的发展,价格预测的手段越来越丰富,应用的领域也越来越广泛。鉴于农产品批发市场价格在农产品流通体系中处于承上启下的位置,及时了解农产品批发市场价格的变