基于知识图谱问答的问句理解与语义搜索关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zjqhdh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息爆炸式增长的互联网时代,传统的基于关键词的搜索方式因其缺乏语义层面的理解并需耗费大量时间筛选答案,已经逐渐不能满足人们快速获取知识的需求。问答系统作为一种更快捷的交互手段,直接返回用户答案,获得了业界广泛关注,同时知识图谱的出现提供了结构化的知识形式,使用户能够获得更加简洁和准确的信息。因此基于知识图谱的问答逐渐称为科研工作者和工业领域人员研究的热点。  对于中文知识图谱问答,传统方法往往依赖于手工特征以及预定义规则,而现有深度学习方法并未较好解决问句语义特征稀疏的问题,且存在未充分利用数据特征的不足。针对上述问题,本文研究了知识图谱问答中的自然语言问句理解以及语义关联搜索中的关键技术,具体相关工作和研究成果如下:  1.针对问句理解相关工作中检索效率较低,需要大量的搜索空间,同时还引入了许多无关噪声的问题,采用序列标注的方法利用字符级别的Bi-LSTM-CRF序列标注模型进行实体识别。同时针对问句为短文本,缺少上下文信息和语义特征稀疏的特点,基于莱文斯坦比以及最长公共子序列,提出了LRLCSB(Levenshtein Ratio&Longest Common Subsequence Based)实体链接算法,较好地将实体链接至给定的知识图谱,为下一步语义关联搜索提供了良好的数据基础。  2.针对自然语言问句表达与知识图谱中结构化、规范化的属性之间存在差异的情况,以及目前语义关联搜索模型的网络结构未充分利用训练数据特征的问题,提出了基于注意力机制的多粒度表示层次匹配模型。该模型针对文本嵌入采用不同粒度的表示信息,将字符级别、词级别的文本嵌入结合,并引入属性级别表示,充分利用了数据特征。同时该模型还引入层次匹配结构以获得问句隐层表示更加抽象的信息,并采用注意力机制以更加关注属性在问句中的表示部分。实验结果表明,本文的语义关联搜索模型在中文知识图谱问答数据集上取得了良好的实验结果,具有较好的应用价值。  3.基于提出的自然语言问句理解算法以及语义关联搜索模型,实现了军事领域知识图谱问答原型系统。该系统通过爬取并融合中文维基、百度百科和米尔军事网站等互联网开源数据,构建了一个包含1.03万军事相关实体以及15.04万属性和关系的特定领域知识图谱,在此基础上,利用本文提出的算法和模型,系统较好地实现了基于知识图谱的自动问答功能。
其他文献
在近几年的英语教学工作中,学生成绩两极化现象日益突出.作为一名英语教学工作者,这一现象使我感到忧虑.针对这些长时间积累下的客观存在的问题,笔者介绍一下自己在这一方面
在传统的数学教学中,教师与学生之间的互动多为单方面的讲授或指令,即教师考虑更多的是如何实现预定的教学目标,而忽略了学生的反应和思考,致使学生在枯燥、无趣的数学活动中
期刊
2015年10月15日~17日,来自全国各地的100余位批发商、供应商和零售商代表共聚历史悠久的眼镜之乡——江西鹰潭,问道释义,探讨了互联网+时代,批发商该何去何从,如何运用数据分
语音增强是一种信号的选择性处理技术,主要目标是解决从受到不同方式污染的语音信号中提取出尽可能纯净的目标语音信号的问题。由于语音增强技术的研究成果具有很强的实用性,与
如何教好高中英语,让教学方法与时俱进,是作为一名高中英语教师需要深入探究的课题.
随着生活质量的提高,人们的餐桌日益“崇尚绿色,回归自然”,呈现一股绿色热潮,绿色食品得到了空前的发展,受到社会的关注和消费者的青睐.
计算机作为一个工具在社会发展中应用越来越广泛,计算机基础教学也成为中职学校教育中的一个重要内容,它对于培养学生掌握计算机的知识和技能,提高学生的基本素质都具有十分
新课程改革为课堂教学带来了活力,但高考毕竟是一个检验学生能力的重要标准.本文讨论了如何抓好课堂互动,建立良好的师生关系,以适应新课程的标准,并从听说、词汇、语法三个
无论在超市,还是在小小的食品店,各式各样的儿童食品都会不约而同地摆在最为显眼的位置,尽情地展现它们的风采。特别是孩子出入较多的地方如小学或幼儿园附近的食品店,更是一色的
自上个世纪八十年代以来,客观语音质量评价研究已成为语音信号处理领域中的一个重要课题。在开发语音处理算法、设计语音通信系统、优化语音通信设备时,对输出的语音质量进行评