基于深度学习的英文关系体抽取

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:lixiaojin1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系体抽取,即实体关系抽取,常用于问答系统和知识图谱构建等应用,是信息抽取领域中基础且重要的环节。本文主要讲述了结合ResNet、RNN以及Attention机制去完成关系体抽取任务。就目前而言,很多有效的实验普遍仅使用CNN作为encoder,经过多层卷积操作后,对池化的结果进行softmax分类。而本文使用RNN,并结合Attention机制对最后的结果做分类。在这个任务上很少有人将两者结合起来去做关系体抽取任务。本文模型用RNN结合Attention对卷积后的结果进行处理,而不是使用卷积神经网络的最大池化。此模型提高了使用深层CNN在远程监督的关系体抽取任务上的表现。有论文指出在完全监督的数据集Sem Eval-task8上使用RNN接卷积操作是有效果的,而在远程监督的数据集上受大量噪声影响,模型的效果并不尽人意。在本文实验中,结合ResNet残差块的特性,将残差块和RNN以及A ttention机制同时用于远程监督的关系体抽取当中去。最终,在NYT-Freebase数据集上获得的表现比使用单一模型ResNet的更要好。本文主要的贡献如下:(1)在弱监督关系体抽取考虑使用复合模型,结合ResNet和RNN去对数据中的噪声进行处理。(2)使用复合模型相比使用单一模型取得了更好的实验表现最终结果和PCNN+ATT齐平。(3)本文提出结合ResNet和RNN以及Attention机制的模型可以很轻易的迁移应用到其他NLP任务中。
其他文献
<正> "最后的晚餐"1998年,中国金融界发生了一件大事:中国人民银行管理体制进行重大改革。1998年11月18日,中国人民银行第一家跨行政区划设置的分行——上海分行正式挂牌成立
通过在地形复杂、通视条件极差的地区布测物探网的生产实践,提出了利用全站仪的坐标测量功能,摒弃传统的物探网布测概念,在独立坐标系中随机放测测线控制点,变点的测设为放测,同时
代谢综合征包括肥胖、胰岛素抵抗和血脂异常等。近年来研究发现,胆汁酸代谢影响代谢综合征某些因素的发展,同时其也是重要的信号分子。核激素受体法尼醇X受体和膜受体G蛋白偶
电气工程是建筑工程的重要组成部分和关键环节,它的质量高低直接影响到整个建筑工程的质量水平和使用寿命,因此,加强电气工程质量的管理对建筑工程行业而言,具有十分重要的现
<正>"意象",属表象的一种。在写作中,"意象"是作者对生活表象进行加工生发,从而在文章中呈现的形象。作文《日历上的点滴幸福》中的"日历"就是作者选取的别有新意的一个"意象
随着油田开发的不断深入,只有优化采油工艺技术措施,才能得到最佳的油井产能,达到油田开发的目标。油田生产不同的开发阶段,采取不同的采油工程技术措施,以适应油田开发的需
<正> "避席畏闻文字狱,著书都为稻粱谋。"清代诗人赵翼如此浩叹,是因他对康、雍、乾之际愈演愈烈的文字狱感受深切。笔者依据《清稗类钞》史料,择数例简述,便可见这类冤案之
介绍了一种利用沃希(Walsh)变换实现测井曲线计算机自动分层方法。叙述了Walsh变换的基本理论和用于测井自动分层的实现过程。通过实际资料的处理证明,该技术是一种快速、准确的认识岩性界
介绍了固着磨料高速研磨的研磨机理,分析了磨料的成分和粒度,结合剂的特性,研磨运动轨迹的形状和分布状态,研磨压力和速度,偏心距和冷却液等固着磨料高速研磨中的一些关键技
针对面阵CCD航空相机操作系统的实际需求,结合相机中PC104总线结构的硬件资源,对所采用的Linux系统进行实用性裁剪。采用粗粒度和细粒度相结合的裁剪方法,来增强Linux内核的