基于关系拆分的实体关系联合抽取模型的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:PhilippsWang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,海量的数据随之诞生。文本数据作为人们接触最多的信息形式之一,其中包含着很多有价值的信息,如何从复杂冗余的文本数据中获取有价值的关键信息非常重要。实体关系抽取作为信息抽取的基础任务之一,具有非常重要的意义。在此背景下,本文提出了一种基于关系拆分的实体关系联合抽取模型。随着深度学习技术的发展,实体关系联合抽取技术取得了很大进展。目前,主流的实体关系联合抽取大多采用序列标注的思路,但现有标注策略存在标注次数过多或标签重叠等不足之处。针对该问题,本文提出了一种基于关系拆分的标注策略,在减少标签重叠问题的同时降低复杂度,在此基础上提出了基于关系拆分的实体关系联合抽取模型,在模型的编码器层应用多头自注意力机制进行文本表示,以提高模型的信息提取能力,在解码器层应用标签嵌入技术将不同的关系映射到连续的向量空间中,从而使模型能够同时在不同关系上进行序列标注,在模型的损失函数上应用标签平滑和代价敏感学习技术,从而优化模型收敛过程、减少关系拆分带来的标签类别不平衡问题。为了验证模型性能,本文选择了两个公开数据集设计了四组实验,证明了模型的准确性。最后,本文将所提出模型应用于电网故障领域,自行构建了电网故障领域数据集,通过实验验证模型在电网故障领域文本上的有效性,通过知识的抽取、加工、存储和可视化等步骤,完成电网故障领域知识图谱的构建。
其他文献
相变存储器(Phase Change Random Access Memory,PCRAM)是一种具有优良性能的新型非易失性存储技术,具有良好的应用前景。相变材料铬掺杂碲化锑(Cr-SbTe)具有热稳定性高、结晶速度快等优势,具备替代传统相变材料锗锑碲(GST)的潜力。要实现先进相变材料工艺集成,与之相关的相变材料刻蚀是PCRAM制备的关键工艺。因此本文主要从Cr-SbTe薄膜的刻蚀工艺参数优化及
当今时代,人的作用在企业发展中越来越受到重视,人才是企业在瞬息万变的市场竞争中立于不败之地的根本保证,现代人力资源管理实践中往往将人力资源管理归纳为选、用、育、留四大功能,要发挥这四大功能,做好员工激励是核心和关键,一套科学、合理的员工激励方案,能够有效吸引人才、激发人才的主观能动性,促进企业的发展。目前虽然各大企业都非常重视员工激励,但有些企业特别是国有企业受体制机制的影响,“大锅饭”现象还不同
无人驾驶汽车自问世以来一直受到国内外车企的广泛关注,而可靠的视觉感知系统是对无人驾驶技术的重要支撑。交通标志承载着重要的道路行驶信息,系统准确地检测交通标志有利于引导驾驶员安全行驶,同时对于提升无人驾驶汽车的场景理解能力也有着重要意义。得益于硬件计算能力的提升以及广泛学者的研究,近年来深度学习发展迅速。尤其在计算机视觉领域,深度卷积神经网络已取得众多突破性成果。在图像识别、目标检测、图像语义分割等
据2019互联网趋势报告显示,图像数量持续海量增加。面对海量的图像数据,如何快速准确提取有价值信息成为计算机视觉领域亟待解决的关键问题。显著性检测技术模拟人类视觉系统从图像中分割出感兴趣的目标或区域,进而为其他计算机视觉任务提供服务。自1998年,显著性检测领域发展了很多优秀的基于启发式规则的算法,近几年全卷积网络又将显著性检测推向一个新的高度。本文针对复杂场景的显著性区域检测进行研究,提出两种基
移动互联网的普及在生产生活中带来了爆炸式的信息量,正催生着一种和以往截然不同的阅读方式。自动摘要系统作为一种短小精悍的信息检索方式应运而生,使用人工智能算法自动生成文本的摘要,是从信息时代迈向智能时代的技术支撑之一。目前研究者对于自动摘要研究重点的共识是优化文档表示学习方法和抽样算法。然而研究现状表明各种研究方法都很大程度上依赖人为经验因素来设计统计类句子特征,优先选择高分句子;用于算法评估的黄金
设备到设备(D2D)通信是指终端设备之间的直接通信,无需eNB传输,被认为是下一代无线通信的关键技术之一。该技术的“直接短距离”通信功能不仅可以节省频谱资源,而且可以减少传输延迟,降低功耗,提高传输速率。有效的资源管理是保证这些优势获得的关键。本文主要研究通过博弈论实现D2D通信中的资源管理,论文的主要工作如下。1.提出了基于非合作博弈论的联合功率和资源分配方案。通过对蜂窝用户和D2D用户进行适当
移动目标定位是无线传感器网络中的一项基本功能。本文研究基于RSSI的室内定位技术,针对现有研究存在的问题,提出了两个有效的室内跟踪定位算法。首先,针对RSSI值易受环境影响从而影响定位准确度这一问题,设计了一个基于动态环结构的目标跟踪定位算法。该算法首先在传感器网络感知范围内构建多个环结构,并采用基于精英保留策略的遗传算法设置环宽以优化环结构;在此基础上提出基于二进制编码的目标出现区域确定算法,该
随着当今社会深基坑支护越来越多,给土方外运也越来越困难,多道环形支撑深基坑土方外运一套可行的出土柱板挡土结构新技术和工艺新技术应运而生。
最优化问题是工程实践和科学研究中主要的问题形式之一,其中,约束优化已渗透到我们生活中的方方面面,但是在求解约束优化问题时往往面临着评价次数过高、求解费时的困难。因此,在评价次数有限的情况下提高约束费时问题的优化性能非常重要。本文针对单目标约束费时问题提出了两种改进的优化算法,主要工作如下:一、代理模型辅助的初始可行解产生方法。采用约束保持法求解单目标约束优化问题时,如何能够快速的产生初始可行解是首
近年来,环境污染事件层出不穷。2010年汀江重大水污染事故造成直接经济损失3187.71万元人民币,2011年云南曲靖铬渣污染事件造成“死亡村”。环境污染造成的危害使得环境恶化和巨额经济损失,不利于国家又快又好的发展。对污染受害人进行合理的赔偿,是保护公民合法权益的必经之路,但巨额的赔偿又使企业和政府陷入困境。借助发达国家解决此类问题的方法,2008年环境污染责任保险应运而生,这是以企业发生污染事