基于深度学习的命名实体识别

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:linda456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是自然语言处理领域的基本问题,主要是识别出人名、地名、组织机构名等命名实体的类别和位置。命名实体是含有完整语义的基本单元,对命名实体的识别至关重要,是实现知识构建、语义理解的基础。命名实体识别对信息抽取、信息检索、机器翻译、问答系统等自然语言处理下游任务有着重要的支持作用。因此,命名实体识别性能的提升,对自然语言处理的众多任务都有着极大的帮助。  随着深度学习技术的发展,基于深度学习的方法在众多任务上都取得了很好的效果。相比于传统方法,深度学习方法无需构建人工特征即可实现端到端学习,在模型表示能力上有着天然的优势。本文主要研究基于深度学习的命名实体识别,主要是通过不同维度提高命名实体识别网络结构的表示能力,旨在实现一个高精度的命名实体识别系统。具体的研究内容如下:  1.融合标签依赖信息多通道命名实体识别。  在现有的命名实体识别的工作中,往往通过循环神经网络对输入句子进行表示学习,这种模型只考虑到了输入句子之间的依赖关系,而忽视了实体标签的不同距离的依赖关系。本文提出了基于tag-LSTM神经网络结构的多通道模型对实体标签依赖关系和词-标签交互进行建模。在现在流行的基于输入序列的LSTM模型基础上,引入另外一个信息通道——标签序列,充分考虑历史标签序列信息,以及词-标签交互信息,进行命名实体识别。设计并具体讨论了三种融合标签依赖信息的多通道模型结构:共享tag-LSTM模型、基于特征融合的独立tag-LSTM模型、基于联合预测的独立tag-LSTM模型。实验表明,这三种模型结构对命名实体识别效果均有不同程度的提升,其中基于联合预测的独立tag-LSTM模型效果最优。由此可见,融合标签依赖信息的多通道模型可以对不同距离标签依赖信息有效建模,提升命名实体识别的效果。  2.基于依存句法卷积结构隐层表示的命名实体识别。  在目前的神经网络命名实体识别中,对句子的建模主要采用双向循环神经网络。一些循环神经网络的变种(长短期记忆网络等),理论上可以学习到长距离的依赖信息,但是由于沿着时间逐个节点进行传播,随着距离增加,信息在传递过程中减弱,使得在处理长距离依赖信息的效果较差。而依存语法可以精确表征出句子中词语之间的语言依赖关系,这种信息更接近深层的语义,能有有效对语言进行建模。本文结合依存语法和神经网络,提出了基于依存图卷积结构隐层表示的命名实体识别方法,该方法可以通过依存语法树结构,学习词语的上下文表示,有助于解决单一循环神经网络的长距离依赖问题,增强隐层的学习表示能力。实验证明,基于该网络结构的命名实体识别系统效果优于BiLSTM-CRF网络。  3.基于线性连接和条件转移的深度命名实体识别。  目前,神经网络命名实体识别模型大多基于浅层网络。深度的网络结构可以增强模型的表示学习能力,随着深度的增加,模型可以建模更加复杂的语言依赖和语言结构。本章提出了一种基于线性连接和条件转移的深度命名实体识别系统。由于网络加深,由输入层到输出层经过的非线性变换次数增多,神经网络使用反向传播训练时会引发梯度弥散和梯度爆炸问题,阻碍网络的正常训练,本章提出了一种线性连接门(Linear Connection Gate Mechanism)结构,动态融合神经网络单元的线性输出和非线性输出,缓解训练时的梯度弥散和梯度消失问题。另外,由于之前的神经网络模型,利用固定的转移矩阵建模标签之间的跳转关系,转移矩阵是独立的,它与上下文无关,这种结构限制了对转移关系的建模。本章提出了一种条件转移机制(Conditional Transition Mechanism),并应用于命名实体识别。条件转移结构可以根据不同的上下文对标签的跳转进行更细致的建模,提升命名实体识别的效果。
其他文献
在软件测试过程中,优秀的测试工具通常能显著地提高测试的效率。在开源社区的推动下,越来越多的开源测试工具不断涌现。软件测试是一个复杂的过程,而现有的开源测试工具大多专注
新课程改革目的在于提升学生的基本化学素养,化学的教学目标更加丰富.新课程从学生的个性发展角度出发,提出了“知识与技能、过程与方法、情感态度与价值观”三维教学目标,相
随着集成电路工艺的迅速发展,系统芯片设计和验证的复杂度在日益增长,系统芯片推向市场的压力也在不断增大。为了提高设计的生产效率,人们对系统芯片(SoC:Systemonachip)设计流
我省传统的冬季绿肥——紫云英,历來以连作晚稻稻田套播,随着迟熟高产晚稻品种的推广和插秧密度的增加,紫云英苗期在稻底生长期延长,光照过弱,对幼苗生长极为不利。水稻收割
朴素贝叶斯分类器以其简单、在一些数据集上比其它复杂算法不逊色的性能而闻名,但是其内在的属性条件独立性假设在现实当中是很容易被违背的。当这种假设不在成立时,朴素贝叶斯
奥斯卡金像奖评比已经举行了81届,共有82部影片获得最佳影片奖.通过研究其中文译名,发现翻译方法共有三种:直译,意译,音译.分析这些方法,对于电影片名的翻译、研究及电影事业
近年来,Linux在嵌入式领域和个人计算机(PC)领域的应用越来越广。随着IJnux内核的不断丰富以及应用程序的不断膨胀,系统启动的时间越来越长。目前,Linux操作系统,尤其是包括图形
规模经济带来的效益促使越来越多的计算向数据中心转移,而数据中心的资源利用率一直偏低。通过负载聚合的方式使一个服务器内同时运行多个任务成为一种提高资源利用率的有效方
Internet的大量应用及相关技术的快速发展,使得Internet演变成了一个更加开放的软件协同环境,出现了很多像服务计算、普适计算、网构软件等新型的软件系统,这些系统都不再是通过