论文部分内容阅读
信息抽取技术从互联网上海量的非结构化文本中自动抽取结构化数据,为人们高效地提供有价值的信息。事件抽取是其中一个重要分支任务。由于事件抽取任务的现存语料规模较小,人工标注数据的成本又过高,现有方法在进行事件抽取任务的研究中受到了缺少数据带来的性能限制。
针对以上问题,本文提出基于预训练语言模型的事件抽取方法和一种基于阅读理解特征迁移的事件抽取方法。为了实现事件抽取的零样本学习,本文还提出一种基于阅读理解模型迁移的事件抽取方法。主要贡献如下:
(1)本文提出了基于预训练语言模型的事件抽取模型,尝试将预训练语言模型应用到事件抽取任务中。实验结果表明模型能够有效抽取事件信息,在ACE2005事件抽取数据集上达到了事件识别任务的当前最好结果,其效果优于基于传统特征工程、CNN与RNN神经网络特征、以及神经网络特征融合外部信息的事件元素识别方法。
(2)本文提出了一种基于阅读理解特征迁移的事件抽取方法,尝试利用阅读理解任务中学到的知识进一步提升事件抽取任务的效果,并且通过对目标函数重新加权的方法使事件抽取模型可以考虑到不同事件元素角色对特定事件类型重要性的差异。实验结果表明该方法能够进一步提升事件抽取的效果。
(3)本文提出了一种基于阅读理解模型迁移的事件抽取方法,提供了事件抽取的零样本学习的可能性。该方法尝试将事件抽取任务转换成阅读理解任务,利用改进的阅读理解模型进行事件抽取,并且通过特征融合和生成问题文本两种方式在事件元素问答中加入事件类型信息。实验结果证明了该方法在事件抽取的零样本学习上的有效性,在事件识别任务上达到了当前最好结果,在事件元素识别任务上也得到了和其它模型相近的结果。
最后本文尝试在面向金融领域的事件主体抽取项目中应用本文提出的基于阅读理解模型迁移的事件抽取方法,并达到了CCKS排行榜上前10%的结果。并尝试利用事件抽取的零样本学习进行开放域金融事件抽取任务,有效生成了标注数据。以上应用实践表明本文提出的事件抽取方法在模型结构和模型性能上具有一定的有效性和优越性。
针对以上问题,本文提出基于预训练语言模型的事件抽取方法和一种基于阅读理解特征迁移的事件抽取方法。为了实现事件抽取的零样本学习,本文还提出一种基于阅读理解模型迁移的事件抽取方法。主要贡献如下:
(1)本文提出了基于预训练语言模型的事件抽取模型,尝试将预训练语言模型应用到事件抽取任务中。实验结果表明模型能够有效抽取事件信息,在ACE2005事件抽取数据集上达到了事件识别任务的当前最好结果,其效果优于基于传统特征工程、CNN与RNN神经网络特征、以及神经网络特征融合外部信息的事件元素识别方法。
(2)本文提出了一种基于阅读理解特征迁移的事件抽取方法,尝试利用阅读理解任务中学到的知识进一步提升事件抽取任务的效果,并且通过对目标函数重新加权的方法使事件抽取模型可以考虑到不同事件元素角色对特定事件类型重要性的差异。实验结果表明该方法能够进一步提升事件抽取的效果。
(3)本文提出了一种基于阅读理解模型迁移的事件抽取方法,提供了事件抽取的零样本学习的可能性。该方法尝试将事件抽取任务转换成阅读理解任务,利用改进的阅读理解模型进行事件抽取,并且通过特征融合和生成问题文本两种方式在事件元素问答中加入事件类型信息。实验结果证明了该方法在事件抽取的零样本学习上的有效性,在事件识别任务上达到了当前最好结果,在事件元素识别任务上也得到了和其它模型相近的结果。
最后本文尝试在面向金融领域的事件主体抽取项目中应用本文提出的基于阅读理解模型迁移的事件抽取方法,并达到了CCKS排行榜上前10%的结果。并尝试利用事件抽取的零样本学习进行开放域金融事件抽取任务,有效生成了标注数据。以上应用实践表明本文提出的事件抽取方法在模型结构和模型性能上具有一定的有效性和优越性。