【摘 要】
:
命名实体识别是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等,是自然语言处理中的一项基础性关键任务,在自然语言处理技术走向实用化的过程中占有重要地位。为了提高金融领域下命名实体的识别准确率,设计并实现了基于双向LSTM神经网络和CRF的命名实体识别算法。算法主要完成了以下工作。首先,对金融领域的信息背景和该领域下的常用实体和特有实体信息做深入了解,掌握专有命名实体和通用命名
论文部分内容阅读
命名实体识别是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等,是自然语言处理中的一项基础性关键任务,在自然语言处理技术走向实用化的过程中占有重要地位。为了提高金融领域下命名实体的识别准确率,设计并实现了基于双向LSTM神经网络和CRF的命名实体识别算法。算法主要完成了以下工作。首先,对金融领域的信息背景和该领域下的常用实体和特有实体信息做深入了解,掌握专有命名实体和通用命名实体之间的差异及各自特点,确定算法主要流程和网络结构。其次,收集词向量训练语料和处理训练语料训练词向量模型,调整训练参数迭代得到效果最佳的词向量模型。然后,收集爬取网络训练、测试数据集,训练双向LSTM网络和CRF状态转移矩阵,并增量式对模型进行迭代更新。最后,测试命名实体识别算法流程中各个功能模块准确性,并对模块进行优化。课题设计与实现的基于双向LSTM和CRF的命名实体识别算法在BosonNLP公开命名实体识别数据集包括2000条测试句子和8000个命名实体,相较于基于LSTM的命名实体识别算法,精确率提升了2个百分点,召回率提升了4个百分点,F1值提升了3.03个百分点。
其他文献
<正>本文从36例睥损伤分析的角度.就其特征性问题进行讨论。一、脾损伤的基本情况分析。从本文可以看出:①脾损伤多由他人直接致伤,有32例,占88.8%,其余为不慎意外致伤。检案实
习近平总书记指出,高校思想政治工作关系到高校培养什么样的人、如何培养人以及为谁培养人这个根本问题。新形势下,互联网平台发生了翻天覆地的变化,网络空间成为各种错误思想和
以Ce4+盐作引发剂,研究了纤维素与丙烯腈的接枝共聚反应,由实验结果得出反应温度、反应时间、单体浓度、引发剂浓度等因素对接枝率的影响,依据正交试验找出了最佳反应条件.
工业大数据技术是预测研判、数据挖掘、统计分析、人工智能、并行计算、数据存储等技术的综合运用,是新一代全新的数据学科领域的技术架构。近年来,在钢铁工业的炼铁环节中工
旅游是从古代起就有的一种社会活动,但当时仅限于少数文人名士、从事贸易的商人和宗教传道者。在我国,一九四九年解放以后,特别是党的十一届三中全会以来,党的方针政策得到认
一个显而易见的道理是:不要重复发明轮子。市场创新的关键之处在于解决别人没有解决的问题,而不是反复解决别人已经解决过的问题。而不审视市场,盲目进行市场细分,采取纵向营
水稻作为我国最重要的粮食作物,稻米的产量高低及品质优劣和农民的收入及人们的生活水平息息相关。矮杆育种和杂种优势的利用使我国水稻产量有了两次大的飞跃,为解决我国的粮
目的探讨一期后前联合入路内固定治疗严重下颈椎骨折脱位并不完全性脊髓损伤的有效性和可行性。方法对11例严重下颈椎骨折脱位伴不完全性脊髓损伤患者的资料进行回顾性分析。
利用从世界各地收集的182份野生种醋栗番茄(Solanum pimpinellifolium L.),采用喷雾接种法接种我国晚疫病主流生理小种T0,1和T1,2,旨在筛选出抗晚疫病的遗传资源。结果表明,182
碳纤维加固钢筋混凝土结构具有高强高效、施工方便等优点,本文具体介绍了碳纤维加固钢筋混凝土柱的适用范围、施工技术、施工要点。