【摘 要】
:
命名实体识别是自然语言处理的基础任务,其中通用领域语料下的复杂地名、机构名实体识别效果还有待提高。针对这一问题,提出一种多特征融合的中文地名、机构名实体识别方法,
【基金项目】
:
国家自然科学基金资助项目(No.61562083);国家重点研发计划(No.2017YFC0820603)
论文部分内容阅读
命名实体识别是自然语言处理的基础任务,其中通用领域语料下的复杂地名、机构名实体识别效果还有待提高。针对这一问题,提出一种多特征融合的中文地名、机构名实体识别方法,该方法以条件随机场为框架,结合实验语料的特点,选取统计特征,将局部特征、复合特征与规则知识库相融合,对中文语料进行命名实体识别。实验结果表明,1998年1月《人民日报》语料上的测试结果,地名实体的F1值提高2.2%,达到97.70%,机构名实体的F1值提高6.2%,达到92.80%。
其他文献
信息时代,手机进入中职校园已不可阻挡。从职校班主任的视角,对正确引导中职生合理使用手机,克服手机依赖提出可行的对策建议。
三间小平房,十几只旧铁桶,200多平方米场地,这是1976年刚刚起步的嘉兴市中华化工厂。800余亩工业园区,8个分(厂)公司,总资产18亿元人民币,这是2010年的嘉兴市中华化工有限责
“习近平总书记在参加山东代表团审议时强调:‘实施乡村振兴战略,要推动乡村产业振兴、人才振兴、文化振兴、生态振兴和组织振兴。’黔西南州将全域山地旅游发展与推进乡村振兴
如何组约高质量的首发文献,应该成为医学期刊编辑思考的问题。2006年以来,《临床误诊误治》杂志对汪忠镐院士及其研究团队对胃食管反流病(GERD)及胃食管反流气道综合征(GELTS
间充质干细胞(mesenchymal stromal/stem cells,MSCs)在急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)中有着潜在的治疗作用,现在认为主要的机制在于MSCs通
非转移细胞(non-metastatic cells,NME)基因家族,系首个被发现的肿瘤转移抑制相关基因。NME1基因及其编码蛋白通过发挥酶活性和与多种细胞内蛋白相互作用,参与调节细胞增殖、
随着市场经济的不断发展,食品安全事件的影响范围越来越广,造成的社会危害性也越来越严重。食品安全保障问题关乎到和谐社会的构建,人民生活水平的提高与人类生命财产安全的
<正>电能的发供用在同一瞬间完成,电能不能储存,无实物形态。基于这些原因,电力营销过程从用电报装、签订供用电合同、电能计量、抄表收费,是一个相对复杂、不可分割的过程,
碘伏是一种目前广泛应用的中效消毒剂,其化学成分为吡络酮,起消毒作用的主要是其中的有效碘[1].由于碘伏的安全性很高,在外用消毒方面的应用很广 泛.在临床护理中由于使用碘
问:编辑同志,您好。当今世界,网络战争不再是理论上的假设和推测,而是每天真实地发生在身边,是一种实实在在的威胁。美国大片中演的科幻故事正在成为现实。请问,世界上可以称