实体提及的多层嵌套识别方法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:x1026221496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体识别在许多自然语言处理应用系统中发挥着极其重要的作用。目前大部分研究集中在命名实体识别,且不考虑实体之间的嵌套,本文在自动内容抽取评测(Automatic Content Extraction,ACE)背景下,对汉语文本中各种实体提及(命名性,名词性,代词性)的多层嵌套识别进行了研究。我们将嵌套实体识别分成两个子任务:嵌套实体边界检测和实体多层信息标注。首先,本文提出了一种层次结构信息编码方法,将多层嵌套边界检测问题转化为传统的序列标注问题,利用条件随机场模型融合多种特征进行统计决策。其次,将多
其他文献
债权人代位权是合同履行的保全措施之一。文章对债权人代位权制度的特征和相关法律问题进行了研究,对如何在现实生活中充分运用这一新的法律制度保护债权人利益作了探讨,并对
中国石油西南油气田分公司输气管理处结合贯彻《中国石油天然气股份有限公司企业文化建设纲要》(以下简称《纲要》)和《中国石油西南油气田分公司企业文化手册》(以下简称《
各种词性标注方法总是利用从某一侧面描述的语言学知识,当训练语料达到一定规模、训练模型完善到一定程度后,标注精度很难再有进一步的提高。本文在对TBED、DT、HMM和ME四种基
合理的文档集合划分能够有效的提高分布式信息检索的效果,本文针对分布式信息检索中的集合划分问题,提出了一种基于查询空间的文档集合划分算法。与传统的基于文档空间的划分算
网页在其生命周期内的活跃程度会随时间发生变化。有的网页只在特定的阶段有价值,此后就会过时。从用户的角度对网页的生命周期进行分析可以提高网络爬虫和搜索引擎的性能,改善
目的对中国狂犬病疫苗株CTN-1、PV-2061全基因组序列进行分析。方法通过RT-PCR法获取CTN-1和PV-2061株主种子批的全基因组序列,与国内分离的全基因组序列进行比对,并对狂犬病病
【摘要】谈及宏观教育,一定是一个复杂且多面的学校学习系统,其所涉及的范围是相对宽泛的。针对于初中教学,宏观教育的范畴就有了几个相对明确的可述之处。  【关键词】宏观教育初中教学教育体系一个良好的学习习惯是非常重要的,在宏观教育的发展中亦是如此。学习习惯的“规矩”化于宏观教育有先决性的作用。在此,所谓的“规矩”化简单来讲,意指对好的学习习惯的坚守,对坏的学习习惯的规正,达到“规矩”化的状态。所谓的先
2007年4月1819日,第二届“‘语言与国家’高层论坛”在浙江绍兴举行。会议由教育部语言文字信息管理司主办,绍兴文理学院承办。
企业要长期维持高于本行业平均水平的经济效益,其根本基础就是要取得竞争优势。在西方国家企业之间的竞争中,通常采用三种通用战略:成本领先、别具一格和集中一点。
有人说孙纯是能人,这些年把一个身处逆境中的企业带入了辉煌之旅;也有人说孙纯是困难压不倒的人,企业问题再多,他总有办法找到解决的途径。而孙纯却十分谦虚地说:"那都是因为