汉语人称代词的指代消解

来源 :北京大学 | 被引量 : 0次 | 上传用户:gaolch004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文重点讨论了汉语人称代词的指代消解。在理论分析方面:介绍了指代消解的主要实现技术,分析了汉语人称代词先行语的识别和消解的需要的知识。给出了指代消解的基本原则,并将其中比较容易利用部分进一步阐述为筛选与优选原则。在算法实现方面:提出了一种基于规则的汉语人称代词指代消解的方法。该方法经过名词短语的捆绑、性别与单复数识别、语法角色的识别、消解筛选与优选原则的运用等步骤,获得了较高的消解正确率,并提供了详实的实验结果。主要创新点有: 1.提出了名词短语捆绑算法,识别出的所有捆绑单元就是候选先行语集合。 2.提出了人称代词和先行语的性别和单复数的识别方法,性别和单复数作为人称代词和先行语的属性在筛选和优选中都起了重要作用。 3.提出了人称代词和先行语的语法角色的识别方法,语法角色作为人称代词和先行语的属性在筛选和优选中都起了重要作用。 4.提出了汉语人称代词的消解算法,利用上面识别出的属性值进行筛选与优选,获得最佳的先行语消解对象。
其他文献
在许多最近出现的应用中数据都以连续、无界、快速、时变的数据流形式出现,在此之上产生了数据流管理系统(DSMS)的概念。冰山查询是数据流管理系统中的一个典型应用,例如网络攻
随着计算机技术和高速网络的发展,视频点播(VOD)已经变成现实。视频点播是多媒体通信领域中发展最快的业务之一,它综合了通信网络技术、多媒体技术、数据库等技术。本文介绍
查询接口模式匹配是深网数据集成相关技术研究的难点和突破点,整体模式匹配技术已经成为查询接口模式匹配领域的热点课题。查询接口整体模式匹配技术可以同时匹配同一领域的
在计算机软硬件开发设计过程之中,编译器是软件和硬件之间的重要桥梁。如何提高编译器的性能,编译出更高性能的执行代码,是当前热点研究课题。寄存器分配是编译器后端一个十分重
本论文介绍了一种基于军、警射击训练的实时自动报靶系统,提高了射击效率,实现了快速、精确的报靶。自动报靶系统的研制,对于军队和警察的现代化建设具有重要意义。  实时自动
设H是字母表A上的一个非空语言。如果H关于A*上的嵌入序是无关的,则称H为A*上的一个超码。超码是一类特殊的前缀码。许多学者曾对超码的组合性质,代数性质,序结构以及超码的
  本文计划研发一种可以很好地被复用的软件系统来便捷有效地解决这些具有共性的问题,该软件系统的名称叫做DAEHF(一种分布式的异步事件处理框架)。DAEHF采用框架技术来实现
2004年6月802.11i正式发布,解决了802.11b无线局域网协议的安全漏洞。虽然802.11i作为无线局域网的新一代协议有非常强健的安全结构,但是它的鉴别过程复杂,使用X.509证书的维护
随着全球电子商务应用热潮的来临,电子商务安全问题日益成为大家关注的热点和焦点问题。本文运用密码学原理研究电子商务的安全性问题,并从技术角度入手,系统地阐述了电子商务安
本文在嵌入式操作系统、构件化系统及微内核结构的相关研究基础上,对系统构件的设计与实现提出了三个目标:首先是实现嵌入式操作系统核心的功能,其次是系统构件必须具有良好的可