论文部分内容阅读
本文重点讨论了汉语人称代词的指代消解。在理论分析方面:介绍了指代消解的主要实现技术,分析了汉语人称代词先行语的识别和消解的需要的知识。给出了指代消解的基本原则,并将其中比较容易利用部分进一步阐述为筛选与优选原则。在算法实现方面:提出了一种基于规则的汉语人称代词指代消解的方法。该方法经过名词短语的捆绑、性别与单复数识别、语法角色的识别、消解筛选与优选原则的运用等步骤,获得了较高的消解正确率,并提供了详实的实验结果。主要创新点有:
1.提出了名词短语捆绑算法,识别出的所有捆绑单元就是候选先行语集合。
2.提出了人称代词和先行语的性别和单复数的识别方法,性别和单复数作为人称代词和先行语的属性在筛选和优选中都起了重要作用。
3.提出了人称代词和先行语的语法角色的识别方法,语法角色作为人称代词和先行语的属性在筛选和优选中都起了重要作用。
4.提出了汉语人称代词的消解算法,利用上面识别出的属性值进行筛选与优选,获得最佳的先行语消解对象。