论文部分内容阅读
长期以来,词义排歧一直被认为是自然语言处理的难题之一,本文用机器可读词典《现代汉语辞海》提供的搭配实例作为多义词的初始搭配知识,采用适当的统计和自组织方法自动扩大搭配集;为保证学习质量,在学习过程中逐渐增大上下文窗口的长度,提出使用搭配统计表的多元最大的数似然比词义排歧算法,最后,对本文提出的方法进行了实验,实验表明这种算法具有较高的正确率。