论文部分内容阅读
消除切分歧义和处理未登录词仍然是当前自动分词中的两大难题。该文深入地分析了切分歧义产生的原因,根据语素构词的自由、半自由、不自由特性。运用依存语法将合成词分成联合、偏正、述宾、述补、主谓、附加和重叠七种依存关系类型。根据语素构词能力和语素间的不同依存关系,结合歧义手段的类型,重点论述了消除交集型歧义字段的方法。