论文部分内容阅读
大多文本分类方法是基于向量空间模型的,基于这一模型的文档向量维数较高,导致分类器效率难以提高.针对这一不足,本文提出基于词向量空间模型的文本分类方法.其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度.实验证明,这种分类方法不仅保持了较高的召回率和准确率还提高了分类效率.