论文部分内容阅读
特征选择是解决文本分类中特征空间高维性的难题的有效方法.在文本分类中经常用到的自动特征选择方法都将词条在文档中出现一次和出现多次的情况同等对待,因而忽略了词条频率(TF)信息.本文提出了加入TF信息的改进的特征选择方法,有效的利用了TF信息,从而提高了文本分类的精确度.试验结果表明,改进的特征选择方法的试验效果比原始的特征选择方法的效果有明显的提高.