论文部分内容阅读
文本分类能够帮助人们更有效地利用不断膨胀的海量网络信息,然而网络文本中已不再是以单一的文本内容形式出现,更多的是包含标题、关键字、摘要、正文等多种要素。若用传统的文本分类器,则效果明显不好。综合利用文本各要素,提出通过KNN算法对各要素进行文本分类,再使用模拟退火算法以及Baves定理协调各要素比重的多要素文本协调分类算法。实验结果表明,该算法是可行的,并且使用该算法得到的分类器比仅使用文本内容得到的分类器具有更高的分类准确率,