论文部分内容阅读
当前BBS论坛日益成为人们通过网络进行信息交换的中心,被越来越多的用户使用。为了营造一个健康的网络环境,从网页抓取、信息抽取到主要的文本挖掘技术中文分词、特征表示和提取、文本分类和聚类等方面进行了详细的介绍,同时阐述了其工作原理。此系统不仅可以防止恶意言论的传播,还大大节约了人力,极大地提高了工作效率。