论文部分内容阅读
分析分布式实时网络行为监控系统中Web网页安全性挖掘问题,设计实现一个基于Web挖掘的自动分类器,并构造一个实验环境来检测分类器的性能.该自动分类器利用特征提取算法实现对每个样本的特征向量提取和待分类文本的特征向量提取,利用基于k个“最近邻”(KNN)分类算法实现对网页的分类,能够提取出带有不安全信息的网页,分类效果良好.