论文部分内容阅读
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可被理解的信息和知识的非平凡过程。任何有数据管理和知识发现需求的地方都可以借助数据挖掘技术来解决问题。
入侵检测系统(IDS)是一种用来发现外部攻击和合法用户滥用特权的系统。为了提高IDS的检测效率,数据挖掘技术已被越来越广泛地应用于IDS中。
本文重点研究了聚类算法在入侵检测系统中的应用。针对IDS被检测数据源的特点,以提高经典聚类算法K-means在IDS数据集上的聚类效果为目标,设计了一种数据预处理方法。本文还以提高聚类算法的适应性和聚类精度为目标,设计了一种新的基于层次聚类的模糊聚类算法,该算法可以快速发现高密度数据区域,对这些区域进行分析与合并,再通过评估函数评估,最终可找出最优的聚类方案。为了验证所提出的预处理方法和新聚类算法对IDS的有效性,本文基于KDD Cup 99数据集进行仿真实验,实验结果表明:K-means算法在预处理过的IDS数据集上取得了更好的的聚类效果,新的聚类算法也在预处理过的IDS数据集上取得了较高的聚类精度。
论文对数据挖掘技术在IDS中的应用做了有益的研究。