论文部分内容阅读
近年来,数据挖掘中的许多方向都取得了不小的突破,在入侵检测领域也取得了不小的成果。但是在大多数研究的算法仅仅是针对数据集做一般模式的研究,然而在某些时候看来一些与数据集中大多数数据模式和行为不一致的数据点,也存在着非常重要的研究价值,这些点被称为离群点,由少量离群点组成的簇被称为离群簇。在数据挖掘中,使用某些算法将数据集中这些离群点或者离群簇检测出来的方法叫做离群检测。在网络环境中,网络入侵行为通常是网络行为中比例非常小的一部分行为,并且这部分行为会对网络环境带来一定的危害而且该行为本身就有别于正常行为,所以可以说网络入侵也属于离群行为。因此,这种特性为离群检测应用到入侵检测中提供了理论上的可行性。本文主要研究了基于近邻传播聚类的离群检测算法在入侵检测中的应用,详细介绍与分析国内外常用的离群检测算法,并对近邻传播算法做了详细的介绍;证明了该算法应用于离群检测的可行性,提出了基于近邻传播聚类的离群检测算法;并设计了基于离群检测的入侵检测算法模型与流程,通过AP算法先对数据集进行聚类然后进行聚类划分并计算离群指数,挖掘出入侵行为。通过一些列实验,验证了本文提出算法的有效性。本文的主要工作如下:(1)深入的研究了离群检测技术,分析了离群检测技术的现状,详细的阐述了离群检测技术的各种方法,并分析了这些方法的优缺点。(2)详细的介绍了近邻传播聚类算法,针对近邻传播算法的特点以及离群检测的特性与环境,验证了近邻传播算法应用于离群检测的可行性,提出了基于近邻传播聚类的离群检测算法。(3)深入的研究了入侵检测相关技术,并针对基于离群检测的入侵检测提出了相对应的算法模型与流程。(4)设计了基于近邻传播聚类的离群检测算法应用于入侵检测的实验方案,对网络入侵检测数据集KDD CUP 99进行了研究分析,并将算法与数据集用于实验,验证算法的效果。本文提出的ODAP算法应用于入侵检测环境中,并根据实验的准确率等指标进行评估。实验表明,基于近邻传播聚类的离群检测算法在入侵检测中有较好的效果。