论文部分内容阅读
随着计算机网络技术的迅速发展,人们的工作、学习、生活变得越来越离不开计算机网络。与此同时,黑客攻击日益猖獗,网络安全问题日趋严峻,迫切需要各种网络安全技术来解决入侵攻击问题。入侵检测是继“信息加密”、“防火墙”等传统安全保护方法之后的新一代安全保障技术。作为一种主动防御的安全技术,入侵检测已经成为网络安全领域研究的热点,发展前景广阔。针对目前的入侵检测系统(IDS)准确度不高、自适应性差、检测效率低等问题,本文基于数据挖掘技术进行入侵检测研究,将分类、聚类、成分分析等多种数据挖掘方法综合应用于入侵检测过程中,以提高入侵检测系统的性能。本文首先分析了决策树方法应用于入侵检测系统的可行性,之后将C4.5决策树算法作为分类器应用于入侵检测的过程中,并设计了一个基于决策树的入侵检测系统模型,详细描述了模型中各模块的功能与设计。为提高系统性能,在模型中设计了“样本选择”和“特征提取”两个预处理过程。接着对“样本选择”和“特征提取”这两个预处理过程进行深入研究。分析了常用的几种样本选择方法的不足,提出一种基于聚类的样本选择方法。该方法先对各类训练数据分别进行聚类分析,达到细分数据的目的,在此基础上通过不同的策略选择每个簇的边界样本和典型样本。通过样本选择,提高了分类器的检测效率和泛化能力。接下来介绍了核主成分分析(KPCA)的基本原理,将其应用到入侵检测系统中,实现了对样本的特征提取,并比较其与主成分分析(PCA)的特征提取效果。针对KPCA存在的不足,提出一种用遗传算法改进KPCA的方法。通过遗传算法对提取出的特征进行优化选择,进一步提高了入侵检测系统的性能。最后在KDDCUP99数据集上的仿真实验,证明了本文各个研究的先进性。