论文部分内容阅读
【摘 要】本文主要针对基于粗糙集和径向基神经网络的网络入侵检测模型方法研究,该方法结合粗糙集理论与径向基神经网络理论来建立网络入侵诊断模型,通过粗糙集对模糊数据的处理能力与径向基对数据分类的处理能力來处理数据,提高入侵检测系统的数据处理能力与数据处理速度。采用仿真软件为MATLAB。
【关键词】粗糙集;径向基神经网络;约简;网络入侵检测
如今,网络应用已经深入到了社会生活各个方面,人们的工作、学习、生活与之紧密地联系在一起。随之而来的网络系统安全成为了一个至关重要的问题,网络的开放性为信息的窃取、盗用、非法修改提供了可乘之机,随着网络技术的发展,网络入侵手段也越来越多,攻击者技术日益提高,网络攻击事件时常发生。目前大多数网络安全技术都为被动式防御,这已经不能满足安全需求。
网络安全三要素:数据保护、关系保护、能力保护。网络信息安全技术研究可以从上述三个方面进行考虑,入侵检测系统也是针对这几方面来进行对网络系统的保护。入侵检测被称作为是处于防火墙后面的第二道防线,它可以在保持系统网络性能的同时维持对内部或者是外部的攻击和误操作的实时保护。入侵检测可以说是网络防火墙的增补,它可以帮助系统管理员监控来自网络的攻击,对信息安全方面做出一定的保障。对已知的攻击,现在的入侵检测模型大都能很容易的检测出来,但是对于未曾出现过的新的攻击,则很难保证检测正确率。入侵检测系统的处理对象是一个包含大量不确定信息的数据集合,粗糙集理论是从这种信息中获取知识的有效方法,其中的一个重要环节是知识约减。粗糙集理论能可以从样本数据中寻找规律,从中找出数据之间的关联性,通过运用粗糙集理论能提高检测速度,应用于系统的实时检测。
1.粗糙集理论
粗糙集理论是一个处理不完整、不确定性、不相容性知识的数学工具。它与概率论、模糊集属于类似的工具。该算法属于一种数据挖掘方法,它在处理模糊数据方面有着巨大的优势与优点。
粗糙集算法有很多优势,其中包括:不需要提供被处理数据外的其它任何先验信息;该算法的易用性强。这个优势表明了它在处理模糊数据时发现挖掘数据中的潜在信息规律,并且去除冗余的属性,发现知识的规则,这使得它成为机器学习、知识获取以及进行不确定信息形式推理的基础。粗糙集理论与其它的数据挖掘理论的方法相对比最大的区别与优点就是不需要任何先前给定的先验知识,这使得它能够对其它数据挖掘方法如概率论、模糊理论等理论起到互补作用。
2.神经网络
神经网络是一门活跃的边缘性交叉学科。神经网络理论可以用来实现大量信息的并行处理和大规模平行计算。
人工神经网络是一种数学运算模型,一般而言就是对自然界某种算法或函数的逼近,它可能是对某一种逻辑策略的表达。它的构想来源于模拟大脑组织的神经突触连接结构,它是由许多节点与节点相连起来组合而成的,组成它的每个节点都代表某种特定的激励函数,它通过这种类似构造进行数据处理。在神经网络中,节点间的连接就是可以当为大脑神经突触的连接,这些连接就是神经网络的记忆,组成它的节点之间的连接代表对于通过该连接信号的加权值称为权重,随着网络的连接方式、权重值与激励函数的改变,网络的输出也会产生变化。
3 实验使用原始数据
本文设计入模型时使用的原始样本数据包含15个种类的故障类型,每个故障类型取15个样本,每个故障类型样本有15个特征属性。其中所使用的网络故障的部分样本数据如表1所示。
4.实验过程的数据处理
因为粗糙集理论不能直接处理非数据类型的信息,所以首先把15个故障类型用数字代号代替,分别依次分类标记为:10,20,30,40,…,150,同样的把属性2、属性3和属性4用数字进行代替。
这些原始样本数据在经过k-均值算法聚类与粗糙集算法知识约减后,用作为径向基网络的原始输入数据。
进过多次试验,选择将这些数据聚类为4类,由于数据过多,不在此具体列出,将会在答辩演示时给出具体数据列表。
5. MATLAB中径向基神经网络的建立
将经过聚类约减后的特征属性数据作为径向基神经网络的输入数据,将输入的特征数据构建成一个15*225的矩阵P,相应的分类Tc设置为为[10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 …… 150 150 150 150 150 150 150 150 150 150 150 150 150 150 150]
然后将目标分类数据索引Tc转换为目标分类向量T,然后用newpnn函数设计PNN,在这里,经过多次尝试比较分析,扩展系数设置为0.8,
T=ind2vec(Tc); %将目标分类数据索引Tc转换为目标分类向量T
spread=0.8; %扩展系数设置为0.8
net=newpnn(P,T,spread); %创建一个PNN
在创建PNN后,用测试集去测试其性能。测试集数据包含15类故障类型,每类故障类型选取5个样本,每个样本有15个属性特征。
将测试集数据进行聚类,然后输入,建立15*75的测试矩阵p,
a=sim(net,p); %对训练后的网络进行仿真
ac=vec2ind(a); %将目标分类向量a转换为目标分类数据索引ac
6.仿真结果
在这,本文主要对径向基网络生成的结果进行分析,同时将此结果与最小二乘回归建模生成的结果进行简要的列表对比。
其仿真结果如表5。
从仿真数据可以看出,PNN模型对normal部分的检测结果完全真确,表明该模型对正常数据的误报率较低,同时,也未发现有把其它异常判定为normal的情况,表明该模型具有一定的防护能力,但是,在判断具体的异常类型时出现了部分判断错误的情况,这还需要进一步改进。最后仿真结果表明,该模型的检测真确率为86.7%,漏报率为0&,错报率为13.3%,这个结果检测率远高于用最小二乘法回归建模得到的模型。
实验表明,将粗糙集与径向基神经网络结合起来应用到入侵检测系统中是可行的,其漏报率也较低,检测准确率较高,对于一些实时性要求不是很高的系统,它具有一定的实用价值。
7.总结与展望
在研究与实践中,对K-均值分类算法、粗糙集知识约减原理、入侵检测技术、最小二乘法多元线性回归建模、径向基神经网络的基本原理有了深刻了了解与认识。在做了一定的实验与比较的基础上提出了基于粗糙集与径向基神经网络的入侵检测模型,并在现有的实验环境下实现了一个基本的带有一定检测能力的入侵检测模型。
7.1 工作总结:
(1)阐述了课题背景与研究的目的,对网络入侵检测的现状进行了一定的分析。(2)介绍了最小二乘法、粗糙集理论与径向基神经网络技术,在最小二乘法回归建模失败的基础上,选择利用径向基神经网络技术建立检测模型。(3)通过仿真对建立的模型进行检测,验证其可行性。
7.2本次设计的主要缺陷:
(1)对数据的约减还不够彻底,分类还不够完善,需要挖掘更好的方法来进行数据分析。(2)数据采样的样本数目还太少,覆盖范围不够广阔,这影响了后面建立的入侵检测模型的精确度。(3)还需要进一步的加强系统的推理分析能力,进一步提高系统的检测分辨能力。
参考文献:
[1]贾春福.系统级入侵检测技术研究[J].计算机工程与应用,2002,13:24-25.
[2]张红梅,王勇,王行愚.基于粗糙集理论的网络型入侵检测系统[J].计算机工程,2006,32(19):29-33.
[3]戴庆华,邹平.粗糙集理论及其在多目标决策中的应用[C].中国控制与决策学术年会论文集,2004 :839-842.
[4]向继,高能,荆继武.聚类算法在网络入侵检测中的应用[J].计算机工程,2003,29(16).
[5]李宇泊.K均值算法初始聚类中心选取相关问题研究[D]. 兰州:兰州交通大学硕士论文,2012.
作者简介:
郑凌野(1992.1-),男,汉族,浙江省浦江县,专业:电子信息科学与技术,宁波大学信息科学与工程学院。
【关键词】粗糙集;径向基神经网络;约简;网络入侵检测
如今,网络应用已经深入到了社会生活各个方面,人们的工作、学习、生活与之紧密地联系在一起。随之而来的网络系统安全成为了一个至关重要的问题,网络的开放性为信息的窃取、盗用、非法修改提供了可乘之机,随着网络技术的发展,网络入侵手段也越来越多,攻击者技术日益提高,网络攻击事件时常发生。目前大多数网络安全技术都为被动式防御,这已经不能满足安全需求。
网络安全三要素:数据保护、关系保护、能力保护。网络信息安全技术研究可以从上述三个方面进行考虑,入侵检测系统也是针对这几方面来进行对网络系统的保护。入侵检测被称作为是处于防火墙后面的第二道防线,它可以在保持系统网络性能的同时维持对内部或者是外部的攻击和误操作的实时保护。入侵检测可以说是网络防火墙的增补,它可以帮助系统管理员监控来自网络的攻击,对信息安全方面做出一定的保障。对已知的攻击,现在的入侵检测模型大都能很容易的检测出来,但是对于未曾出现过的新的攻击,则很难保证检测正确率。入侵检测系统的处理对象是一个包含大量不确定信息的数据集合,粗糙集理论是从这种信息中获取知识的有效方法,其中的一个重要环节是知识约减。粗糙集理论能可以从样本数据中寻找规律,从中找出数据之间的关联性,通过运用粗糙集理论能提高检测速度,应用于系统的实时检测。
1.粗糙集理论
粗糙集理论是一个处理不完整、不确定性、不相容性知识的数学工具。它与概率论、模糊集属于类似的工具。该算法属于一种数据挖掘方法,它在处理模糊数据方面有着巨大的优势与优点。
粗糙集算法有很多优势,其中包括:不需要提供被处理数据外的其它任何先验信息;该算法的易用性强。这个优势表明了它在处理模糊数据时发现挖掘数据中的潜在信息规律,并且去除冗余的属性,发现知识的规则,这使得它成为机器学习、知识获取以及进行不确定信息形式推理的基础。粗糙集理论与其它的数据挖掘理论的方法相对比最大的区别与优点就是不需要任何先前给定的先验知识,这使得它能够对其它数据挖掘方法如概率论、模糊理论等理论起到互补作用。
2.神经网络
神经网络是一门活跃的边缘性交叉学科。神经网络理论可以用来实现大量信息的并行处理和大规模平行计算。
人工神经网络是一种数学运算模型,一般而言就是对自然界某种算法或函数的逼近,它可能是对某一种逻辑策略的表达。它的构想来源于模拟大脑组织的神经突触连接结构,它是由许多节点与节点相连起来组合而成的,组成它的每个节点都代表某种特定的激励函数,它通过这种类似构造进行数据处理。在神经网络中,节点间的连接就是可以当为大脑神经突触的连接,这些连接就是神经网络的记忆,组成它的节点之间的连接代表对于通过该连接信号的加权值称为权重,随着网络的连接方式、权重值与激励函数的改变,网络的输出也会产生变化。
3 实验使用原始数据
本文设计入模型时使用的原始样本数据包含15个种类的故障类型,每个故障类型取15个样本,每个故障类型样本有15个特征属性。其中所使用的网络故障的部分样本数据如表1所示。
4.实验过程的数据处理
因为粗糙集理论不能直接处理非数据类型的信息,所以首先把15个故障类型用数字代号代替,分别依次分类标记为:10,20,30,40,…,150,同样的把属性2、属性3和属性4用数字进行代替。
这些原始样本数据在经过k-均值算法聚类与粗糙集算法知识约减后,用作为径向基网络的原始输入数据。
进过多次试验,选择将这些数据聚类为4类,由于数据过多,不在此具体列出,将会在答辩演示时给出具体数据列表。
5. MATLAB中径向基神经网络的建立
将经过聚类约减后的特征属性数据作为径向基神经网络的输入数据,将输入的特征数据构建成一个15*225的矩阵P,相应的分类Tc设置为为[10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 …… 150 150 150 150 150 150 150 150 150 150 150 150 150 150 150]
然后将目标分类数据索引Tc转换为目标分类向量T,然后用newpnn函数设计PNN,在这里,经过多次尝试比较分析,扩展系数设置为0.8,
T=ind2vec(Tc); %将目标分类数据索引Tc转换为目标分类向量T
spread=0.8; %扩展系数设置为0.8
net=newpnn(P,T,spread); %创建一个PNN
在创建PNN后,用测试集去测试其性能。测试集数据包含15类故障类型,每类故障类型选取5个样本,每个样本有15个属性特征。
将测试集数据进行聚类,然后输入,建立15*75的测试矩阵p,
a=sim(net,p); %对训练后的网络进行仿真
ac=vec2ind(a); %将目标分类向量a转换为目标分类数据索引ac
6.仿真结果
在这,本文主要对径向基网络生成的结果进行分析,同时将此结果与最小二乘回归建模生成的结果进行简要的列表对比。
其仿真结果如表5。
从仿真数据可以看出,PNN模型对normal部分的检测结果完全真确,表明该模型对正常数据的误报率较低,同时,也未发现有把其它异常判定为normal的情况,表明该模型具有一定的防护能力,但是,在判断具体的异常类型时出现了部分判断错误的情况,这还需要进一步改进。最后仿真结果表明,该模型的检测真确率为86.7%,漏报率为0&,错报率为13.3%,这个结果检测率远高于用最小二乘法回归建模得到的模型。
实验表明,将粗糙集与径向基神经网络结合起来应用到入侵检测系统中是可行的,其漏报率也较低,检测准确率较高,对于一些实时性要求不是很高的系统,它具有一定的实用价值。
7.总结与展望
在研究与实践中,对K-均值分类算法、粗糙集知识约减原理、入侵检测技术、最小二乘法多元线性回归建模、径向基神经网络的基本原理有了深刻了了解与认识。在做了一定的实验与比较的基础上提出了基于粗糙集与径向基神经网络的入侵检测模型,并在现有的实验环境下实现了一个基本的带有一定检测能力的入侵检测模型。
7.1 工作总结:
(1)阐述了课题背景与研究的目的,对网络入侵检测的现状进行了一定的分析。(2)介绍了最小二乘法、粗糙集理论与径向基神经网络技术,在最小二乘法回归建模失败的基础上,选择利用径向基神经网络技术建立检测模型。(3)通过仿真对建立的模型进行检测,验证其可行性。
7.2本次设计的主要缺陷:
(1)对数据的约减还不够彻底,分类还不够完善,需要挖掘更好的方法来进行数据分析。(2)数据采样的样本数目还太少,覆盖范围不够广阔,这影响了后面建立的入侵检测模型的精确度。(3)还需要进一步的加强系统的推理分析能力,进一步提高系统的检测分辨能力。
参考文献:
[1]贾春福.系统级入侵检测技术研究[J].计算机工程与应用,2002,13:24-25.
[2]张红梅,王勇,王行愚.基于粗糙集理论的网络型入侵检测系统[J].计算机工程,2006,32(19):29-33.
[3]戴庆华,邹平.粗糙集理论及其在多目标决策中的应用[C].中国控制与决策学术年会论文集,2004 :839-842.
[4]向继,高能,荆继武.聚类算法在网络入侵检测中的应用[J].计算机工程,2003,29(16).
[5]李宇泊.K均值算法初始聚类中心选取相关问题研究[D]. 兰州:兰州交通大学硕士论文,2012.
作者简介:
郑凌野(1992.1-),男,汉族,浙江省浦江县,专业:电子信息科学与技术,宁波大学信息科学与工程学院。