基于数据挖掘的网络入侵检测技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wingoH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测系统是安全体系结构中的重要环节,是对入侵进行预防、检测与响应的基础。近年来,随着网络数据流量不断增大,传统的基于人工建模的入侵检测技术已经越来越无法适应新的网络环境。为了解决从海量数据中提取有用信息的问题,基于数据挖掘的入侵检测技术得到了研究人员的关注。然而,随着研究的不断深入,基于数据挖掘的异常入侵检测研究逐渐暴露出一些问题和困难,如误报率与漏报率过高导致检测结果的准确性不高,检测结果难以理解,时变的网络数据行为模式使得建立正常的网络行为轮廓更加困难等。本文主要从提高入侵检测精度与可理解性的角度出发,围绕基于数据挖掘的入侵检测研究中存在的特征选择、小样本学习、可扩展性与概念漂移以及可视化等问题展开深入研究。本文的主要研究内容和贡献有: (1)攻击特征优化选择。针对入侵检测中存在的特征选择问题,采用改进的多目标遗传算法来为不同类型的攻击选择相应的最优特征子集,有效地提高了所生成的检测模型的检测精度,并在此基础上提出了一种基于改进的多目标遗传算法的入侵检测集成方法,选择具有较高分类精度与多样性的基分类器构建集成入侵检测模型,不但实现了检测率与误报率的均衡优化,而且使得算法能够在所有的攻击类型上获得平衡的检测性能。 (2)基于小样本先验知识的训练集扩展方法。针对网络环境中存在的获取标记实例困难的问题,提出了一种基于小样本标记实例的异常入侵检测算法,利用半监督聚类方法对小样本标记实例进行扩展,有效地解决了有监督入侵检测算法中训练样本不足的问题,提高了入侵检测算法的检测精度,其检测精度明显优于非监督的异常入侵检测算法。同时,算法所具有的较强的处理小样本标记实例问题的能力,使其更具实用性。 (3)动态自适应检测模型研究。持续不断地到达的网络数据要求检测模型具有良好的扩展性,同时,时变的网络行为模式则要求检测模型要能够适应网络行为模式的改变。针对这一问题,提出了一种基于集成学习的数据流异常入侵检测模型,以数据流模型的形式描述网络数据,将持续到达的网络数据流按照时序划分为不同的数据块,并针对各数据块分别生成相应的检测模型。同时,采用选择性集成方法,从所有的基分类器中选择适当的分类器组成集成入侵检测模型,不但有效地解决了入侵检测算法的扩展性问题,而且充分利用了最能反映当前网络行为模式的基分类器,提高了入侵检测的精度和效率,其检测结果明显好于基于所有历史数据进行等同学习的入侵检测算法。 (4)入侵检测可视方法研究。针对由于网络数据复杂性导致的网络数据结构以及入侵检测的过程与结果难以被用户理解的问题,提出了一种基于可视化聚类的异常入侵检测框架,通过基于密度的聚类方法将网络数据划分成不同的簇,在考虑核心对象对其邻域对象的影响的基础上,令簇中的对象向其相应的核心对象“收缩”,使簇的构成更加紧密,簇间的距离更大。最后将“收缩”后的原始空间中的网络数据点映射到二维可视空间中,将网络数据结构直观地呈现给用户,使用户能够从中发现有价值的可视信息。同时,用户还可以根据攻击数据与正常数据在二维空间中分属于不同位置的特点,发现对网络的攻击行为,是对当前的异常入侵检测算法的有力补充。
其他文献
模型检验是对程序或系统使用严格的模型方法证明程序是否满足给定的性质。软件模型检验技术使用谓词抽象的自动化方法解决了整数、实数、循环边界等程序问题,但是对于中断冲突
随着互联网的飞速普及、网络技术的迅速发展,从网络获取信息已经成为人们的一种习惯。但是网络中同样存在着各种不良信息,带来了很多不安全因素。不断增多的网络攻击事件以及网
动态电路的概念自20世纪80年代被提出来,因其具备晶体管数目少、扇入电容小、跳变速度快、流水开销小等优点,而被广泛应用于各种高性能处理器中。自动化所正在承担研发的高性能
数据资源是信息社会中最宝贵的资源之一;科学数据是e-Science 的重要基础。关系型数据通常是经过认真设计和仔细整理的数据,具有更高的价值。大量用户通过网络共享大量关系型数
随着计算机网络的发展和普及,网络安全问题受到越来越多的关注。入侵检测作为一种主动的信息系统安全保障措施,有效地弥补了传统安全防护技术的缺陷,是安全防御体系的一个重要组
学位
目前,网络安全事件层出不穷,网络安全已经成为人们日益关注的焦点。如何对网络进行全面评估,及时修补网络系统安全漏洞,最大限度地降低系统安全风险程度,已成为网络安全领域一个重
学位
本文主要内容如下:第一章介绍了机器视觉的基本概念、组成和市场应用前景;第二章介绍了印刷质量检测的具体需求,国内外研究现状,以及机器视觉成象系统和光源系统的基本概念和
随着国家法制化建设的稳步推进,司法公开化的体制已经逐步形成,裁判文书作为司法诉讼结果的记录载体,已经在网络上全面依法公开。同时随着自然语言处理技术的发展,其与大数据
网络安全问题日益突出,如何检测并阻止网络攻击成为一个重要课题。传统基于特征的检测方法难以检测新出现的攻击或现有攻击的变种。另外随着加密协议的广泛应用,传统方法也难以
机器人足球比赛是近年来在国际上迅速开展起来的高技术对抗活动。它是人工智能领域与机器人领域的基础研究课题,是一个极富挑战性的高技术密集型项目。本文以足球机器人系统的