面向入侵检测的聚类算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:miaoyuan3660346
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络安全问题日益突出的今天,如何迅速而有效地利用基于数据挖掘的入侵检测系统发现各种入侵行为,对于保证系统和网络资源的安全十分重要。传统的面向入侵检测的数据挖掘技术需要在大量的已标记数据集上建立入侵检测模型,数据集的标记过程需要以手工的方式进行,并且如果标记错误,将导致入侵检测系统检测效率的降低。以聚类为代表的无监督异常检测方法可以在无标记数据集上发现异常数据,克服了传统数据挖掘方法的缺陷,使标记数据集和入侵检测建模过程自动化,成为了入侵检测的有力工具。为了提高聚类算法的效率,针对传统的发现异常数据算法存在的时间复杂度较大的缺陷,设计了一种面向入侵检测的聚类算法KnnCT。算法主要包含两个步骤:首先利用一个的聚类算法依据一定的聚类宽度对数据集进行聚类,根据生成聚类中包含的记录个数,把包含较少记录的一定比率聚类组成的集合作为异常记录候选集;接下来在异常记录候选集中根据记录与其k个最近邻居的距离和找出其中包含的异常,在这个过程中通过引入分块读取数据和阈值技术,排除了大部分正常记录与其k个最近邻居计算距离和的过程,其中阈值定义为当前已发现的n条距离和最大的异常记录中的距离和最小值。KnnCT算法可以用于进行数据预处理,为其他数据挖掘算法自动生成训练或测试用标记数据集,进行数据分析,也可以用于直接为入侵检测系统建模和进行实时入侵检测。通过在KDD Cup 1999数据集上的实验证明,KnnCT算法无论在执行时间还是检测效率方面都比传统算法有一定提高,对于入侵检测系统而言更为实用。
其他文献
随着对多Agent系统研究的逐步深入,以及基于多Agent技术的应用系统不断出现,Agent及多Agent系统安全性日益成为一个重要的研究课题。本文的主要工作就是在分析了多Agent系统
在Internet发展的初期,网络应用主要集中在电子邮件、文件传输等传统应用,它们对服务质量QoS(Quality of Service)不敏感.随着Internet中各种技术的迅猛发展,一些新型实时多
随着网络技术的发展,Internet上出现了多种多样的应用,其中不少是高带宽的多媒体应用,这带来了带宽的急剧消耗和网络拥塞问题。组播技术正是为了解决这些而提出的,它有效提高带宽
设计模式是软件工程领域的一个热点研究方向。“四人帮”合著的《设计模式》出版,引起人们开始对软件模式的热情关注。《设计模式》帮助人们超越个别的概念化设计关系,抓住体
负荷预测技术是近年来各国潜心研究的一个新领域,它对于电力系统的规划与运行、获得最好的经济效益,有重大的意义。特别是电力科技与其它学科发展将会更加交融和促进。利用人工神经网络方法来对电力负荷进行短期预测是一种常用而且非常有效的一个方法。因此,与人工神经网络相关的一些预测算法就成为预测技术发展的一个重点。 本文首先对预测技术,人工神经网络及其应用于电力系统进行了一些理论基础的介绍和探讨工作,重点
文本信息抽取是自然语言处理任务中的一个重要研究方向,其目的是从自然语言文本中抽取实体,关系和事件等事实信息,并形成结构化的数据输出。信息抽取的一个核心问题是有效地表示
随着数据库技术与网络技术的发展,由计算机网络与数据库系统结合构成的分布式系统已经逐步成为当今的主流系统.其中,分布式多数据库系统很好地解决了数据的共享和跨地域管理
自动语音应答系统是呼叫中心平台中非常重要的一个组成部分.该系统采用语音卡技术,自动对用户的电话进行应答,并根据用户的选择和指令进行相应的操作,并把结果通过语音播放给
实时操作系统(Real-Time Operating System,RTOS)普遍都具有多任务和实时性的特点。多任务指的是多任务并发执行。由于任务间并发,必然会导致任务之间共享资源。RTOS管理共享
目前,SAN(Storage Area Network)是主流的存储技术之一,SAN具有高速度、高可用性、高可扩展性、跨平台、较低的总体拥有成本(TCO)、远程虚拟存储等特性,为海量数据的存储和管