面向高速网络的细粒度应用协议识别技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:bodao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向应用层的细粒度网络协议识别技术当前被广泛应用于上网行为管理、网络流量分析与控制和下一代防火墙等多种网络安全应用场景中,而随着网络应用数量的增长,待识别协议特征集合的规模也急剧增加,因此如何在保证协议识别准确率的前提下,对高速网络中的大量应用层协议进行细粒度识别,是当前协议识别领域研究的一个主要方向。  本文针对在构造正则表达式协议规则库过程中随着协议特征数量的增多而产生的状态图爆炸问题,对当前主流的正则表达式协议识别算法的匹配原理以及产生爆炸问题的原因进行研究,并对对高速网络协议的应用层协议特征进行提取和分析总结,设计并实现了基于改进AC算法的协议识别算法,并对算法进行了验证。本文的主要研究内容及创新如下:  (1)提取并分析总结了100个典型的应用层协议所具有的规律和特点。通过wireshark工具对100个各类型的网络应用行为进行抓包分析,对不同场景下抓取的数据包进行对比得出正则表达式形式的应用层协议特征,对协议特征进行归纳总结,并与普通正则表达式进行对比说明正则协议特征所独具的特点。  (2)提出并详细设计基于改进AC算法的的正则协议特征匹配算法。在对AC算法原理进行分析的基础上,提出了基于两次改进的AC算法进行正则协议识别的算法整体结构,并对改进的协议规则规构建算法和协议匹配算法进行详细设计。  (3)基于Java语言实现了改进算法并对算法的有效性和正确性进行了评测和验证。通过Java语言对算法进行实现并通过数学方法对算法整体的时间空间复杂度进行分析,最后通过对比使用改进算法和基于D2FA的协议识别算法对100个协议特征进行协议规则库构建的结果,验证了算法可以有效的解决大规模正则协议进行规则库构建时面临的爆炸问题。  本文通过结合应用的具体场景对正则表达式的匹配提出新的思路,使用改进的字符串匹配算法完成正则协议特征的匹配,有效解决了面对大规模协议特征时,协议规则库无法构建的难题,为同类问题的分析提供新的思路。
其他文献
离散属性数据是数据挖掘中的一类重要数据,而非监督学习,是数据挖掘采用的一类关键方法。本文针对多种类型的离散数据,包括文本数据,时序离散序列数据和多维离散数据,研究若干新的
随着互联网及其相关技术的发展,多域环境下的资源共享越来越普遍。域间的资源共享给域间合作带来了便利的同时也带来了安全问题。其中两个关键安全问题是跨域访问控制和跨域信
随着手机、掌上电脑和PDA等移动设备的普及和移动通讯技术的高度发展,越来越多的人开始利用移动设备实现无线上网。使用移动设备,通过无线上网的方式,进行的商品拍卖活动称为移
外包数据库是一种新的数据库应用形态,它在管理成本、数据库可用性与可靠性等诸多方面具有传统数据库应用形态无法比拟的优势。由于信任模型发生了本质性转变,外包数据库带来了
随着互联网视频内容的不断增加,以及数字图书馆、视频点播、远程教学等大量视频媒体的应用,如何在海量视频中检索出所需要的资料显得至关重要。传统的基于文本的视频检索以及基
为了评估信用风险,研究人员做出了大量的努力,提出了各种度量和管理信用风险的方法。经典的评估模型一般将着眼点放在被评估公司自身的信息上,然而银行界获得的越来越多的共识是
随着网络技术的飞速发展和嵌入式处理器能力的不断提升,基于嵌入式Linux的网络视频监控系统逐渐成为了监控设备中的主流,因为嵌入式Linux功能强大且费用较低。但是直接移植Linu
由于如今Web应用的高速发展所带来的数据规模的海量性、数据模式的多样性和不确定性,使得传统的数据管理技术在可扩展性、高效性和可靠性方面越来越不能满足应用的需求。数据
在数字图书馆建设中,人们面临着一个问题:如何高效地将现有的海量的纸质文档或者电子文档制作为可供计算机阅读、检索、查询、传播等操作的电子出版物。对于电子出版物,其所含有
随着硬件性能的不断提升,计算机正在被赋予越来越艰巨的任务,运行其上的软件作为沟通人类思维和底层硬件的桥梁,其重要性日益增加。与此同时,软件系统的规模也在不断变大,所涉及的