基于状态削减的正则表达式匹配优化技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dick_ust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度包检测技术在网络安全应用中发挥着重要作用。随着入侵特征的不断复杂化,正则表达式由于其强大的表达能力逐渐成为深度包检测系统描述入侵特征的主要语言,正则表达式匹配也逐步成为了网络安全领域的研究热点。网络带宽的爆炸增长和网络入侵特征的不断复杂化给深度包检测带来了巨大的压力,正则表达式匹配需要在有限的内存资源下进行线速的高效匹配。  传统的基于非确定化有限自动机(Non-deterministic Finite Automaton,NFA)的正则表达式匹配技术由于其需要在匹配过程中多次访问内存的缺点已经无法满足深度包检测的实时性要求。越来越多的网络安全应用开始采纳基于确定化有限自动机(Deterministic Finite Automaton,DFA)的正则表达式匹配技术,但是DFA会遇到状态膨胀的问题。NFA状态的部分确定化技术可以生成一个状态空间和匹配效率介于NFA与DFA之间的复合自动机。复合自动机兼有NFA内存消耗小和DFA高效匹配效率的优点,因此吸引了国内外很多学者的关注。由于无法找到NFA部分确定化的准确位置,现有的复合自动机只在一部分正则表达式下面有着良好的匹配效率。本文以NFA状态关系为入口,研究一种的新的NFA部分确定化技术。本文的贡献主要有以下几个方面:  1.研究NFA状态关系的获取技术。基于NFA状态所代表的语言集合,采用了三个变量将NFA的状态关系分为等价、包含、被包含、互斥和相交等五种关系;提出了一个通过有限自动机(Finite Automaton,FA)的活跃状态集来准确计算状态关系的算法,并给出了一个高效的获取所有活跃状态集的方法。实验结果证明,该方法不仅能准确地得到状态关系,而且其空间占用和时间消耗仅是已有方法的1/256和15%左右。  2.研究基于NFA状态关系的NFA部分确定化技术。基于获得的NFA状态相交关系,提出了一个获取NFA导致状态膨胀的状态—毒瘤状态的方法;基于子集构造法,提出了一个新的复合自动机(Excl-deterministic Finite Automata,EFA)的构造方法。实验结果证明,EFA有着近似于DFA的匹配效率同时状态规模只有DFA的1/10左右。  3.研究EFA的优化技术。提出了基于状态分组的的优化技术,通过将具有相交关系的NFA状态尽量分到不同的状态组来尽量降低EFA的状态规模;提出了基于i-DFA的优化技术,采用i-DFA的存储结构存储EFA,保证EFA的匹配过程中同时最多只有i个活跃状态。
其他文献
真实感图形绘制一直是计算机图形学重要且基础的研究内容,广泛应用在电影、游戏、模拟仿真等领域。由于人们对真实感绘制的要求越来越高,使得场景几何越来越复杂,绘制效果越来越
无线传感器网络的发展直接带来了针对无线传感器网络的数据、服务等资源的整合、管理需求。SWE是基于OGC组织的web服务框架及信息模型提出的针对无线传感器网络资源的框架,通
探空火箭是进行近地空间环境探测、资源开发和科学试验的有效工具,可以为发展新仪器、新试验、新观测技术以及探索新的领域提供经济且有效的手段。经过近70年的发展,火箭探空技
随着企业管理信息化程度的进一步加深,企业对于信息化的要求也越来越高,资源是企业重要的资产,企业对于资源的管理要求也非常高,在管理范围、管理质量和管理系统建设规范性上
为了增强卫星在轨试验运行的可靠性,需要建立联合仿真模型对卫星状态进行综合仿真,研究控制异常时的有效对策。有效载荷数据多路复接器是卫星在轨试验数据传输系统的重要组成部
在过去近20年的时间里,集群和网格系统被广泛应用于高能物理数据处理。传统的以数据与计算分离的集群结构需要将大量的数据通过网络传输到计算节点进行处理分析,导致I/O成为系
在现代网络中存在着大量不同的应用程序,这些应用程序产生不同类型的流量,它们对于QoS的要求是不一样的。和传统的流量分类方法相比,使用机器学习技术来进行流量分类由于不依赖
短短几年间,包括微博在内的社会化媒体得到了长足的发展,所拥有的用户数量和参与率不断刷新记录,在社会生活中的地位和作用也越来越重要。其不但创造了一种新的沟通形式,更逐渐打
电力系统是一种典型的信息物理系统,其动力学具有混成性、非线性、高维度、包含控制变量等特点。安全性是电力系统运行中的一项重要指标。为了保证电力系统安全稳定运行,动态安
互联网应用的内容存取模式已从单数据中心的分布式存储形式向跨数据中心的全局、大规模海量的分布式存取形式发展。传统的分布式存储文件和数据库系统的学术思想和设计原理在