HyperSplit数据包分类算法优化设计与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dianshenshizhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据包分类技术是许多网络关键技术的基础,涉及到网络的控制、性能、安全、管理等多方面内容,已经广泛应用于许多不同的场合,是未来网络发展主要研究的基础内容之一。研究与设计高性能实用的数据包分类算法,对满足网络服务的快速性与多样性意义重大,具有极为重要的学术价值和应用场景。本文分析了近年来一种实用性极高的数据包分类算法——HyperSplit的性能瓶颈,提出了基于多点切分思想的改进算法MultiSplit,并设计了一系列优化方法。经过实验验证,改进算法在分类速率、内存使用量等关键性能评价指标上均取得了较为明显的优化效果。本文主要工作和贡献包括:  1.从一些之前缺乏深入研究的着眼点入手,通过一系列实验对HyperSplit算法的性能瓶颈进行分析,同时指出传统性能分析方法的不足之处。本文进行了不同规则集性能对比、决策树/叶节点子集性能对比、底层节点空间分解效率分析、不同深度节点访存性能对比等四组实验,找到了不同类型中具有代表性的规则集,发现了决策树是影响分类速率的主要因素,而空间二分的分解方法,造成分解到较小规模的子空间后,空间分解效率降低,产生了多层节点,在查找过程中这些节点的访存代价大,处理时间长,是HyperSplit算法的主要性能瓶颈所在。  2.提出了一种基于多点切分思想的数据包分类算法——MultiSplit。在空间分解方法方面,MultiSplit借鉴了HyperSplit启发式的切分维度与切分点选择方法,能够很好地适应规则集特性,同时采用了多点切分的空间分解思想,极大地提升了空间分解效率,尤其对于底层节点能够快速缩小节点规模,大幅减小决策树高度,从而在实际应用中减少节点访存次数,提高分类速率。在数据结构方面,设计了高效的决策树节点数据结构,存储效率很高,扩展性强,对分类速率提升也产生了重要的影响。  3.提出了冗余规则去重、冗余规则范围缩减、过度切分修正三种优化方法,解决了原始算法在复杂规则集可用性、决策树平衡性、内存使用量等方面的潜在问题,进一步提升了算法时空性能。在Intel x86平台下的实验验证结果表明MultiSplit算法在分类速率、决策树内存使用量、适应性与可扩展性等关键性能指标上均明显优于HyperSplit算法,尤其是大规模规则集的分类速率上取得高达66%的平均提升效果。
其他文献
关系网络是人或其它对象通过相互联系和影响构成的结构或系统,通过对关系网络的研究,有助于发现仅依靠个体信息无法获得的重要信息。关系网络中节点价值计算是对关系网络中的对
安全策略模型是开发安全操作系统的基础,它对安全策略的描述准确与否,决定着所开发的系统安全机制是否能正确地实施安全策略。因此,安全模型的研究对于安全操作系统的开发具有重
学位
视景仿真系统广泛应用于各个研究领域,如军事科学仿真、空间任务仿真、城市规划等等。近年来,随着我国空间科学事业的迅速发展,基于空间任务的视景技术显得越来越重要,利用视
对流体现象的仿真模拟是计算机图形学中的一个重要研究方向,在许多领域尤其是电影、游戏中有着广泛的应用。在这些应用中,除绘制出具真实感的流体动画外,有时还需要以艺术化的手
软件复用是解决软件危机的一条切实可行的途径,软件构件库是软件复用的支持设施之一。构件库主要提供构件描述、分类、发布、存储、检索、反馈和评估等构件管理作用。当前,随着
性能分析与优化一直是计算机研究中的热点.著名的80-20原理告诉我们,程序中执行最为频繁的通常只是小部分被称为热点的代码.性能分析与优化的目的就是分析发现程序热点并使之
随着互联网带宽的优化,网络传输、视频压缩等技术的创新,视频已成为互联网最为重要的应用之一,是互联网流量主要贡献者。互联网视频访问模型不仅是视频分发缓存策略与系统设计实
最近五年内,在大量生物医学研究问题的驱动下,整体蛋白质的鉴定技术获得了快速发展:高通量的分离技术使得一次研究中可以同时鉴定到超过1,000个完整的蛋白质;高精度的质谱技术大
模型检测是一种自动完成性质验证的算法过程,模型检测器是模型检测算法的工具实现,可用来检验系统是否满足某些性质,如可达性、安全性等,可以及时发现问题,更改系统设计中的缺陷,避
学位
随着互联网技术的不断发展,大量电子文档的出现,知识的载体由过去的纸质文档转变成电子文档,术语在知识传播中的作用越来越重要。单纯依靠人工来整理和规范术语的工作越发繁重,利