面向互联网安全监控的网络流量处理关键技术研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:fengpose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展和网络应用的日益广泛,互联网在社会的方方面面都发挥着越来越重要的作用。与此同时,各种安全问题也层出不穷,严重威胁着互联网的健康发展。网络流量安全监控系统作为一类互联网安全基础设施,在防范黑客入侵和攻击、恶意代码传播、重要信息失窃密、不良信息扩散等方面发挥着重要的作用。近年来随着P2P、VoIP、网络流媒体等新兴应用异军突起,网络流量和会话规模呈现爆炸式增长,在这种情况下如何实现对大规模流量的实时、复杂的管理和控制,成为网络流量安全监控面临的一项重要挑战。   针对互联网流量分布式安全监控节点的性能及效率问题,本文选取了网络会话管理、报文分类、内核协议栈套接字性能优化等几项网络流量处理关键技术进行了研究,主要包括:   (1)针对大规模网络流量会话管理问题,提出了一种适用于并行执行环境的网络会话管理方案PaSeM(Parallel Session Management),采用基于散列表的无锁会话表设计和多种并行策略,讨论并解决了在高速网络环境下面临的各种并行冲突问题,给出了会话表查询和动态管理的高效并行算法,实现了对报文和会话的并行无冲突的高效处理。基于G/G2/n1排队模型和空竭服务多重休假M/G+D/1排队模型对PaSeM的性能进行了理论分析,对于稳态下并行处理单元(PE)数量、任务队列长度、存储开销与报文到达速率、会话到达速率之间的关系以及其他关键参数应满足的条件给出了定量计算方法。最后,采用基于IXP2400网络处理器的硬件平台进行了原型开发和实验。实验结果表明,PaSeM对于会话管理和报文处理具有较好的并行加速效果,理论计算值与实验值能较好地吻合,报文处理的并行效率均值接近1,当会话管理单元个数为4时,会话处理并行效率为65.4%(亦即加速比为2.62),当会话管理单元个数为8时,会话处理并行效率仍然达到了48.3%(加速比为3.86),能够满足当前高速网络环境流量处理的性能要求:在最大吞吐量负载下排队队列长度及其变化幅度都处于合理范围,会话表垃圾比率维持在较低的水平上(实验结果为小于9%),与已有的工作相比为优。   (2)针对面向多维复杂规则集的报文分类问题,提出了一种基于自适应缓存机制的报文分类算法CSAC(Classification on Self-Adaptive Cache)。算法采用两级散列表缓存结构:第一级用于存储从规则集中提取出来的含有单IP属性值的无冲突(conflict-free)规则,第二级作为余下规则的动态缓存器。与朴素的基于流量时间局部性原理的缓存策略不同,CSAC算法引入流量空间局部性和规则集动态特征,通过缓存属性子空间内报文集合的分类查询路径,将查询结果复用于同一子空间后续报文的分类过程,获得了较好的查询命中率,而且在命中失效后也不必在原始规则集中再从头开始执行线性查询,减少了失效的时间开销。与传统的线性搜索算法和流缓存策略进行比较,CSAC算法的平均查询开销得到了显著的降低,分别为线性查询算法的2.94%-11.81%、流缓存策略的2.62%-25.16%,同时最坏情况下的查询效率与这两种算法相比也没有明显的下降。与HyperCuts、BV等基于规则集静态特征的经典算法相比较,CSAC算法改善了最坏情况下的存储开销,规则平均存储开销为93.53-226.98字节。根据网络流量变化对缓存运行状态造成的影响,算法采用自适应机制,通过动态调整缓存粒度和缓存项在散列桶中的位置,有效地保证了缓存命中率。此外,算法不需要预处理过程,支持多维复杂规则(如地址区间属性、范围匹配和逻辑匹配操作等)和规则增量更新,且易于软件实现,适合于网络监控、网络边界安全、用户流量审计和负载均衡等报文分类比较复杂的应用。   (3)根据基于透明代理模式的内容监控系统的技术特点和应用需求,针对现有内核网络协议栈套接字在流量重定向、端对端语义保持、内核空间和用户空间数据复制、数据发送开销等方面存在的问题,在向后兼容(伯克利套接字)的基础上提出了一种新的面向互联网流量监控的网络套接字SEP Socket,通过扩展套接字身份标识定义,将套接字地址与代理模块绑定的本地IP地址和监听端口解耦,实现了外部流量无需修改直接重定向至本地网络协议栈,避免了网络地址转换的性能损耗、对本地端口资源的占用以及对端对端语义的破坏;采用混杂连接粘合(hybrid connection splicing,HCS)方法,通过在内核中缓存原始报文的sk buff结构以及增加新的套接字接口调用,实现了用户层驱动的内核套接字之间的直接报文传递,减少了一次从用户空间到内核空间的数据复制,以及协议栈重新分配和构建sk buff结构、进行协议封装等复杂操作的开销;在改善性能的同时保证了业务的灵活性,向上提供数据转发(粘合)、丢弃、替换等灵活的流量控制策略,能够满足内容实时监控的需要。基于Linux v2.6.22内核实现了SEP Socket的原型并进行了实验,在访问1KB大小HTML页面文件时,基于SEP Socket的透明代理与基于NAT的传统透明代理相比,前者的最大新建连接速率和吞吐量分别达到了后者的3.96倍和3.92倍,且CPU利用率也有了显著提高。   (4)基于上述关键技术的研究,在国家高技术研究发展计划(863计划)课题和国家242信息安全计划的资助下,设计并开发了一个基于异构处理平台(IXP2400网络处理器+IA通用处理器)的网络流量监控引擎SEP(Security Engine Package)。测试结果表明,SEP网络流量监控引擎能够达到4Gbps的吞吐量、每秒8万的新建连接速率和40微秒以内的处理延迟,内部处理器间通信带宽达到双向千兆,能够满足千兆线速网络流量安全监控的需要。基于SEP网络流量监控引擎研制的P2P网络流量监控系统,已在国家相关课题项目中成功应用。
其他文献
随着越来越多的移动运营商投入运营,移动市场的竞争日益激烈。要在如此艰巨的情况下保住市场占有率,只有依靠更加贴心的服务和更加优秀的网络。如何在网络不断发展的过程中,
网络地理信息系统(WebGIS)是GIS(GeographicInformationSystem,地理信息系统)技术与Web技术有机结合的产物。开展基于网络的GIS研究,实现不同地理位置的数据信息的统一管理和
科学研究活动中会产生大量的观测和实验数据,将这些数据进行收集处理后保存到数据库中供应用系统使用,或者在协同科研环境中共享,这是科研信息化(e-Science)的重要基础工作。数
虚拟现实(VirtualReality,简称VR)是一门综合技术,能够逼真的模拟虚拟场景,并提供全新的人机交互方式。随着计算机硬件性能的大幅度提高,使得VR的应用领域也不断拓展,但在国
煤炭是我国的重要能源,煤炭企业综合统计是国家综合统计的基础之一,是国家能源统计的重要组成部分。同时也是煤炭行业最重要的管理业务,是其一切业务活动的协调、指导与控制
近年来,自然现象的建模和渲染是虚拟现实与系统仿真研究热点问题。云的外形美观,在飞行模拟、虚拟场景绘制中应用广泛,但是云的运动复杂、形状多样、变幻莫测,因此如何模拟出
随着移动通信业的逐步发展,移动通信市场的竞争同益加剧,网络质量的好坏己成为网络运营商占领移动通信市场、把握成败的关键。如何开展网络优化工作,保证网络的高性价比是运
数字图像处理是一门多学科综合的学科,它被广泛应用在天文学、超声成像、遥感、医学、空间探测、监视、工业自动化等诸多领域。不同类型的图像可以使用一些图像分类算法、光谱
学位
组合导航系统通指那些使用了两个或多个导航系统来对同一载体进行导航测量的综合系统,其通过将各个不同导航系统的对应输出值作比较得出差值来对各系统的误差进行校正。现代工
学位
本文主要研究是一种特殊的图——自补图,这种图具有与其补图同构的特殊性质。在前人理论研究给出的自补图计数的基础上,本文给出了标准型矩阵的定义,通过将图映射为对应的矩阵,提