论文部分内容阅读
计算机网络技术日新月异、飞速发展,网络规模也变得庞大、复杂,网络安全、性能、服务质量等各类问题日益突出,时刻威胁网络,因此网络流量的预测对于网络的评估管理和防护有着重要的意义。传统流量预测常采用回归拟合方法,这类方法忽略了网络流量的变化是随机过程,存在难以精确预测流量变化的问题,随着网络流量变化越来越复杂,传统模型已不再适合当前环境下的流量预测。针对上述问题,本文提出了一种基于循环神经网络的协议数据流量预测方法,该方法包含3个部分,分别为:(1)多核网包协议解析与流量统计;(2)网络协议关联分析;(3)基于循环神经网络建立模型预测流量。本文围绕上述三个部分展开研究并完成相关实验,主要研究成果和贡献如下: 1.多核网包协议解析与流量统计:在对网络流量进行关联分析和建立循环神经网络模型预测之前,需要对网络包数据进行协议解析和预处理。在实际应用场景中网络流量规模较大,需要高效率的协议解析方法。为了解决这个问题,本文提出了一种多核并行协议解析方案,解析统计分离,将到达队列和二分统计结合的方法实现多核解析和协议统计。实验表明十核解析运行时间是单核的六分之一,吞吐率是单核的六倍,提升了网包解析和统计的效率。 2.网络协议关联分析:网络协议种类繁多,若单个协议独立建模预测流量,工作量将会过大。为了解决这个问题,本文提出了一种网络协议关联分析的方案,对协议流量进行聚类和相似度分析,从而对聚类中一个簇内的所有协议统一建立一个模型。实验结果表明实验数据在该方案下被分为三个簇,并在下一步——基于循环神经网络的流量预测模型中建立三个模型进行流量预测。 3.基于循环神经网络的流量预测模型:传统流量预测大多采用回归拟合的方法,该方法忽略了网络流量的变化是随机过程这一特性,存在难以精确预测流量变化的问题。为了解决这个问题,更加合理高效准确的预测网络流量,本文提出了一种基于循环神经网络的协议数据流量预测方案。该方案利用循环神经网络建模预测流量未来的概率分布,符合流量变化是随机过程这一特性。实验中将该模型与其他模型进行了比较并取得了优于其他模型的效果,讨论了激活函数、预测时长、时间步长对模型效果的影响,该模型在真实网络流量上的预测准确率可达86%,召回率达到76%。