论文部分内容阅读
随着社会的发展,互联网的规模也在不断增长,网络安全问题层出不穷。网络攻击不仅影响普通个人用户的网络环境,也严重危害到企业、政府甚至国家的网络安全。网络安全态势评估从整体出发,将多源异构的网络安全指标有效地融合在一起,全面描述当前网络环境,为网络管理决策者提供更为直观的网络安全概况。本文将深度学习应用到态势评估领域,采用一维卷积神经网络(1DCNN)提取态势特征,提出了多通道态势评估、态势特征自适应加权融合、多模型集成的态势评估新思路,具体工作如下:(1)针对当前网络安全态势评估领域中暂无统一数据集的问题,本文通过国家互联网应急中心(CNCERT)公开的网络安全信息与动态周报制作网络安全态势数据集。针对数据集中存在指标缺失和样本较少且轻微不平衡的问题,本文分别使用基于KNN的插补算法和Kmeans-SMOTE算法完善数据集;(2)针对传统网络安全态势评估人工干预多、机器学习方法往往忽略态势指标之间隐含关联等问题,本文提出基于深度学习和多通道机制的态势评估模型——MC-1DCNN(Multi Channel 1DCNN)。1DCNN的局部感知原理可利用态势指标位置信息,更好地学习相邻态势指标之间的关联,丰富态势特征。本文根据CNCERT规则将CNCERT数据集中的指标分为4类:基于网络病毒活动情况的指标、基于网站安全情况的指标、基于漏洞情况的指标和基于安全事件情况的指标。由于不同类指标代表不同类网络安全问题,本文基于多通道的网络结构,通过1DCNN分别提取4类态势特征,保证特征之间的独立性。由于4类态势特征对最终态势均有一定影响,本文采用concat方法融合形成更全面的特征并评估态势。实验表明,MC-1DCNN模型在CNCERT态势数据集上性能良好,准确率和召回率分别达到92.65%和87.05%;(3)为了分析MC-1DCNN模型中各通道特征的重要性,本文提出自适应加权的特征融合方法。该方法通过神经网络的自主学习自适应地为各通道特征分配权重,避免人为定义权重和固定权重的缺陷,进一步提升MC-1DCNN模型的态势评估准确率和召回率。此外,根据各通道特征权重大小可以分析样本中各类指标对当前态势的影响程度,从而有利于网络管理决策者采取针对性措施;(4)为了进一步提高态势评估模型的稳定性和自适应能力,本文提出基于加权bagging集成的优化方式。该集成方式在训练集中随机抽样产生多个子训练集,以此获得CNCERT数据集不同的数据特性,提升模型鲁棒性。由于每个基础模型性能不同,本文提出一种加权投票方式集成多个模型的评估结果,提高集成有效性。实验表明,采用加权bagging集成优化的方式可以进一步提高模型准确率和召回率,分别达到94.03%和88.73%。