论文部分内容阅读
因特网流量分类研究是众多因特网研究的基础,清楚地了解整个因特网的流量情况对于因特网流量建模、网络运行维护管理、网络安全及流量工程等均具有重要意义。在P2P应用逐渐普及的今天,基于端口和载荷的传统流量分类方法逐渐凸现出局限性,迫切需要一种新型的、有效的流量分类方法,为因特网业务的QoS保证、网络异常检测等提供支撑。
本文在参考国外优秀文献和最新研究成果的基础上,提出了两个基于机器学习的流量分类模型。首先,第一个分类模型引入整体学习和半监督学习,一定程度上弥补了单假设算法性能低下的缺陷,并且可以利用网络中容易可获取的未标记流量来改善分类器性能。其次,第二个分类模型引入整体学习和代价敏感学习,重点关注真正影响网络带宽的"大象"流量,提高分类的字节准确率,改善流量控制设备的性能。实验结果表明:两个分类模型相对以往文献中使用的流量分类模型,具有更好的性能。
本文在中山大学校园网主干的一条接入链路上设立监测点并进行双向的流量数据采集,然后对校园网中的流量进行分类,并深入讨论。与传统的流量分类方法不同,本文方法不需要通过端口或者载荷信息进行分类,而是采用独立于载荷的流量统计特征作为分类依据。本文中的一系列分析数据不但为因特网流量分类研究提供帮助,也为其它有关网络流量的研究提供了一定的事实依据。