基于CUDA的kNN算法在流量分类领域的应用方法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户：oyphone

【摘要】

：

在现代网络中存在着大量不同的应用程序，这些应用程序产生不同类型的流量，它们对于QoS的要求是不一样的。和传统的流量分类方法相比，使用机器学习技术来进行流量分类由于不依赖

【作者】

：

陈仁杰

【机构】

：

南开大学

【出处】

：

南开大学

【发表日期】

：

2016年期

【关键词】

：

流量分类临近算法并行计算平台

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在现代网络中存在着大量不同的应用程序，这些应用程序产生不同类型的流量，它们对于QoS的要求是不一样的。和传统的流量分类方法相比，使用机器学习技术来进行流量分类由于不依赖于端口和负载检测而被广泛应用。在机器学习经典方法中，kNN算法是一个效率高、分类效果好的一种方法。尽管kNN算法不需要花费建模时间，但是其计算复杂度依赖于大量d维向量中寻找k个最近邻居，所以kNN算法需要花费大量的分类时间。在实施实时网络流量分类时，分类速度无法满足实际要求。　　目前CPU的分类速度无法满足实时分类的要求。CUDA是由NVIDIA创立的并行计算平台和程序模型。CUDA通过图像处理单位在计算性能上有了突破性的提升。　　本论文首先介绍了常见的流量分类算法、机器学习算法在流量分类中的使用方法、CUDA技术的应用要点，并详细阐述了实验数据集的获取和来源。在这个基础上，本文设计了基于CUDA的机器学习流分类算法，在GPU和CPU中都予以实现并比较。该算法在GPU实现时，对于kNN相似度计算和排序上均使用了GPU来加速以达到性能的大幅度提升。　　实验结果证明GPU峰值计算速度相对于CPU有了187倍提升;同时，本论文在分类准确率上基本能达到80％以上，对某些有应用如FTP，WEB等达到了95％以上的准确率。在论文的最后，再对流分类的召回率和准确率进行分析，详细比较CPU和GPU的性能，并进一步讨论出现性能差异以及不同应用精确率不同的具体原因。实验结果证明了GPU在流量分类领域有潜在的应用价值。

其他文献

X射线脉冲星自主导航研究

在人类向太空进军的历程中，导航技术的地位至关重要。但是现有导航技术均存在一定局限性，有鉴于此，本文对X射线脉冲星导航这一全新且具有显著优势的导航技术进行了系统研究。研

学位

X射线脉冲星导航时间噪声周期跃变精度分析误差参数

星地光通信APT系统仿真研究

在星地激光通信中，由于通信距离远、光束窄，同时存在系统误差和外界干扰（如大气散射、平台振动等），必须采用捕获、瞄准、跟踪(Acquisition、Pointing、 Tracking，APT)系统来维持通

学位

星地通信激光传输跟踪控制计算机技术

基于视觉显著性的视频质量评价及视频编码研究

伴随着多媒体技术的快速发展，视频相关的应用也得到了越来越广泛的普及。其中，视频质量评价和编码在视频处理过程中扮演着非常重要的角色，相关研究在近年也逐渐成为广受关注的热

学位

视觉显著性视频质量评价视频编码结构相似性率失真优化

基于自然语言的软件信息检索工具的设计与实现

随着开源软件项目逐渐成为可复用软件构件的主要来源，如何快速的学习一个软件项目成为基于复用的软件开发活动中的一个重要环节。然而，目前软件项目的源代码和文档集往往数量比

学位

软件复用开源软件项目自然语言提问信息检索代码解析相关词推荐

面向真实感绘制的高效组织和表达的研究

真实感图形绘制一直是计算机图形学重要且基础的研究内容，广泛应用在电影、游戏、模拟仿真等领域。由于人们对真实感绘制的要求越来越高，使得场景几何越来越复杂，绘制效果越来越

学位

计算机绘图场景模型图像处理数据结构

无线传感网数据处理服务的研究与实现

无线传感器网络的发展直接带来了针对无线传感器网络的数据、服务等资源的整合、管理需求。SWE是基于OGC组织的web服务框架及信息模型提出的针对无线传感器网络资源的框架,通

学位

无线传感器网络SWESOS服务目录服务

探空火箭箭载图像压缩系统设计与实现

探空火箭是进行近地空间环境探测、资源开发和科学试验的有效工具，可以为发展新仪器、新试验、新观测技术以及探索新的领域提供经济且有效的手段。经过近70年的发展，火箭探空技

学位

探空火箭图像压缩系统设计

资源服务管理模型研究及在电动汽车领域的应用

随着企业管理信息化程度的进一步加深,企业对于信息化的要求也越来越高,资源是企业重要的资产,企业对于资源的管理要求也非常高,在管理范围、管理质量和管理系统建设规范性上

学位

资源管理模型SOA电动汽车加电站资源管理

一种基于高级在轨系统的多路复接器仿真模型的研究

为了增强卫星在轨试验运行的可靠性，需要建立联合仿真模型对卫星状态进行综合仿真，研究控制异常时的有效对策。有效载荷数据多路复接器是卫星在轨试验数据传输系统的重要组成部

学位

卫星通信高级在轨系统多路复接器仿真模型信源仿真两级时分复用

高能物理数据MapReduce并行处理平台研究

在过去近20年的时间里，集群和网格系统被广泛应用于高能物理数据处理。传统的以数据与计算分离的集群结构需要将大量的数据通过网络传输到计算节点进行处理分析，导致I/O成为系

学位

高能物理分布式计算并行处理数据访问

基于CUDA的kNN算法在流量分类领域的应用方法研究

其他学术论文