基于CUDA的kNN算法在流量分类领域的应用方法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:oyphone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代网络中存在着大量不同的应用程序,这些应用程序产生不同类型的流量,它们对于QoS的要求是不一样的。和传统的流量分类方法相比,使用机器学习技术来进行流量分类由于不依赖于端口和负载检测而被广泛应用。在机器学习经典方法中,kNN算法是一个效率高、分类效果好的一种方法。尽管kNN算法不需要花费建模时间,但是其计算复杂度依赖于大量d维向量中寻找k个最近邻居,所以kNN算法需要花费大量的分类时间。在实施实时网络流量分类时,分类速度无法满足实际要求。  目前CPU的分类速度无法满足实时分类的要求。CUDA是由NVIDIA创立的并行计算平台和程序模型。CUDA通过图像处理单位在计算性能上有了突破性的提升。  本论文首先介绍了常见的流量分类算法、机器学习算法在流量分类中的使用方法、CUDA技术的应用要点,并详细阐述了实验数据集的获取和来源。在这个基础上,本文设计了基于CUDA的机器学习流分类算法,在GPU和CPU中都予以实现并比较。该算法在GPU实现时,对于kNN相似度计算和排序上均使用了GPU来加速以达到性能的大幅度提升。  实验结果证明GPU峰值计算速度相对于CPU有了187倍提升;同时,本论文在分类准确率上基本能达到80%以上,对某些有应用如FTP,WEB等达到了95%以上的准确率。在论文的最后,再对流分类的召回率和准确率进行分析,详细比较CPU和GPU的性能,并进一步讨论出现性能差异以及不同应用精确率不同的具体原因。实验结果证明了GPU在流量分类领域有潜在的应用价值。
其他文献
在人类向太空进军的历程中,导航技术的地位至关重要。但是现有导航技术均存在一定局限性,有鉴于此,本文对X射线脉冲星导航这一全新且具有显著优势的导航技术进行了系统研究。研
在星地激光通信中,由于通信距离远、光束窄,同时存在系统误差和外界干扰(如大气散射、平台振动等),必须采用捕获、瞄准、跟踪(Acquisition、Pointing、 Tracking,APT)系统来维持通
伴随着多媒体技术的快速发展,视频相关的应用也得到了越来越广泛的普及。其中,视频质量评价和编码在视频处理过程中扮演着非常重要的角色,相关研究在近年也逐渐成为广受关注的热
随着开源软件项目逐渐成为可复用软件构件的主要来源,如何快速的学习一个软件项目成为基于复用的软件开发活动中的一个重要环节。然而,目前软件项目的源代码和文档集往往数量比
真实感图形绘制一直是计算机图形学重要且基础的研究内容,广泛应用在电影、游戏、模拟仿真等领域。由于人们对真实感绘制的要求越来越高,使得场景几何越来越复杂,绘制效果越来越
无线传感器网络的发展直接带来了针对无线传感器网络的数据、服务等资源的整合、管理需求。SWE是基于OGC组织的web服务框架及信息模型提出的针对无线传感器网络资源的框架,通
探空火箭是进行近地空间环境探测、资源开发和科学试验的有效工具,可以为发展新仪器、新试验、新观测技术以及探索新的领域提供经济且有效的手段。经过近70年的发展,火箭探空技
随着企业管理信息化程度的进一步加深,企业对于信息化的要求也越来越高,资源是企业重要的资产,企业对于资源的管理要求也非常高,在管理范围、管理质量和管理系统建设规范性上
为了增强卫星在轨试验运行的可靠性,需要建立联合仿真模型对卫星状态进行综合仿真,研究控制异常时的有效对策。有效载荷数据多路复接器是卫星在轨试验数据传输系统的重要组成部
在过去近20年的时间里,集群和网格系统被广泛应用于高能物理数据处理。传统的以数据与计算分离的集群结构需要将大量的数据通过网络传输到计算节点进行处理分析,导致I/O成为系