论文部分内容阅读
最近几年,网络进一步普及,而人们对信息量以及信息获取速度的要求也在不断提高。基于此,对等网络(P2P)的用户规模、应用类型和流量也在不断增长。分析结果表明,基于P2P的语音通信软件Skype在中国同时在线用户数高达900万,P2P互联网电视(如PPLive、PPStream等)的注册用户数已超过1亿,在线收视者数达到100~500万。P2P应用类型也已经从文件共享,扩展到语音、视频等应用领域[1]。同样,中国互联网实际流量模式分析报告表明,P2P流量已占整个互联网流量的60%。这种无所控制的流量占用想当然造成了网络的拥塞,致使网络服务质量下降,而且P2P协议繁杂多样,对P2P流量的统计和控制工作困难重重。只有从网络中有效的识别出P2P的数据流量,才能够对其进行流量控制、流量管理等工作,这使得对P2P流量识别技术的研究变得愈来愈重要。而且随着新开发和改进的P2P程序不断出现,原有的一些P2P流量识别方法已无法满足需要,研究新的P2P流量识别方法从而对P2P流量进行有序控制迫在眉睫。首先,本文针对典型P2P协议--BitTorrent协议和Kademlia协议进行了节点状态、数据块结构、节点消息等几方面的分析。随后,对相关P2P网络流量进行了研究,构建了局域网环境下TCP和UDP协议下的P2P流量模型,提出了一个适合局域网环境特点的P2P流量识别方法。基于前面的研究,本文设计了一个P2P流量识别系统并编程实现。整个系统识别引擎由BT协议分析器、DHT协议分析器、TCP流量识别器、UDP流量识别器及可扩展的其他协议分析生成器组成。采用了多种识别方法相结合,从不同的层面对P2P流量进行识别,该系统在提高局域网中P2P流量识别的效率和准确率方面具有积极意义。