论文部分内容阅读
在过去的几年中,网络VOIP服务飞速发展,占据了越来越多的市场份额,逐渐改变了电信业务的市场蓝图。VOIP服务给传统电信业务,特别是长途电话业务带来了巨大的冲击。在飞速发展的同时,VOIP服务又存在着缺乏监管,缺乏信息监督,非法VOIP服务提供商林立等等问题。这个新兴的市场,亟待规范和监管。因此,电信服务提供商需要一套可靠,高效,相对廉价的VOIP通讯采集分析系统。纵观市场上现有的产品,发现存在严重的两极分化现象,高性能的此类产品往往使用复杂,购买费用昂贵,部署成本很高。而低性能的产品又往往只能满足小规模网络应用的需要。因此,开发一套适应性强,灵活,高效,相对廉价的VOIP会话采集分析系统,就成为了必须。本论文结合北京市紫光绿信公司和辽宁省网通合作开发的省骨干网VOIP监测系统,对如何进行网络数据采集和挖掘技术进行了深入研究,主要做了如下工作:1.详细研究论述了Linux系统的网络编程原理,论述了如何用pcap库实现抓取网络数据包的功能,并且重点论述了基于特征链过滤网络数据包的算法。2.在文中,以SIP协议为例,分析了基于SIP协议的VOIP会话过程,解析了SIP数据包的结构,研究了还原SIP会话的可能性,通过研究,提出了SIP会话还原算法。3.研究分光设备和采集海量数据的相关技术。在文中,论述了一种可定制,基于规则的多层次的海量数据分离技术。4.研究了数据包抓包效率问题。文中详细列举分析了可能影响数据包抓取效率的各种因素,找到问题,并给出了解决方案。值得一提的是,本文中所涉及到的各种软件(包括操作系统)全部为开源软件(Open source software)并遵守GPL协议。