论文部分内容阅读
当前网络正处于飞速发展的时期,网络规模不断扩大,网络结构非常复杂,网络支撑的业务也日益丰富,这对网络管理提出了新的要求。传统网络管理系统在功能和结构上面的一些弊端也逐渐显现。因此需要采用新的开发技术,对旧有系统进行改造升级,并增强系统的功能实现,提高系统的实用化性能。
网络故障管理子系统作为网络管理的核心模块,对整个网络管理系统有着至关重要的作用。故障管理主要包括:故障检测、故障诊断、故障修复。其核心是故障诊断,目前很多研究都在网络管理中引入智能技术和信息处理技术以期解决网络故障诊断问题。
在调研了国内外优秀网络故障管理系统基础上,参考实际网络管理需求,本文设计了一个基于事件关联分析的网络故障管理系统,并实现了系统的两个核心模块,故障管理模块和依赖图关联分析模块。
故障管理实现故障的告警管理和消息通信,支持对服务器日志和路由器日志等事件的管理,并可以进行事件定义和配置管理。基于J2EE体系结构,故障管理模块由客户端、应用服务器和数据库三个部分组成。客户端主要面向网络管理员,提供与之交互的界面;应用服务器进行事件接收、分析、处理等操作,并封装客户端可调用的接口;数据库用于存储系统配置信息、历史日志信息和中间处理信息。
依赖图关联分析模块是故障管理关联分析的核心部分,采用基于依赖图的方法进行关联分析。首先,通过频繁模式树的时序挖掘算法从历史日志中挖掘出网络对象间的依赖度;其次根据依赖度及告警域建立依赖图模型,并采用启发式搜索算法进行故障定位,最终确定故障源。同时将依赖图关联和专家库结合起来,便于经验学习,加快故障诊断速度。
网络故障管理子系统已经完成基础的开发测试,并集成到华南理工大学网络中心自主开发网络管理软件Dcampus SNMS上,取得了较好的应用效果。