论文部分内容阅读
本课题是中国科学院信息化专项项目“超级计算环境建设与应用”的一个重要组成部分。在高性能计算环境中,对资源状态、网格连接状态、应用程序运行状态的监控与分析至关重要,通过监控可以及时发现故障,分析系统性能瓶颈,预测系统运行轨迹等。本文主要工作如下:
●深入分析和研究了目前比较流行的三个网格资源监控框架:MDS、GMA、OGSA,并比较了它们的优缺点。在此基础上,结合中科院信息化超级计算环境的三层布局情况:院超级计算中心、分中心、所级中心,按照分层分域和自我管理的思想,建立了一个网格资源监控框架,并对它的总体设计和各模块的主要功能进行了详细说明。
●在建立的网格资源监控框架下,开发实现了超算中心客户支持平台的网格监控模块。首先基于Sensor工具实现底层监控数据指标信息的采集,然后在信息收集模块把数据文件转换成可用的XML文件,并在信息服务模块实现监控数据的存储和对历史统计信息的处理,最后监控数据按照所属类别和不同时间间隔存储在MySQL数据库中。
●为了增强用户体验,基于JSP和AJAX技术来进行监控数据的展示,用AJAX技术从后台读取监控数据,并在前台用Amcharts的Flash图表工具生成相应的图表,最终把监控图表集成到Portal显示模块中。同时也在Portal中实现了用户管理、节点管理等功能。