论文部分内容阅读
集群作为一种新技术的代表,在管理上还有很多需要完善的方面,其中集群系统管理和集群硬件监控就是重点。运行大作业时利用监控软件监控参与生产任务节点机的关键性能指标的变化趋势,如温度、风扇速度,及时评估节点运行状态,做好故障处理预案,在生产中起着越来越重要的作用。然而各厂家的监控软件各有所长,如何在集群系统上安装、开发不同功能的监控软件是实际生产中需要解决的关键问题之一。本文介绍了应用在集群系统上的二个监控软件:GKrellM和Ganglia。