基于自主计算的集群故障管理系统结构设计

来源 :第十四届全国容错计算学术会议 | 被引量 : 0次 | 上传用户:wearetian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着计算机技术的不断发展,系统规模的不断扩大,高可用集群系统的管理和维护变得越来越复杂。为了提供稳定的计算环境,并及时发现定位系统中的故障隐患,提出了故障的主动管理方法。本文首先分析了自主计算的相关概念和技术,在分析集群计算环境管理需求的基础上,提出了一种基于规则的自主故障管理软件结构。该方法根据集群系统的特点,选择分级管理方式,设计了局部故障管理模块(LFM)和全局故障管理模块(GFM),并具体说明了二者内部的功能结构。
其他文献
  用含磺酸基的烯基单体和丙烯酰胺、丙烯酸共聚,合成了一种耐温抗盐的聚合物降滤失剂PFL-1,考察了单体配比及引发剂用量的影响,在兼顾聚合物相对分子质量和降滤失效果的情况
  数模混合SoC正逐步成为SoC的主导,而其中模拟芯核的测试问题是研究的难点之一。利用自保持模拟测试接口(SHATI)可以实现模拟芯核对外接口虚数字化,对其进行并行测试。本文针
  本研究为了解决异构分布式系统中可靠调度问题,提出了一种提考虑处理机链路通信竞争的,支持任务依赖关系的主副版本容错调度算法(Fault-tolerant Scheduling for Precedence
会议
  循环语句大量应用于程序开发中,但是在静态分析领域,对循环语句的处理还很不完善,存在着不终止和迭代不收敛等一系列问题。传统的循环处理策略所涉及的程序语义信息有限,无法
《政府会计准则第5号——公共基础设施》为公共基础设施资产的确认与计量提供了指导,但由于实际情况的多样性,准则在运用过程中仍然存在一些问题,本文针对这些问题进行了研究
  无线传感器网络故障模型的研究,不但对研究其故障问题研究具有基础性意义,而且在提高网络可靠性、可用性等容错机制相关研究中也占据着十分重要的地位。本文讨论了无线传感
  软件缺陷预测中使用哪些软件度量和如何使用度量进行预测目前还没有收敛的研究结论。本文提出基于度量组合的方法来分析各种度量在缺陷预测中的作用,并用试验的方法证明了
  随着汽车数量的日益增多,如何更加方便、可靠的获取汽车的实时状态信息,从而合理调度车辆,为车辆选择 最佳行车路线、对车辆故障提前预警已成为迫切需要解决的问题。本文针
会议
  随着嵌入式计算机的应用越来越广,对嵌入式系统的可靠性要求也越来越高,嵌入式可信计算机应运而生。本文针对可信计算机的功能需求,研究了容错与嵌入式可信计算机的相关概念
  测试覆盖准则是软件测试的一个重要组成部分。目前已有的覆盖准则研究,大多从程序代码或者规范出发,很少将两者结合起来考虑。另外,面向对象软件和EFSM(扩展有限状态机)规范
会议