论文部分内容阅读
协同式检查点及卷回恢复技术是一种简单有效的容错手段,被广泛地运用于并行/分布式系统中。协议开销和检查点映像存储成为困扰检查点算法可扩展性的两大瓶颈。为进一步降低协同式检查点算法的协议开销,本文结合PVM的通信机制提出了一种非阻塞协同检查点算法。该算法在设王检查点时无需阻塞进程的基本运行,同时降低了检查点的开销,提高了系统的可扩展性。通过对Cannon算法的分析,验证了该方法的有效性。