论文部分内容阅读
在分布式系统中检查点技术的应用带来了系统容错能力的提高。为了提高检点算法的自治性并且保证计算损失可控,通信引发的检查点算法被人们提出。但是,在该类算法中每个进程不能自主决定卷回距离,为此本文提出一种多周期检查点算法,保证了各个进程可以使用不同周期进行检查点设置,并通过一个选择性同步机制,从而使得进程可以尽可能选择其期望的检查点进行恢复。