基于编译器的瞬时故障容错技术研究与实现

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:liuguoqiangswu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机芯片的速度不断提升,器件的门限电压越来越低,因此单粒子翻转的瞬时故障越来越容易发生。特别是在太空环境中的计算机系统,在宇宙射线的影响下,瞬时故障更为频繁,系统可靠性面临更突出的考验。   为了提高计算机系统的可靠性,一般有硬件冗余容错和软件冗余容错两种方法。相对硬件容错而言,软件容错的优点是价格便宜,性价比高,配置灵活等,缺点是会带来额外的时间和空间开销,而且给程序员带来编写额外的容错代码的工作量。近来出现了一些基于编译的软件容错方法,可在编译的过程中自动加入冗余容错逻辑,但是这类编译容错方法仍然会带来显著的时间空间开销。如何在保持容错能力的同时尽量降低时空开销,是有待继续研究的问题。   本文在编译容错方向上进行了进一步研究和实现,提出利用源代码中的变量信息对冗余容错逻辑进行了剪裁,在保证容错能力的同时降低了时空开销,对内存和寄存器中的数据进行保护。具体内容有:   1.提出了一个容错编译环境SCC的设计蓝图,构建了一个容错编译工具的远景目标。   2.提出了一种指令级的编译容错检测方法VarBIFT,提供检测瞬时故障的能力。平均只利用0.0069倍的时间损耗和0.3620倍的空间损耗就将发生瞬时故障时,程序正确执行和检测到故障的概率总和平均从39.1%提升到76.9%,   3.提出了一种指令级的编译容错恢复方法VarRIFT,提供从瞬时故障中恢复正确数据的能力。平均只增加0.043倍的时间损耗和0.69倍的空间损耗就将发生瞬时故障时,程序仍然正确执行的概率平均从44.8%提升到了78.7%。   4.基于开源编译器LCC,实现了上述两个编译容错方法VarBIFT和Var-RIFT。在容错方法的实现中只修改了跟具体CPU指令相独立的中间逻辑,所以这两个实现能够方便得移植到SPARC、MIPS等其他CPU架构上。   5.开发了一个故障注入工具,并用它测试了上述两个编译容错方法VarBIFT和VarRIFT的容错能力。
其他文献
汉字输入技术是中文信息处理领域特有的一项基础性关键技术,中文输入法是中文用户使用计算机必备的应用软件。依赖于键盘的中文输入法可以分为两大类:基于汉字字形和基于拼音的
近年来由于国家政策的支持,自主化软硬件产品发展迅速。针对自主化平台的测试的需求也逐渐显露出来,从生产厂家到用户都需要对产品进行测试以保证产品质量以及产品的运行效果
端元提取是高光谱图像分析中的一项重要而具有挑战性的任务。通过端元提取来获得图像中的基本光谱信息,是对高光谱数据进行进一步分析(比如光谱解混合、目标探测、图像分类和地
以Web应用服务器为代表的分布式组件中间件系统(如EJB,CORBA,.NET)已发展为Web计算环境中的主要基础软件。中间件系统通过屏蔽底层平台的异构性,提供大量应用所需要的服务(如事
目前分布式体系结构的研究重点是提高系统的可扩展性、互操作性和可重用性,而对于实时性要求高的分布式仿真系统,还需要在HLA体系结构基础上,考虑如何提高系统的数据传输效率,以
无线传感网,直观的说,就是以现代科技的方法对没有生命的各类生活中的设备进行改造,并进行信息的传递和交互。自从被提出以来,无线传感网迅速引起全世界各个国家和地区的重视
本文以动态开放的对等协作应用环境为背景,围绕实现安全协作存在的公平性、真实性和策略实施一致性安全需求,针对其中的激励机制、声誉系统、索引系统和访问控制授权管理等关键
有穷模型论是受数据库理论和计算复杂性理论推动而发展起来的数理逻辑的一个研究领域。有穷模型论的主题之一就是研究逻辑在有穷结构上的表达能力,围绕这一主题本文取得如下结
本论文主要研究共代数中的互模拟证明方法及其应用两个方面。   代数理论已被证实在计算机科学中具有广泛的应用,其对偶概念——共代数理论是近年来兴起的一个理论,它在描述
随着计算机图形学、人机交互和虚拟现实技术的不断发展,虚拟人任务级行为分解规划方法在虚拟维修以及智能人机交互等方面的应用日益广泛,成为诸多研究领域关注的基本问题。近年