论文部分内容阅读
现场可编程门阵列FPGA是一种包含可编程元件的半导体器件,可供用户现场编程,具有设计开发周期短、设计制造成本低、可反复编程、灵活性高等优点。目前,FPGA已广泛应用于空间领域中。
在空间环境中,SRAM型FPGA极易受到高能粒子的影响而产生单粒子效应,并且随着FPGA工艺的进步,单粒子效应出现的频度明显增加,严重影响了FPGA可靠性,制约了SRAM型FPGA在空间领域的应用。
本文首先分析了SRAM型FPGA的背景知识、空间环境下的失效机制,以及SRAM型FPGA可靠性设计的国内外研究现状,在此基础上提出并实现了基于动态重配置和基于配置文件回读的可靠性设计技术,在电路功能设计和FPGA配置文件两个层次对FPGA进行保护。最后,本文选取LEON3多核处理器作为目标平台来搭建原型系统,验证可靠性设计的有效性。实验证明:基于动态重配置和配置文件回读的可靠性设计能有效容忍单粒子翻转故障,提高系统可靠性。本文的主要工作包括:
1.基于动态重配置的可靠性设计
在FPGA的功能层次,我们提出并实现了基于动态重配置的可靠性设计,在模块级多模冗余的基础上,结合动态重配置技术进行故障恢复。动态重配置不影响其他模块的运行,不中断系统,与传统的多模冗余相比,在不增加面积开销的基础上,在线的进行故障恢复,避免故障聚集效应,进一步提高系统的可靠性。
2.基于配置文件回读的可靠性设计
在FPGA配置层次,本文提出并实现了基于配置文件的可靠性设计。通过XilinxFPGA中的ICAP接口回读并校验FPGA配置文件,如果发现单粒子翻转故障,就立即纠正错误并将纠正后的数据写回,实现故障恢复。基于配置文件回读的可靠性设计是在精确控制ICAP时序的基础上实现的,可方便的移植到Xilinx各个系列的FPGA中。
3.基于LEON3处理器的原型系统搭建
为了充分验证可靠性设计的有效性,我们搭建了基于L,EON3处理器的可靠性评估平台。在这个平台中,集成了基于动态重配置的可靠性设计和基于配置文件回读的可靠性设计,具备故障注入、故障检测和故障恢复的功能。经统计:基于动态重配置的可靠性设计,其故障注入范围覆盖受保护模块中的所有触发器,TMR的故障恢复时间约为22.21毫秒,DMR的故障恢复时间约为44.42毫秒;基于配置文件回读的可靠性设计,其故障注入范围覆盖整个配置存储器,平均故障检测时间约为60.71毫秒,故障恢复时间约为2.5微秒。评估平台能够运行各种测试程序,支持软件调试功能,可以及时、准确的显示故障检测和恢复的过程。