基于内存缓存的异步检查点容错技术

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:chitianshyitt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  高性能计算机系统规模越来越大,系统可靠性问题越来越严重。检查点技术是最典型的容错方法,但是因为并行文件系统的性能提高相对缓慢,数据写带宽低,传统检查点方法产生了严峻的性能问题。针对当前计算机系统计算和存储资源丰富,而并行文件系统写带宽提高相对滞后的特点,本文提出基于内存缓存的异步检查点容错技术,传统的检查点技术被划分为两步:检查点文件首先被缓存在计算结点的局部内存,然后使用一个独立的帮助任务将数据拷贝到并行文件系统。利用局部内存带宽高以及帮助任务和计算任务并行执行的特点,新的方法极大减小了检查点容错引入的时间开销,模拟和实际程序测试验证了异步检查点容错技术的有效性。
其他文献
  从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化.通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特
会议
  传统RBF神经网络在网络流量预测过程中存在收敛速度慢、极易出现局部最优等缺点,从而导致预测精度低。本文采用蚁群算法优化RBF神经网络参数来进行网络流量预测。利用蚁群
  为了获得高质量的插值图像,提出了一种支持向量机插值方法.先用改进的粒子群优化算法对支持向量机进行参数寻优,然后用寻优后的支持向量机在所选择的区域内应用图像相关性
  以有限元/有限差分等为代表的一类数值方法,总体矩阵常常具有“带状”、稀疏的特点.本文针对“带状”稀疏矩阵,提出和实现了一种高效的矩阵向量乘存储格式和算法“bDIA”.
会议
  在蛋白质三级结构预测领域,基于蛋白质采样信息的结构预测方法是一种应用比较成功的方法,但是随着蛋白质数据库的增大,对计算能力的需求也越来越高,限制了这种方法的使用。随
会议
  分析了云计算环境中虚拟机映像存储系统所面临的问题和挑战,设计并实现了一种系统层的虚拟磁盘协作式持久缓存CoCache,能够充分利用各个节点缓存的服务能力,使其暂存的虚
天津铁厂建厂二十五年来,在生产不断发展、经济效益不断提高的同时,劳动卫生与职业病防治工作也取得了很大的成绩,但是与之相比,劳卫职防工作的开展还很不够,特别是在不断扩
  以底层网络资源利用效率最优为目标,在底层网络不需要支持路径分裂的情况下,提出了一种新的基于快速收敛蚁群优化的虚拟网络映射算法。通过引入高斯过程模型,加快蚁群优化算
  现有GPU加速的高性能Linpack 基准测试程序(HPL)一般采用基于实际运算能力的动态负载均衡算法来实现.然而该算法在单节点多GPU的平台上表现不佳,其原因是单节点多GPU平台
  Space filling curve based on Hilbert Peano function is an excellent linear mapping method and get wide application in many fields.In high performance comput
会议