高端容错计算机故障注入工具的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hy1330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高端容错计算机是指同时具备高性能和高可用特性的高端服务器。高端容错计算机主要面向金融、电信等涉及到国家战略安全的关键领域的计算需求,此类系统的可靠运行直接关系到国家经济安全。高端容错计算机在软件,固件,硬件等多个层次上设计了容错机制,在高端容错计算机研发过程中和投入使用前,必须进行容错性能的测试,一方面对生产厂商提供反馈意见,另一方面对容错性能进行评价。故障注入是评测容错性能最常用,也是最有效的方法。本文对如何运用故障注入方法评测容错性能进行了研究,主要解决故障注入模型的建立和故障注入工具的实现两个问题。以FARM这一经典故障注入模型为理论基础,本文构建了应用于高端容错计算机容错性能评测的故障注入模型,并对故障注入的实验策略进行了说明。在故障模型的指导下,实现了故障集中各种软硬件故障的注入,在应用层,系统层,内核层和驱动层等多个层次设计实现了一系列故障注入工具,形成了容错性能测试工具集。本文针对计算密集型,访存密集型和IO密集型三类典型应用场景,设计实现了3个故障注入工具:基于ptrace的应用进程寄存器故障注入工具,软件实现的物理地址内存故障注入工具,网络设备故障注入工具。这三个故障注入工具分别注入CPU故障、内存故障和IO故障。为了验证本文所实现的故障注入工具的有效性,也为了说明基于故障注入评测容错性能的过程,本文选择了两款安腾架构的高端容错计算机进行故障注入实验,针对Linux IA64、HP-UX和某国产容错操作系统三个操作系统进行了应用进程寄存器故障,应用进程内存故障,系统进程内存故障,内核内存故障和网络设备故障共5类故障注入测试。实验结果表明,本文所设计实现的故障注入工具的有效性,充分暴露了目标系统的各种缺陷与不足,而且能够支持多个架构和操作系统平台。通过对不同服务器和不同操作系统进行实验数据对比分析,能够对各系统的容错性能进行定性评价。
其他文献
随着多媒体技术及因特网的快速发展,因特网上图像数据来源不断扩大,图像的数量增长迅速。相对于文字信息,图像表达更加生动、易于理解,因此各行各业对图像的使用越来越普及,比如医
在数据库应用系统中,加快数据查询的执行速度非常重要。数据仓库技术通过对源数据库的数据提前进行归纳、分析、整理,从而提高了查询速度。动态数据仓库针对传统数据仓库更新周
基于机器视觉的标记检测方法在工业控制、农业生产、国防建设等领域内都有广泛的应用,但在医疗领域的应用相对比较少。针对目前医用体外冲击波碎石机在对肾脏结石患者进行结石
随着互联网的快速发展,视频信息急剧膨胀,谷歌、百度等通用爬虫越来越不能满足人们的专业化需求,因此对足球视频搜索而言,如何在互联网上抓取足球视频成为一个亟待解决的问题,同时
在当今这个高速发展的信息社会,数据可以说是企业生存的根本,数据破坏对企业来说无疑是致命的打击,对个人也是如此。在这样的大势下,数据的备份容灾成为了存储行业的研究热点。同
自从关系数据库的事务概念提出以来,如何解决事务问的并发以及串行化调度就成为了一个热点的问题。从上世纪八十年代开始物理行锁的封锁机制开始成为了关系数据界的主流解决
随着高校网络的迅速发展,大多数高校都已建立了自己的校园网。为了充分利用教育网上的资源,大多数高校都把教育网作为校园网的主要出口,但由于教育网与公网的互联带宽比较窄,
隐式多项式曲线,尤其是高次隐式多项式曲线对物体几何模型的描述非常有效,它用很少数目的参数就能描述形状不规则的物体,其稳定性和不变量的鲁棒性可用来快速有效地识别物体。在
随着网络信息技术在管理上越来越深入而广泛的应用,基于WEB的数据库信息管理系统的开发在技术上已逐步成熟,并成为主流和发展趋势。同样,信息管理技术正以前所未有的速度深入
随着网络技术和信息数字化的快速发展,面向海量数据的大型应用纷纷涌现,数据中心里存储服务器集群规模随之不断增大,越来越多的存储节点,给存储系统中的元数据服务器带来了更重的