论文部分内容阅读
在今天的开放计算环境和数据中心中,计算机系统需要根据提供服务类型的不同而划分成多个子系统进行管理和维护,各个子系统之间相互孤立,很难实现资源的共享,面对不断变化的服务需求,管理员只有通过不断增加系统资源来满足用户的要求,这使得系统中部分资源长期处于闲置状态,系统资源利用率很低。另一方面,随着计算环境规模的不断扩大,计算资源的管理和配置工作变得越来越繁琐,系统的管理成本越来越高。资源利用率低、管理成本过高已经成为制约现有数据中心发展的两大问题。
服务部署系统的出现为现有问题的解决提供了一种新的方法。服务部署系统普遍采用了虚拟化技术,它通过不同层次上的资源共享和统一的资源调度来提高系统资源的利用率,降低整个系统的管理成本。随着服务部署系统的广泛应用,怎样保证服务部署系统的可用性已经成为一个急需解决的关键问题。
蓝鲸服务部署系统SonD是国家高性能计算机工程技术研究中心自主研发的基于网络存储的新型计算环境部署系统,在国内SonD系统已经被应用到高教、石油等领域。本文以SonD系统为基础,在对SonD系统和高可用技术深入分析的基础上,对系统各部分的失效检测、失效切换以及如何提供高效可靠的数据服务进行研究。本文所取得的主要成果如下:
实现节点的失效检测和失效切换。在Linux-HA的基础上实现了服务器节点的失效检测和失效切换;设计实现了一个轻量级的心跳协议完成了计算节点的状态监控,并根据计算节点运行的操作系统的不同将服务切换到节点或者虚拟机,很好的提升了系统各部分的可用性。
实现网络缓存机制。在保证数据一致性的前提下,为了能够使系统具有较好的性能,在高可用存储系统中实现了网络缓存机制,用从存储服务器的内存作为缓存对计算节点写入的数据进行保存,并通过脏页监控机制实现了对从存储服务器上内存的管理。测试结果表明,实现网络缓存机制后,高可用存储系统可以保证数据的一致性;在IO操作均是写操作的情况下,系统采用网络缓存方式时的性能是同步方式的5倍。
实现高可用SonD系统。结合现有高可用技术,在系统中加入冗余资源,实现了高可用SonD系统,很好的提升了SonD系统的可用性。