论文部分内容阅读
高可用是保证数据中心持续运行和提供不间断服务的关键技术之一,可以极大地提升系统的可靠性和稳定性,是现代数据中心中一个重要的研究领域。目前高可用的研究大多集中在提供单一服务的服务器或者某一项具体的使能技术上面,缺乏对同时运行多个服务的服务器的高可用研究,这种单一的设计难以满足需要在一台服务器上运行多个服务的业务需求。本文在对现有的高可用技术研究分析的基础上,针对自主研发的CSCloud云存储系统中的监控配置服务器(Monitoring and Configuring Server,MCS)的实际需求,提出并实现了一种可以支持多服务运行的高可用方案。在该高可用方案中,依据对MCS的业务划分、高可用设计原则以及系统扩展性方面的考虑,将其分成集成资源层和数据资源层分别做高可用。集成资源层包括存储资源、监控资源与web资源,通过采用双机热备模式并结合虚拟IP等使能技术,将多个业务资源整合到一个高可用环境内,实现了集成资源的故障检测、自动迁移和故障恢复,为用户提供不间断服务;数据资源层高可用设计采用数据复制来保证数据同步,并结合监控技术搭建数据高可用架构,实现了读请求的负载均衡和数据库的运行状态监测、自动迁移和故障恢复。本文在完成高可用架构的前提下,还结合MCS所带的监控系统添加了对MCS上web资源,系统负载情况等服务资源的监控和告警,从而对MCS高可用实现了双重保证。本文所提出的高可用研究方案在MCS上得到了实现和应用,并通过模拟在实际运行环境中可能出现的故障、资源迁移等场景来进行测试和分析。测试结果表明,该高可用方案达到了预期效果。本文所提出的高可用方案,不仅适用于MCS,也为其它类似应用场景提供了一种新的思路和方法。