论文部分内容阅读
摘要:随着学校信息化建设的推广,用于信息化系统支持的IT系统基础设施在不断增加,故障率与维护工作量也随着增加,分析造成故障率增加、运维效率低、可用性无法保障的原因,规划设计一个实现资源统一管理、故障自动修复、问题快速排除的统一运维系统。
关键词: 统一管理;虚拟化;运行维护;资源配置
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)21-0066-02
Unified Operation and Maintenance of Virtualized Environments
TANG Jian,DONG Jian
(Suzhou Vocational University Suzhou 215104,China)
Abstract: As the school informatization promotion, support for information system of the IT system infrastructure are on the increase.Also increases as the failure rate and maintenance work.Analyzes fault rate increase, low operational efficiency and availability cannot guarantee.Planning and design an implementation resources unified management, automatic fault repair, question quickly ruled out the unification of the operational system.
Key words: unified management; virtualization; operation maintenance; configuration management
1概述
伴随着信息技术的不断发展,信息系统运维的概念已经非常普及,根据自动化运维服务商Puppet labs发布的2013运维报告显示,采用自动化运维后,完成部署的速度提高很多倍,减少50%失败概率,恢复系统的速度提高12倍,国内外的互联网公司都在开发自己的运维软件,国内大型互联网公司阿里巴巴、百度、网易等都有专门的运维体系研究部门。运维管理在高校领域处于逐步实验阶段,国内一些高校已经重视虚拟化应用及运维服务工作,大多采用自主研发与整合工具相结合的方式实现,在运维服务专业化、流程化、规范化方面取得了不同程度的成果。
2运维的现状
随着学校信息化建设的发展,信息门户、学工管理、教务管理、校园卡管理、迎新离校、支付平台等系统相继投入使用,系统基础平台的稳定可用性显得更加重要,学校信息系统支撑平台主要以Vmware虚拟化平台为主,通过虚拟化技术实现了硬件整合管理和可高用性、改善业务可靠性、优化系统部署、降低设备能耗特点,但虚拟化管理平台的管理只涉及主机系统级别,应用系统业务的管理需要各利用各自独立的工具来管理,运维管理整体上基本处于“半自动”状态。突出的有以下问题:定位实际故障点的效率低,故障修复缺乏自动化、流程化响应机制,缺乏事件监控、诊断、故障响应的有效运维工具;系统配置变更需人工操作工作量大,缺乏集中的主机、虚拟机、应用业务等的监控和预警机制;信息系统基础设备没有统一配置管理信息库,信息登记混乱常造成设备配置信息的冲突。系统的可用性与运维管理有着紧密联系,当前运维工作的重心放在应用检查、部署上线、服务器配置、数据备份、故障搜索处理等方面。
3 统一运维的设想
统一运维平台规划以信息系统基础设施及应用系统的全局统一管理为出发点,实现配置批量变更、故障自定义修复、定期自动巡检、信息集中管理等功能,考虑到免费运维系统功能有限、大公司自主研发技术很难获取,计划采用开源软件、Vmware管理平台的功能接口和开发相结合的方式来实现统一运维。
系统规划实现的主要功能包括以下几项:集中化管理信息系统基础架构中的服务器、虚拟机、应用系统、网络设备、存储、应用等配置资源;通过预先定义主机系统、虚机系统、通用应用的模板及配置脚本,实现主机系统、虚机系统与应用系统的统一配置管理与自动化部署,保证配置变更在规范的流程下有序准确地执行;实现主机状态、应用状态、应用业务、负载性能、存储状态等信息的统一监控与预警,通过预定义故障状态与系统巡检计划实现自动化检查及修复;建立统一的日志中心库,采集来自基础设备及应用的日志信息,在日志系统上配置基于应用流程的相关性规则,对日志信息进行有效性预处理,将有效及紧急的日志的集中展示,实现基础设备的日志信息的集中化管理及智能化汇总。
4 系统的设计与实现
ITIL即IT基础架构库(Information Technology Infrastructure Library,信息技术基础架构库)为设计IT服务管理架构提供了一个客观、严谨、可量化的标准和规范,参考ITIL2中服务支持部分,设计与实现统一运维的5项功能模块。
表1 统一运维平台的功能模块
[统一运维平台\
关键词: 统一管理;虚拟化;运行维护;资源配置
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)21-0066-02
Unified Operation and Maintenance of Virtualized Environments
TANG Jian,DONG Jian
(Suzhou Vocational University Suzhou 215104,China)
Abstract: As the school informatization promotion, support for information system of the IT system infrastructure are on the increase.Also increases as the failure rate and maintenance work.Analyzes fault rate increase, low operational efficiency and availability cannot guarantee.Planning and design an implementation resources unified management, automatic fault repair, question quickly ruled out the unification of the operational system.
Key words: unified management; virtualization; operation maintenance; configuration management
1概述
伴随着信息技术的不断发展,信息系统运维的概念已经非常普及,根据自动化运维服务商Puppet labs发布的2013运维报告显示,采用自动化运维后,完成部署的速度提高很多倍,减少50%失败概率,恢复系统的速度提高12倍,国内外的互联网公司都在开发自己的运维软件,国内大型互联网公司阿里巴巴、百度、网易等都有专门的运维体系研究部门。运维管理在高校领域处于逐步实验阶段,国内一些高校已经重视虚拟化应用及运维服务工作,大多采用自主研发与整合工具相结合的方式实现,在运维服务专业化、流程化、规范化方面取得了不同程度的成果。
2运维的现状
随着学校信息化建设的发展,信息门户、学工管理、教务管理、校园卡管理、迎新离校、支付平台等系统相继投入使用,系统基础平台的稳定可用性显得更加重要,学校信息系统支撑平台主要以Vmware虚拟化平台为主,通过虚拟化技术实现了硬件整合管理和可高用性、改善业务可靠性、优化系统部署、降低设备能耗特点,但虚拟化管理平台的管理只涉及主机系统级别,应用系统业务的管理需要各利用各自独立的工具来管理,运维管理整体上基本处于“半自动”状态。突出的有以下问题:定位实际故障点的效率低,故障修复缺乏自动化、流程化响应机制,缺乏事件监控、诊断、故障响应的有效运维工具;系统配置变更需人工操作工作量大,缺乏集中的主机、虚拟机、应用业务等的监控和预警机制;信息系统基础设备没有统一配置管理信息库,信息登记混乱常造成设备配置信息的冲突。系统的可用性与运维管理有着紧密联系,当前运维工作的重心放在应用检查、部署上线、服务器配置、数据备份、故障搜索处理等方面。
3 统一运维的设想
统一运维平台规划以信息系统基础设施及应用系统的全局统一管理为出发点,实现配置批量变更、故障自定义修复、定期自动巡检、信息集中管理等功能,考虑到免费运维系统功能有限、大公司自主研发技术很难获取,计划采用开源软件、Vmware管理平台的功能接口和开发相结合的方式来实现统一运维。
系统规划实现的主要功能包括以下几项:集中化管理信息系统基础架构中的服务器、虚拟机、应用系统、网络设备、存储、应用等配置资源;通过预先定义主机系统、虚机系统、通用应用的模板及配置脚本,实现主机系统、虚机系统与应用系统的统一配置管理与自动化部署,保证配置变更在规范的流程下有序准确地执行;实现主机状态、应用状态、应用业务、负载性能、存储状态等信息的统一监控与预警,通过预定义故障状态与系统巡检计划实现自动化检查及修复;建立统一的日志中心库,采集来自基础设备及应用的日志信息,在日志系统上配置基于应用流程的相关性规则,对日志信息进行有效性预处理,将有效及紧急的日志的集中展示,实现基础设备的日志信息的集中化管理及智能化汇总。
4 系统的设计与实现
ITIL即IT基础架构库(Information Technology Infrastructure Library,信息技术基础架构库)为设计IT服务管理架构提供了一个客观、严谨、可量化的标准和规范,参考ITIL2中服务支持部分,设计与实现统一运维的5项功能模块。
表1 统一运维平台的功能模块
[统一运维平台\