AC保险公司信息系统灾难恢复计划的启示

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:aqqz2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“居安思危,思则有备,有备无患”,事实证明,各类灾难的发生经常是突发和偶然的,是难以预测的,美国“911”恐怖事件让企业认识到了建立灾难恢复体系的重要性。建立有效的灾难恢复体系是企业在发生灾难时最有效的恢复手段,是企业业务连续的保障。信息系统的灾难恢复不再是单纯的IT技术管理,已经上升到企业战略层面。   随着我国保险业的快速发展,保险企业在IT方面面临的挑战越来越大:IT系统不断升级,业务规模在不断增大,数据量日益增多,对服务质量的要求越来越高,业务系统要求要具备高可用性,具备可靠的数据/系统备份措施等功能特性;保险行业产品细化越来越深入、专业,以客户为中心的客户化理念被广泛的应用;数据和业务的大集中,对保险企业业务连续性的要求越来越高,而数据的大集中使保险企业信息系统的灾难恢复体系建立迫在眉睫。同时保险监管机构(保监会)也要求保险企业建立一定级别的灾难恢复系统。   世界500强企业AC保险公司在2001年开始进行IT系统集中项目,将原来分布全国各个省的IT系统集中到了深圳数据中心,实现了数据和应用系统的集中管理。集中管理提高了IT系统的管理效率,并为业务的进一步发展提供了一个坚固灵活的IT公共平台。目前AC保险公司的业务范围已远远超过保险领域,为能够给广泛的业务品种提供支持,从证券,银行、信用卡,到投资——系统必须能让前线销售一系列的金融服务。基于这样的业务目标,公司制定了一套标准化开发规范,并最终形成了“AC的IT架构”   2002年AC保险公司完成数据和系统集中化后,同年完成了灾难恢复系统的IT基础架构建设,建立了深圳数据中心和上海灾难备份中心。在上海灾备中心建立了重要生产系统的数据复制环境,实现了重要生产系统和数据的实时复制,全国100余个生产数据库实施了数据级灾难备份。然而灾难备份只是实现了灾难恢复的第一步。公司虽然建立了基本的灾难备份系统,保证了数据的安全,但缺乏相应的综合灾难恢复计划,没有针对灾难发生后的预警、策略、详细的恢复管理流程。在这样的大背景下,2004年AC保险公司开始实施IT系统灾难恢复计划(Disaster Recovery Planning,简称DRP)项目,并于同年年底演习成功。DRP是指企业遭遇灾难或风险后,将信息系统切换到灾难备份中心从而保证业务最快恢复的程序。灾难恢复的步骤包括灾难恢复团队组建灾,难风险评估、业务影响分析,灾难恢复策略设计,灾难恢复流程管理,灾难恢复演习。AC保险公司信息系统制定灾难恢复计划的详细步骤,为企业制定信息系统灾难恢复计划提供了最佳实践。   第一步,组建灾难恢复计划团队。AC保险公司的灾难恢复团队由灾难恢复领导团队和灾难恢复小组组成。灾难恢复领导团队中的总指挥由CIO担任,具有领导和决策作用;灾难恢复小组是信息系统中各应用系统的代表,灾难恢复团队中的每个成员有明确的岗位和责任,每一个成员都有一个备份人员。   第二步,风险分析(Risk Analysis简称RA)。对AC保险公司信息系统现有的风险及灾难管理能力和水平进行评估,其目的是为了了解AC保险公司系统灾难控制和预防的现状,从风险管理的角度了解要提高系统的灾难规避和控制能力还需做的努力和工作。AC保险公司采取分析的工作任务是:了解企业现有的风险和灾难管理手段;组织专题工作组;制作问卷;现场实地访谈;总结内部报告;确定所有潜在的灾难威胁;评估各种灾难威胁的可能性;评估目前的灾难缓解能力;确定未被控制的灾难会对企业信息系统造成的影响;分析新建立的风险控制手段对企业信息系统的价值;确定项目周期内要实施或改进的风险控制手段;制作报告。   第三步,业务影响分析(Business Impact Analysis简称BIA)。是在风险管理评估的基础上,对各种可能无法规避的灾难对AC保险公司业务的影响力进行具体的评估,包括无形的影响(如企业形象、客户满意度等)和可量化的影响(如收入损失、资产损失等)。AC保险公司灾难恢复团队制定了针对企业应用系统模块,并由企业业务人员认可的业务影响分析(BIA)的调研问卷。在调研问卷的基础上,灾难恢复团队的技术人员将与使用各业务应用系统的相关各业务主管,进行一次正式的调研访谈。访谈将帮助业务主管和11r技术人员发现应用系统故障或灾难时的对业务造成真实确切的影响。最后根据业务影响分析的结果,得出RTO-实现灾难后3.5天内恢复关键业务系统80%的处理能力;RPO:各系统平均数据丢失时间小于8小时。最大数据丢失时间小于24小时。   第四步,制定灾难恢复策略。通过业务影响分析(BIA),灾难恢复团队能够获得业务恢复的需求。基于这些确定的需求,AC保险公司IT部门将检查现有的IT架构和运行管理的现状,确定实现灾难恢复需求的差距。并提出相关的灾难恢复策略,恢复的策略主要包括以下内容:系统架构(硬件,操作系统,网络等);关键应用系统的恢复优先级;关键应用系统的恢复策略级别;关键应用系统的恢复技术的选择(数据库复制,存储区域网络复制,磁带恢复,服务器集群高可用性技术等);与服务或设备供应商(包括硬件设备,网络,软件等等)协议的制定。   第五步,制定灾难恢复的管理流程。定义一套相关的标准和流程以判断和确认一般性的故障或灾难事件;制定详细的灾难恢复流程,明确所需的环境和资源;流程包括灾难级别的判断,事件的通知,灾难声明,相关支持小组的合作,主备之间的切换。   第六步,灾难恢复演习。完成了灾难恢复管理流程的制定后,2004年12越,AC保险公司进行了首次信息系统灾难恢复演习,参与演习的应用系统全面恢复并通过业务部门测试,宣告AC保险公司首次IT灾难恢复演习圆满成功,这也是国内保险业界首次IT灾难恢复演习。首次演习的成功,除了检验了灾难恢复技术方案的可行性外,更重要的是检验了恢复计划的组织,团队间的协作,与用户的沟通和应急的后援支持等多方面的工作细节,用实践证明了一系列预案的可行性。   灾难恢复计划是一项长期的工作,AC保险公司快速的业务发展带动了信息系统的发展,灾难恢复计划的建设也必须要跟上不断变化的步伐。因此,把灾难恢复项目纳入到日常工作中,定期更新计划,并进行实战演练是保证灾难恢复计划可用的最重要基础。也只有这样,才能最终建设成在此基础上保障AC保险公司业务零中断的业务连续计划,打造出真正的平安。  
其他文献
郑州澍青医学高等专科学校坚持以医德教育为导向,以心理健康教育为抓手,以健全人格为主线,紧密结合医学专科生的心理特点和职业特点,在“以德为首、医德为魂、德术双馨”教育
目的 观察B组柯萨奇病毒感染对大鼠心肌来源的H9c2细胞microRNA表达谱的影响.方法 用B组柯萨奇病毒3型Nancy株(CVB3)攻击成层和未成层的H9c2细胞,6h后收获总RNA,基因芯片检测
加强班子建设担起历史重任高勇地方领导班子换届后,新班子要做的工作很多,但最关键的是要把领导班子建设好。一、严以律己,切实发挥表率作用要做讲学习的表率。要提高领导能力和
论矿山企业综合计划在红花沟金矿的应用杨玉林王惠新郭洪军(赤峰红花沟金矿)1引言红花沟金矿是中型岩岩金矿山,随着我国社会主义经济体制的改革,矿山在计划管理体制上实现了以一个
一步推动创新创业成果转化,促进“互联网+”新业态形成,服务经济提质增效升级,以创新引领创业,让创业带动就业,推动高校毕业生更高质量创业就业.rn河南大学高度重视大学生创
进入21世纪以来,中国经济依然持续高速发展,令世界瞩目。同时,中国经济面临着全球化市场日趋激烈的竞争,表现在:产品寿命周期越来越短,产品品种越来越多,对交货和服务的要求越来越高
期刊
期刊
期刊
期刊