为存储“减负”

来源 :计算机世界 | 被引量 : 0次 | 上传用户:sven55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  特别适合备份和灾难恢复情形的一个解决方案就是重复数据删除,这项技术可充分利用商业数据中存在大量冗余数据的特点,消除重复数据就能减少所需的存储空间量,用户可以实现10:1至50:1甚至更高的缩减比,这要看使用什么技术和数据的冗余程度。管理员只要借助重复数据删除技术的一点帮助,就能降低成本、降低备份需求,并且万一遇到紧急事件,还能加快数据的恢复速度。
  重复数据删除技术有几种不同形式,它们在备份和灾难恢复情形下的方法和作用各具特点,其应用范围最终将扩大到备份层之外的层面,并将运用到企业的所有存储系统,这一点目前已经很少有人怀疑了。
  
  重复数据太多
  
  如今重复数据散布于企业的各个角落。文件保存到数据中心的文件共享区中,其他副本则存放在面向互联网的FTP服务器上,另外一个(或两个)副本存放在用户的个人文件夹中。有时,在文件导出到另一个系统或更新到新软件之前,还会生成文件副本作为一个备份。
  重复数据的一个典型例子就是电子邮件群发。例如,人力资源部门的某人想把一份新的PDF文档发给网络上的100个用户,于是他写好了一封电子邮件,按照邮寄列表,附上PDF文档,然后按“发送”。那么,现在邮件服务器在其存储系统中就存放了同一个附件的100份副本。其实只要该附件的一份副本就够了,但由于没有使用重复数据删除系统,所有副本都存放在邮件存储区,占用了宝贵的存储空间。
  服务器虚拟化是带来大量重复数据的另一个方面。虚拟化的最终想法是“少花钱、多做事”,在一台物理服务器中运行多个虚拟机,从而最大限度地提高服务器的利用率。这就意味着可以减少硬件开支、降低水电费用,理想情况下还能简化管理。每个虚拟化服务器都包含在一个文件中。比如,VMware使用单一的虚拟机磁盘(VMDK)文件作为虚拟机的虚拟硬盘。可以想见,VMDK文件往往相当庞大,容量至少达到2GB,但通常比这要大得多。
  虚拟机的出色功能之一就是,管理员可以停止虚拟机、拷贝VMDK文件,然后把该文件备份起来。只要重新启动机器,就可以继续使用了。那么,我们现在想像一下:所有这些备份副本会造成什么样的情况?那就是许多重复文件存放在文件服务器上。管理员保存着运行中虚拟服务器的“黄金映像”(golden images),以便创建新的虚拟机,更不用说保存备份副本了。虚拟化是能够最充分地利用处理器和内存资源的一种好方法,但要是没有重复数据删除技术,虚拟硬盘实际上会加大对网络存储的需求。
  
  备份系统
  面临压力
  
  平时如何备份这些数据?旧的磁带备份系统速度太慢,又缺少所需的容量;新的高端磁带系统拥有所需的性能和容量,但价格相当贵。而不管你的磁带驱动器质量有多好,恢复数据时,磁带往往难逃墨菲定律(Murphy’s Law,指凡事只要有可能出错,就一定会出错)的魔咒。
  虚拟磁带库(VTL)提供了磁带之外的一种现代技术,它使用了配置上模拟标准磁带驱动器的硬盘。但是,额外的硬盘意味着额外的成本和额外的耗电量。虚拟磁带库速度快,并提供了可靠的备份和恢复目的地,如果要备份的数据比较少,一开始面临的硬件和运营成本就会比较少。
  数据过剩加大了灾难恢复的难度,使近线存储和离线存储的每个阶段成本更高了。如果近线存储系统中保存一个备份副本,那么,恢复丢失或损坏的文件就很容易。但近线存储系统的数量会相当多,这取决于备份集(backup set)大小以及管理员想要留在手边的备份集数量。离线存储由添加到磁带库或发送到另外某个安全场地的磁带或其他介质副本组成,如果数据集很庞大,并不断增加,这个离线存储介质集就必须扩大,以适应需求。
  许多灾难恢复计划包括通过广域网,把备份集发送到另一个地方。除非该企业财力雄厚,能承担非常高速的广域网链路的费用,否则,尽量减小备份集的大小将有利无弊。对于恢复数据来说也是如此。要是备份集确实很大,试图从异地备份来恢复会延长停机时间。
  
  重复数据删除及优点
  
  重复数据删除是指从存储介质或文件系统中检测到重复数据,并删除重复数据的过程。可以在文件级、比特级或块级进行重复数据的检测,这取决于重复数据删除方法的种类和强度。
  重复数据删除系统首次看到某个重复文件或某个部分重复的文件后,会把这部分数据标出来。以后,每个相同部分的数据会从系统中删除,但标以小小的占位符。占位符重新指向首次出现的那部分数据,因此,经过重复数据删除处理的数据在需要时可以重新装配。
  重复数据删除方法减少了在系统中表示所有索引文件所需的存储空间量。比如有这样一个文件系统:来自人力资源部门的同一个文件的100个副本存放在每个员工的个人文件夹中,那么可以缩减至原始文件的一个副本,外加99个重新指向原始文件的小小占位符。不难看出,这将如何大大降低对存储的需求,也不难看出,为什么备份经过重复数据删除处理的文件系统要比备份原始文件系统明智得多。
  重复数据删除技术的另一个优点是,能够把更多的备份集保存在近线存储系统上。由于备份磁盘空间量减少了,更多的“及时点”备份可以随时保留在磁盘上,从而让文件恢复更快速、更容易。这还可以保留更长的备份历史记录,可供用户恢复的文件版本不再是只有三个,而是有更多的文件版本,从而能够实现粒度非常精细的文件备份,还可以存储许多备份历史记录。
  灾难恢复是大大得益于重复数据删除技术的另一个方面。多年来,想缩减异地数据集总的大小,数据压缩是惟一的办法。现在多了重复数据删除技术,可以进一步缩减备份集。既然仅仅是其中的一小部分数据在当天出现变化,为什么每天晚上要传输整个同一数据集呢?重复数据删除技术应用于灾难恢复再合适不过了:不但缩短了传输时间,还因减少总的传输量而提高了广域网的利用效率。
  
  其他存储“减负”技术
  
  数据压缩这大概是最有名的数据缩减技术了,它是指查找并删除重复字节,非常适用于数据库、电子邮件和文件,但对图片效果则不太好。压缩技术内置在一些存储系统中,也有独立的压缩软件或压缩设备。
  基于策略的分层 是指根据数据年限、访问频繁程度或提取速度等制定相应的标准,把数据转移到不同类别的存储介质上。除非策略要求完全删除不需要的数据,否则这项技术不会降低总体存储需求,但由于把部分数据转移到成本较低但速度较慢的介质上了,所以能够削减成本。
  自动精简配置是指对于一项应用,系统会在磁盘上为该应用分配一定量的空间,但实际上只有应用需要时,才真正使用这部分空间。与基于策略的存储一样,这项技术并不缩减总的数据占用空间,但可以推迟购买更多的磁盘,只有绝对必要时才购买。
其他文献
借着M10,Myspace聚友网希望不断完善音乐生态圈,以达到重新回归音乐的精准定位。    近日,Myspace聚友网发布了“聚焦音乐”战略。就这个话题,Myspace聚友网CEO魏来接受了记者采访。  这次聚友网用来聚焦音乐的产品是“M10互联网音乐平台”,魏来表示,“M10互联网音乐平台致力于服务音乐人与乐迷,为音乐人提供全面、简便、易用的音乐产品推广及互动关系管理工具,同时帮助音乐人拓展新
IT组织很久以来都依靠应用交付控制器来在服务器群中启用服务请求进行应用性能优化。既然虚拟化已经增加了服务器环境的复杂性,负载均衡器也必然遇到新的挑战。应用交付控制器(ADC)能够通过实现更平衡的VM动态创建和迁移而增强虚拟机(VM)性能——但是它们在面对其它问题时显得不那么符合要求。  在一个典型的服务器群中,来自诸如Citrix、A10、Crescendo、Radware、Zeus、Brocad
在企业数据爆炸式增长的年代,存储容量突然告罄是司空见惯的事。之所以发生这种事,有时是由于没有建立合理的容量监测机制,有时是由于存储容量的使用出现了不可预见的急剧增长造成的。但不管是什么原因,IT部门都有责任尽快提供更多的可用的存储容量。  要避免采用临时的应急解决办法,关键是要有一套规范的方法。当遇到存储容量危机时,管理层可能会要求管理人员迅速拿出解决办法,这时,管理人员要保持坚定的立场,调整自己
英特尔中国区CIO率领团队为企业提供服务,像管理业务一样管理IT。    CIO观点:  IT是一个服务性质的行业,所以我们的目的并不是为了增加企业的盈利,而是为了降低成本。    作为英特尔公司亚洲大区负责全球销售运营的经理,李克定(Liam Kearting)也是新任的英特尔公司中国区CIO。李克定是爱尔兰人,在中国香港办公,管理英特尔中国区。他会说一些简单的中文词语,然后马上笑着说: “你们
本报讯 日前,MySpace聚友网主办的“MySpace中国首届社交游戏大赛”的报名已经启动。5月10日比赛开始,获奖者不仅能够获得丰厚的资金,优秀作品还将被推荐到包括MySpace.com在内的国内外知名社交网站。    百度携手教育部发起“全国大学生职商挑战赛”    本报讯 4月12日,由百度公司主办,教育部就业指导中心指导的“全国大学生职商挑战赛”正式在京启动。该项赛事旨在帮助国内大学生提
杨威正在网上树立一块低价机票的指示牌。他认为,信息具有沟通作用,要“货比三家”,让用户拥有最大的选择权。    杨威是“去哪儿”网站的产品总监,负责机票业务。他的名片窄、竖排印刷,淡绿色,很像登机牌。去哪儿网的Logo是悠闲漫步的骆驼,仿佛要带领游客四处旅游。  去哪儿网成立于2005年,在航空业电子商务中一枝独秀。这家网站要做旅游行业的搜索引擎,目标是全球最大的中文在线旅游媒体平台。  杨威说:
在“泛在化云时代”,泛在化的云服务已经成为大势所趋。那么,企业如何选择存储方案,如何解决安全问题,以建立能够承载多业务、可扩充的云计算数据中心?    如今当企业主们谈起“云计算”,已不像是在谈论虚无缥缈的“海市蜃楼”。随着身边的企业一个个走上“云”端,以及互联网、移动互联网上的应用不断丰富,越来越多的企业主发现,任何地点、任何方式、任何服务都可获得的泛在化的云服务已经成为大势所趋。  那么,在“
思想工作  电子病历在医院的采用处于十分敏感的关口,这不仅在于业务流程和需求的梳理,更在于能否尽早采用规范的电子签名以确认电子病历的法律地位。    2005年4月1日,《中华人民共和国电子签名法》正式施行。时隔5年,2010年4月1日,卫生部制定的《电子病历基本规范(试行)》正式施行。  当前,电子病历在医院的采用处于十分敏感的关口,其敏感之处不仅在于业务流程和需求的梳理,更在于能否尽早采用规范
思想工作  因为信息化程度的滞后,有多少消费需求被抑制甚至惨遭扼杀呢?     因为信息化程度的滞后,有多少消费需求被抑制甚至惨遭扼杀呢?如果选取一两个行业做这样的调查,一定会有惊人的数字结果。  七月是江西庐山的旅游旺季。上星期的后半周,我利用休年假的机会到庐山旅行,并住在群山环抱之中的牯岭镇。这也是游客们的主要集结之地。  牯岭镇是一条东西走向的狭长山谷。这条原本无人定居的山谷,最早是英国传教
中国业务独好    中国已经成为佳能公司全球最重要的市场,在金融危机中,佳能在中国地区的打印机销量仍然继续保持健康成长,因为中国的打印机市场和其他地区不同,绝大部分都是办公用户在采购,受的影响并不算大。  孙定: 在金融危机中,全球和中国的经济都受到了影响,但是现在中国经济已经有一些触底反弹的迹象了,请问佳能中国的打印机业务是否受到了影响?请和地润一先生介绍一下佳能打印机业务的整体情况。  和地润