论文部分内容阅读
如今,市场上新推出的虚拟磁带库(VTL)产品几乎都配备了重复数据删除功能。正是由于重复数据删除功能的出现,磁盘可以存储更多的数据,随之而来的成本的降低、备份和恢复效率的提高使得基于磁盘的备份逐渐成为主流之选。重复数据删除比可以直观地反映出磁盘备份设备在重复数据删除和数据压缩方面的能力,因此备受用户关注。20∶1、25∶1,甚至50∶1,重复数据删除比似乎成了VTL产品的试金石。
不要盲目求高
重复数据删除技术的优势在于能够减少备份数据量。重复数据删除比越大,代表VTL产品可以存储的容量越大,这当然是好事,但还有两个问题对用户来说也是不容忽视的:第一,重复数据删除比并不是固定不变的;第二,在以恢复为目的的数据备份过程中,除了存储容量以外,备份和恢复的及时性、可靠性等也同样值得关注。
先来说说重复数据删除比。影响重复数据删除比的因素很多,包括重复数据删除处理的粒度(文件级、塊级或字节级,重复数据删除处理的粒度越多,容量减少得越大)、生成的数据类型、数据变化频率等。ESG实验室测试过几种重复数据删除技术,认为不考虑重复数据删除流程粒度,10~20倍的容量缩减是现实的。对于不同的应用、不同的数据类型,重复数据删除比也是不同的。用户在采购具有重复数据删除功能的VTL产品时,把重复数据删除比看成是一个参考的指标即可,关键是能否满足应用所需,不一定非要追求达到最高的重复数据删除比。
对于那些没有太多经验的客户来说,在采购前不妨听听产品供应商的专业性建议。据记者了解,像昆腾、威视数据等公司都可在售前为用户提供专业的咨询服务。比如,它们会详细地分析客户的业务应用,为客户估算出实际所需的备份数据量大小,并以此为根据推荐相应的高端或低端产品,而且还可以提供产品测试,让用户对实际的重复数据删除比有更真切的认知。
恢复最重要
再来说说数据恢复的问题。重复数据删除技术的优点很多,比如可以减少备份容量需求,从而节约成本;获取更长的数据保留时间;改善恢复时间目标(RTO)和可靠性;支持并扩展基于WAN的远程数据复制等。重复数据删除技术带来的最大改变是数据备份和恢复服务级别的提升。数据备份是以恢复为目的的,这已经是一种共识。备份和恢复过程中最关键的几个要素就是性能、可恢复的数据量以及可恢复性等,在这几方面磁盘的优势比磁带更加明显。举例来说,采用传统的磁带备份,一周做一次全备份,每天做一次增量备份,如何解决备份窗口以及恢复的速度和可靠性都是一个难题。今天,如果你采用具有重复数据删除功能的磁盘备份产品,完全可以每天做一个全备份,硬件成本并不会有太大增加,数据恢复起来也更快、更容易。由于采用了重复数据删除技术,在每次进行数据的比对时,系统都会对所有数据进行持续校验,因此可以随时发现可能导致数据损坏的问题,并及时报告,从而保证了数据的可用性。
不要盲目求高
重复数据删除技术的优势在于能够减少备份数据量。重复数据删除比越大,代表VTL产品可以存储的容量越大,这当然是好事,但还有两个问题对用户来说也是不容忽视的:第一,重复数据删除比并不是固定不变的;第二,在以恢复为目的的数据备份过程中,除了存储容量以外,备份和恢复的及时性、可靠性等也同样值得关注。
先来说说重复数据删除比。影响重复数据删除比的因素很多,包括重复数据删除处理的粒度(文件级、塊级或字节级,重复数据删除处理的粒度越多,容量减少得越大)、生成的数据类型、数据变化频率等。ESG实验室测试过几种重复数据删除技术,认为不考虑重复数据删除流程粒度,10~20倍的容量缩减是现实的。对于不同的应用、不同的数据类型,重复数据删除比也是不同的。用户在采购具有重复数据删除功能的VTL产品时,把重复数据删除比看成是一个参考的指标即可,关键是能否满足应用所需,不一定非要追求达到最高的重复数据删除比。
对于那些没有太多经验的客户来说,在采购前不妨听听产品供应商的专业性建议。据记者了解,像昆腾、威视数据等公司都可在售前为用户提供专业的咨询服务。比如,它们会详细地分析客户的业务应用,为客户估算出实际所需的备份数据量大小,并以此为根据推荐相应的高端或低端产品,而且还可以提供产品测试,让用户对实际的重复数据删除比有更真切的认知。
恢复最重要
再来说说数据恢复的问题。重复数据删除技术的优点很多,比如可以减少备份容量需求,从而节约成本;获取更长的数据保留时间;改善恢复时间目标(RTO)和可靠性;支持并扩展基于WAN的远程数据复制等。重复数据删除技术带来的最大改变是数据备份和恢复服务级别的提升。数据备份是以恢复为目的的,这已经是一种共识。备份和恢复过程中最关键的几个要素就是性能、可恢复的数据量以及可恢复性等,在这几方面磁盘的优势比磁带更加明显。举例来说,采用传统的磁带备份,一周做一次全备份,每天做一次增量备份,如何解决备份窗口以及恢复的速度和可靠性都是一个难题。今天,如果你采用具有重复数据删除功能的磁盘备份产品,完全可以每天做一个全备份,硬件成本并不会有太大增加,数据恢复起来也更快、更容易。由于采用了重复数据删除技术,在每次进行数据的比对时,系统都会对所有数据进行持续校验,因此可以随时发现可能导致数据损坏的问题,并及时报告,从而保证了数据的可用性。