存储

虚拟磁带库 变革数据保护流程
作者 网络世界 2008年09月23日 09:55

  【IT168 资讯】当数据从用户业务系统中产生以后,就开始面临着严峻的数据保护问题。长期以来,用户已经习惯了采用磁带库进行主要的数据保护工作,但是随着磁带库管理工作中存在的问题日益严重,人们正在尝试新的途径来改善数据保护工作,其中虚拟磁带库(Virtual Tape Library,VTL)是一个十分成功的解决方案。

  虚拟磁带库的概念非常简单,它本质上是磁盘阵列硬件设备,但是在软件功能上模拟磁带备份的形式,因此对于存储管理员来讲,它就是一个磁带库,对它的管理如同管理一个物理磁带库一模一样。

  可以说,虚拟磁带库已经成为当今存储界最为热门的话题之一,VTL的崛起,正在深刻地改变着传统的备份市场格局和用户的数据保护模式。进入2005年,传统机械磁带库厂家纷纷推出虚拟磁带库作为高端产品系列,VTL成为市场主流的趋势已非常明显。

机械磁带库的缺陷

  磁带库是一个机械密集型设备,有用户曾用开玩笑的口吻说:“磁带库厂商不应该属于IT厂商,而应该是机械厂商。”因此,磁带库具有一些作为机械产品而不可逾越的问题。

  维护负担高:磁带库的核心部件磁带驱动器为非封闭机械易损件,本身故障率高,灰尘、潮湿等使故障率不可预期,导致设备可用性差。

  备份失效率高:采用磁带库进行数据保护的介质磁带为非封闭介质,且磁带库中的磁带之间没有容错保护。备份业务涉及到的磁带组中任一盘磨损、卡带、霉点、粘连等,均会导致整个备份无法恢复。

  备份恢复能力不佳:虽然磁带本身的读写速度已有长足提高,但备份恢复时需要抓带、加载、机械定位文件等机械动作,等待时间长,而备份恢复时一般会涉及多带查找,应用端被迫因此延长待机时间。

  在用户的数据保护工作中,解决机械磁带库问题的主要方案有磁盘到磁盘(Disk-to-Disk,简称D2D)和VTL。与磁带不同,基于ATA的磁盘阵列比传统的光纤通道磁盘阵列的成本低很多,同时逐渐变得非常流行,它可以方便集成到备份系统中。

  D2D将盘阵连接到备份服务器,将文件系统放置其上,使用备份软件的本地功能备份到基于磁盘的目标上。这一过程听上去很简单,但是需要用户改变备份系统的配置;最后的碎片还会引起性能的问题,基于文件系统的目标不能以磁带库的方式进行共享,需要管理员为多个备份服务器进行磁盘阵列的分区。

  VTL使得磁盘阵列对于备份/恢复系统来说像是磁带库,这样一来,无须改变配置就可以在备份系统中使用磁盘,而备份系统仍旧认为在向磁带进行备份—只有你知道其中的奥秘。如同物理磁带库一样,VTL可以通过驱动器共享软件来进行共享。此外,大多数VTL在磁盘上存放数据的方法确保了零碎片。

VTL的优势

  几乎在机械磁带库发明的同时,VTL概念就已经出现并得到应用。但是,受限于技术局限,长期以来VTL只是作为机械磁带库的缓存,应用也因此而局限于封闭的大型机系统等高端用户群,市场认知度很低。

  相对于机械磁带,虚拟磁带库使用了兼容磁带备份管理软件以及传统备份流程,这使得设备的可用性及备份的可靠性都得到了大幅提升。

  设备可用性提升:虚拟磁带库用电子化的“机械手”和“磁带驱动器”,代替了机械磁带库中裸露、易损的系列机械装置,基于RAID保护的磁盘阵列具备降级工作能力,且具自动报警和在线热恢复能力。

  备份可靠性提升:虚拟磁带库采用基于RAID保护的磁盘阵列,从而将备份的可靠性较常规磁带备份提高了若干量级。封闭式结构的磁盘介质本身的MTBF(平均无故障间隔)一般为开放式结构的磁带介质的5倍以上。

  恢复工作极为简便:如果所需数据存在VTL当中,则不会涉及任何机械工作,恢复工作就像磁盘备份的速度一样。

VTL突破D2D

  D2D方案包括文件复制、数据镜像、快照等形式。文件复制或镜像不仅使备份数据持续暴露在病毒、人为误删等在线威胁之下,同时也只保留在线数据的最终状态,数据灾难发生后无法恢复历史数据。在较为成熟的快照技术中,镜像式快照消耗容量过大,指针式快照虽然支持类似常规备份的增量快照,但必须捆绑专用软件系统,总体拥有成本过高。

  D2D解决方案存在最大的问题,是与文件系统相关的缺陷。结合外接RAID阵列的备份/恢复软件的D2D性能依赖类似NTFS和NFS的文件系统,它们是为了在PC服务器系统中使用而生成的。这些文件系统用来为多个用户管理多个小型文件,在磁带备份应用软件执行较大的写操作时,会发生性能冲突。

  大多数D2D RAID阵列使用的通用文件系统对于磁带备份并非是最优化的。与备份系统相关的通用文件系统还存在的另外三个问题:大多数通用文件系统同典型的服务器一样,随着时间变化产生大量文件系统碎片;类似FAT、NFS和NTFS的通用文件系统受到文件系统、分区和单个文件大小的限制;大多数D2D文件系统存在安全性隐患。

  VTL在备份过程中超越D2D系统的原因之一是,备份应用软件将备份写到VTL磁盘,这类似以数据流形式写到磁带。另一方面,D2D写单独的文件,在对下一个文件操作前,必须记录每个文件的位置和文件系统的元数据。VTL以数据流形式写而不是以单独的文件形式写,这一方法能够避免受到文件系统所支持的最大文件数目的限制。VTL文件系统的专有特性克服了D2D的通用文件系统遇到的限制问题。

  在安全性方面,访问VTL的文件系统和访问磁带类似,用户不能直接访问磁带,被病毒感染的文件也不会感染磁带。

  VTL可以提供综合/集中全量备份的好处,在知道了所有文件的位置和发送的时间后,就可以简单地使用指针来建立新的全量备份。使用指针可以建立一个新的虚拟全量备份,来取代从一个虚拟磁带向另一个虚拟磁带拷贝数据。当新的全量备份建立后,可以告诉备份软件全量备份的内容和全量备份所在的“磁带”,然后备份软件会把该全量备份看做和其他全量备份一样。该全量备份还可以用于进一步的增量备份和恢复,并且能拷贝到真正的磁带。

  虚拟全量备份除了即时功能以外,在容量方面也具备优势。如果使用备份软件建立了真正的综合全量备份,与通常的全量备份一样,也会占用同样大小的磁盘空间。然而VTL的虚拟全量备份几乎不会占用任何磁盘空间,因为VTL仅仅使用了指针。

传统数据保护 

问题重重何时休?

  如图1所示,这是一个典型的用户数据保护环境(为了便于说明问题,我们省略了用户冗余系统与容灾系统)。

  当数据从关键应用系统中产生以后,不能够直接进行备份。原因在于备份工作一方面会影响业务系统的高效运行,另一方面备份工作经常会出现各类问题而无法成功完成,这时就会造成数据的丢失。因此,用户需要一套性能可以与在线系统相比拟的磁盘系统进行数据复制,然后对复制的数据(与业务系统一致)进行备份。

  镜像磁盘系统仍为高端产品,在有些业务系统中镜像系统与业务系统完全一样,因此价格昂贵。传统磁带库在运行中自然存在着各种各样的机械问题。

应用第一步

无缝融入原有系统

  如图2所示,使用虚拟磁带库使得磁盘阵列对于备份/恢复系统来说像是磁带库,这样一来,无须改变配置就可以在备份系统中使用磁盘,而备份系统仍旧认为在向磁带进行备份。对于业务系统而言,几乎感觉不到任何改变,在逻辑上,VTL与传统磁带库组成了原有系统中的磁带库,但是把所有虚拟磁带库的优点都集成进来。

  在这种情况下,VTL只是通过备份软件把数据块取出,然后模拟成磁带格式将其放到磁盘上,但并不知道数据块中究竟是什么内容。

应用第二步

革掉D2D的命

  在图3的情况,VTL的应用发生巨大改变—它特别为存储备份数据而建立了客户化文件系统,该文件系统可以完成快照、复制、指针和各种磁带不能完成的事情。在这种应用情况,VTL完全代替了传统的D2D系统。

  这个时候,一旦写完备份后,VTL会检查所写影像,并识别影像的内容。此外,还要决定备份的类型、备份包含的文件(或其他项目)和文件的来源。在这些全部完成后,他们需要建立一个内部数据库——基本上就是备份服务器索引或目录的副本。

  VTL不仅代替了D2D系统,还对用户整个数据保护流程进行了变革,在此之前,业务系统数据传送给镜像系统,之后的数据保护工作由镜像系统完成,而采用VTL代替D2D之后,业务系统把数据传输给由VTL和磁带库组成的数据保护系统,由后者完成整个数据保护工作。

  如前文所提到的那样,VTL首先出现在大型机环境中,由于该领域相对封闭,而且应用并不普遍,因此本文主要介绍开放系统领域的情况。在开放系统中,VTL产品主要有两类,一类是磁盘库管理服务器,另一类是纯硬件虚拟磁带库。

磁盘库管理服务器

  为了提高VTL备份的应用安全性,部分供应商开始将各色软件VTL模块装入专用服务器(一般称为“磁盘库管理服务器”),或将操作系统和软件VTL模块“固化”在“磁盘库控制器”内。该类型VTL具备“准硬件”包装,但备份磁盘的应用仍受限于文件系统。这种软件硬件化的VTL方案实现了备份管理系统和虚拟磁带模块的解耦,在一定程度上提高了备份数据的安全性,可以作为外设独立使用。但是,核心控制部分仍旧是通过操作系统,逻辑地模拟磁盘的线性化,因此存在一定缺陷。

纯硬件虚拟磁带库

  2002年底,美国专业备份硬件开发制造商Ultera Systems和DLT磁带技术的发明者Quantum公司几乎同时推出了通用平台的纯硬件虚拟磁带库。纯硬件虚拟磁带库突破了常规磁盘应用的局限,采用全新的裸数据写于裸磁盘的块级(Block-Level)磁盘线性化技术。

  对于Block-Level VTL,虚拟磁带介质(磁盘阵列)不再是普通文件系统格式化的扇区,而是和磁带一样的裸介质(“Raw Disk”),其上备份数据的书写,亦如磁带书写一样采取Byte-to-Byte的形式。换句话说,它真正在物理层上实现了磁盘读写的线性化,或是磁盘的物理磁带化。Block-Level VTL突破了普通文件系统的制约,一些业内人士认为,它的成功应用,是虚拟磁带库技术成熟的标志。

  ADIC Pathlight VX

  通过ADIC Pathlight VX ,现有的备份软件可通过使用串行ATA磁盘阵列来执行数据备份和恢复任务,并利用磁盘的高性能和 RAID 可靠性,而不必更改现有的备份模式和策略以及备份软件。对于长期保留和灾难恢复来说,集成的数据转移程序可利用原始备份应用的格式和介质管理策略以后台方式将数据写入磁带。

  EMC CLARiiON磁盘库

  EMC的CLARiiON磁盘库最高可提供58TB存储容量,压缩后可以存储174TB的数据。它可用于备份CLARiiON、Symmetrix、EMC的NAS系统系列以及非EMC存储,可提供高达80MBps的单数据流性能和高达425MBps的持续性能等的高性能流带宽解决方案。

  HP 6000虚拟磁带库

  HP 6000虚拟磁带库系统模拟常规磁带库和磁带驱动器,适应现有数据保护环境,从而不必对备份软件或监控政策做任何改动。通过同时模拟多个磁带驱动器,HP 6000虚拟磁带库系统可以并行完成更多备份任务,提供了超过500MBps的聚合性能和高达90MBps的单一流性能。与Command View磁带库软件的集成使客户可以从一个“单一管理平台”管理所有惠普企业磁带库系统和虚拟磁带库系统。

  IBM虚拟磁带服务器

  IBM TotalStorage虚拟磁带服务器(VTS)可以为连接的主机提供数以百计的虚拟磁带地址。磁带数据被临时存放在VTS磁盘高速缓存之中,可对这些数据进行快速访问。多个逻辑卷以异步方式转移到高容量磁带盒之中,能够以最优的方式使用企业磁带库的可用容量。VTS是一种独立的3494子系统,安装在磁带库之外的一个独立机架中。VTS包括一个基于RISC的微处理器、多种存储管理功能和磁盘高速缓存。

  昆腾增强型DX30

  昆腾增强型备份方案DX30的特点是,利用磁盘技术大幅度提高备份速度,销减数据恢复时间;为备份优化系统,可以传输大量数据,而不是通过主存储文件系统传输小型数据块;包含冗余硬件特性,提供RAID保护和错误处理,提高整体可靠性;使用DX30不需要客户改变保护数据的方式(操作规程);DX30采用磁带仿真,最大限度地保护用户已有投资。

  Sepaton S2100-ES2

  S2100-ES2满足企业对数据高可用性及高可靠性的要求,利用SATA RAID磁盘技术,仿真多种品牌磁带库。S2100-ES2单机容量能够从3.5TB扩充到1000TB,备份及恢复速度从150MBps到1200MBps,每个S2100-ES2可以有4个分布工作节点,全部4个分布节点工作的时候,最大可以仿真16个磁带库,256个驱动器。

  虚拟磁带库接下来还有好多事情可以做,用户在购买产品时,应该向厂商询问是否支持下述几点。

  1. 基于网络的终端用户不必通过备份软件进行恢复。当文件进行备份时,就已经得到了文件列表。VTL可以通过网络浏览器来展示备份文件列表,并允许管理员(或终端用户)准确点击给定文件,并将文件从VTL直接下载到用户的系统上。这个操作就如同从网络上下载文件一样简单,无须装载或学习管理客户机,仅仅是一个人们熟悉的给定系统或用户的备份文件树。

  2. 通过一个NFS/CIFS界面可以把相同的文件列表作为一个虚拟文件系统展示出来。该文件系统甚至可以被安装用以读/写访问,允许用户立刻使用备份的文件系统从—文件系统备份即时恢复。虚拟文件系统的所有变化会被记录下来,并且以一种增量备份展现给备份软件。一旦真正的文件系统被恢复,可以使用备份软件将虚拟文件系统的改动恢复—恢复到原始卷。

  3. 可以减少备份所需的磁盘容量。实现的方法是,使用VTL执行一个常规全量或增量备份,当备份执行后,将检查普通文件和普通数据块的备份,只存储全新的文件和数据块。如果有一个全量备份,并且一个文件已经备份,该文件在备份后可以被删除,用一个指针来取代它。如果是一个给定文件的增量备份,该文件只有两块数据发生了改变,就可以只存储两块数据,剩余的部分用一个指针代替。

  4. VTL兼容多种品牌的备份软件。假设用户已经使用A品牌备份软件产品做备份很多年了,但希望开始使用新的B品牌备份软件。如果VTL可以将A格式的备份虚拟为B格式的备份,用户就好像一直在使用B软件进行备份。同样,VTL还可以将B格式备份虚拟成A格式的。那么用户就可以不被备份软件绑定,从而在选择备份软件方面带来更大灵活性。


编看编想

VTL当然不是万能的


  从一些VTL厂商那里,记者了解到这样一种观点——VTL将完全代替传统磁带库。

  某厂商工程师告诉记者,采用VTL用户完全可以丢弃传统磁带库,无论是备份系统,还是远程容灾系统都可以采用VTL,而且从价格方面进行比较,最高容量ATA磁盘的单位容量成本已经与LTO等主流磁带的相差无几。

  记者认为,目前来讲,磁带仍然有着磁盘无法比拟的特点。比如磁带可以方便地进行不带电的异地保存,任何带电设备都有完全毁坏的可能,而磁带则可以复制成多个拷贝采用传统方式运送到较远距离站点;还比如低成本,磁带的容量每年都在飞速发展之中,很快就会有每盘容量超过1TB的磁带,而且磁带厂商公布了未来几代产品的发展路线图,提供技术保障。

  当然用户还存在投资保护的问题,那些投资了巨额资金建造的备份设备不会短时间丢弃。最关键的一点是,大型用户多年以来已经习惯了磁带备份的各种流程管理、策略管理以及数据管理工作,如果完全采用VTL势必需要对整体数据信息管理流程做出巨大调整,而这是一项困难的挑战。


成熟VTL的几个特点

  较高应用安全性

  —磁盘磁带化,备份数据读写基于磁带格式;

  性能大幅提高

  —可支持接近磁盘阵列极限速度的备份/恢复速度;

  去除磁盘碎片

  —保障性能持续性及磁盘系统高效率运行;

  无缝接入用户环境

  —较少维护工作,避免各类管理风险。

打开APP阅读全文
{{data.thematic.text}}

相关文章

加载中...

分享到

请使用浏览器的分享功能
分享到微信等