【IT168 专稿】IT界在过去的几十年里,对于一些特定的热点问题的争论就从来没有停止过。还记得关于大型机终结的讨论吗?大型机被形容得如同恐龙一般,很大,发展得又慢,而且还有很多人认为它已经过时了。今天,大型机还在不断地进化发展,它不会像恐龙那样,彻底灭绝。
之后的辩论围绕着集中式和分布式处理展开。今天,集中和分布式计算也各自找到了生存的土壤。
关于磁带和硬盘的对决也已经轰轰烈烈很多年了,硬盘的支持者们宣称磁带已经消失多年了,而磁带的支持者们则认为磁带的发展十分兴旺——现在没有消失,以后也不会消失。这两派就像是美国内战双方阵营中的将士一样,守在各自的战壕中,以各自掌握的证据来打击对手。这一长期的争论已经持续得够久了,是该做个了结的时候了。
硬盘技术目前充满了活力,正在健康发展,而磁带技术也是如此。关于磁带消失的报道是有些言过其实了。不管是硬盘还是磁带,都将在数据中心共存上很多年。磁带和硬盘的角色,就像大型机一样,而且还要不断发展,互为补充。
让我们来看看一些流传甚广的说法,或者说是关于磁带已经是明日黄花的传闻。
传闻一:磁带是古老的技术,古老的技术肯定会消失
首先让我们来回顾一下磁带的历史。
第一款可用的商业磁带机是1952年问世的IBM model 726。它使用一个12英寸的电影胶片卷轴,可以储存1.4兆数据,传输数据速度为7.5千比特每秒,这个磁带是由3M公司制造的。
你觉得磁带技术年代久远吗?或许吧,但磁带技术也因此有充足的时间来发展成熟,成为一项可靠的高性能技术。
磁带真的古老吗?
如今的磁带存储量能达到TB级,数据传输速度也增加到了100MB每秒。有人可能觉得最近几年技术在日新月异地发展,是这样吗?其实并不然!上个世纪50年代初期才是计算机制造商们最为活跃的时期。
有人认为硬盘的出现要比磁带晚得多,事实并非如此。
第一款商业硬盘出现在1956年,仅仅比磁带晚了4年而已。IBM称这款硬盘为RAMAC(随机访问方式计算机控制器),这款硬盘的直径为24英寸,50片,可以存储大概5兆的数据,每分钟大概为1200转。和现在的技术相比,这是一个又大又慢又贵的设备。整个RAMAC系统大概有1吨重,需要铲车才能移动它,而每个月出租这台设备就能赚到3,500美元。
以今天的标准来衡量的话,早期的磁带和硬盘都是过时的技术了。但是还有一些其它技术要比磁带还要久远得多,至今仍在不断发展,例如电视、电话、汽车还有卫星,这些设备当初在诞生的时候,无一不是笨重简陋,但是发展到今天,我们的生活已经远远离不开他们。
例如1876年,世界上第一部电话通话成功。当然,以前的电话又沉又笨,只有黑色的,而如今的手机轻薄小巧,还有多种颜色可供选择,可以收发电子邮件,短信息,还能照相,当然,还可以通话。记得你旅行的时候到处找公用电话亭的尴尬吗?现在,你还需要知道最近的公用电话亭在哪里吗?
事实上,磁带和硬盘就像电话、电视、汽车和人造卫星一样,一直在不断发展。事实上,现在的这些东西都和他们最初的样子不大一样了,这就是发展的结果。未来,磁带也将获得新的生命,承载着人类科技文明的历史继续向前发展。
谣言二:磁带无法再进步了
有些人相信磁带已经是江郎才尽了,无法再发展了,因为技术已经达到了极限。不过,还是再看看下面的情况再下结论吧。
首先我们来看看磁带的容量。
最初的磁带,一盘可以储存1.4兆数据,如今LTO-3磁带机一盘磁带可以储存400GB未压缩的数据,今年晚些时候,LTO-4磁带机则将存储量再次增加一倍,一盘达到800GB。这就意味着在55年间,磁带存储未压缩数据的容量提升了571,426倍!
第五代和第六代LTO磁带机将继续书写LTO的历史,存储容量加倍,性能也会得到提升。
硬盘和磁带在容量的比拼上谁会更胜一筹呢?如今500GB SATA硬盘已经很普遍了,硬盘在过去51年中,容量大概提升了100,000倍。但是相比磁带发展的速度我们可以看见,在过去的50年中,磁带容量的扩展速度远远领先于硬盘。而且未来,磁带容量还将继续以惊人的速度增长。
观点:垂直磁记录将续写磁带历史
存储厂商通过增加其设备的密度来提升容量。简单地说,就是把数据写得越来越近,从而存储更多的数据。但是密度始终会存在一个极限,当数据分布过于紧密的时候,我们将无法可靠地读取这些数据。不管是磁带厂商还是硬盘厂商都面临着增加密度而带来的问题。很多人相信 我们很快就会在纵向到达极限,每平方英寸可以记录100到200GB的数据。
然而技术革新终将获得成功。举个例子来说,现在的存储厂商垂直地把数据写在记录表面而不是把数据密集地写在同一个平面上。这项技术称为垂直磁录写技术,最初于1976年应用于软盘生产,但似乎效果不佳。现在,这项技术被应用于硬盘上。垂直磁录写技术可将密度提升10倍左右。
那么磁带技术是否也有类似的优势呢?2006年5月,Almaden研究中心的研究人员展示了一种磁带,可以在每英寸66.7亿比特的密度上存储数据——这个密度是当今主流磁带产品的15倍。这就意味着一台LTO磁带机可以存储8TB的数据,相当于8百万本书,8百万本书需要57英里长的书架才能装得下。
多TB磁带存储计划是美国商务部国家标准与技术协会的高级技术项目。这个项目是由美国政府和私人公司共同努力实现的高容量磁带存储。这个历时五年的项目将在今年年底完成,可将磁带的密度提升250倍,并改进基本部件,为今后密度继续提升做准备,比如生产新型的磁带,磁头,研究新的在磁道上写数据的方式。事实上,我们期待着到了2010年,就能有25TB的磁带机出现。
磁带的改进需要大量研发上面的投资,但目前已经有很多公司在为磁带的发展而努力。
谣言三:磁带表现欠佳
每个数据中心都经历过硬件或软件的故障。服务器、硬盘系统和磁带都会出错。而且硬盘更加容易出错,因此硬盘厂商才会投入大量金钱来研究更先进的RAID解决方案。随便拦个路人问问他们笔记本的可靠性,他可能会花上半天时间给你讲述他的笔记本如何大量滋生病毒,或者在一个重要演讲之前罢工的事。
一些在数据中心工作的人,在磁带是圆形而不是方形的时候就知道圆形的磁带操作上会出什么问题。磁带是手动地放到磁带机上的,那时候,计算机房允许人们吃东西喝饮料,一个人刚吃完三明治就去换磁带是常有的事,很可能把食物残渣留在磁带上。为了减少类似的人为破坏,磁带厂商随后就把磁带封装到了方形的磁带机里,这就大大提高了人为操作的可靠性。
有趣的是,今天与磁带有关的大部分备份问题是和其他资源联系到了一起,比如系统或者软件错误,以及人员或者管理上的因素,而不是磁带硬件本身的问题。
不管怎么说,自从一卷一卷的磁带开始,这些年磁媒介方面的进步是显著的,为了增加比特的密度,厂商把磁带体积变小,统一每一代介质上金属粒子的尺寸。这些粒子的喷发使用的是瘦胶片覆盖技术,附着到分层媒介上。在读写数据时后一代产品比前一代准确度更高。
如今的磁带系统使用技术可以提供卓越的数据完整性表现。举个例子,LTO技术使用服务追踪机制,在写检验完成之后才能读取,这就大大保证了读写操作的准确性。而且,LTO磁带使用机柜内存来记录重要信息,保持系统的可用性。磁带的平均无故障时间是磁带在读、检验或写数据的时间的百分数。所有这些特性使得LTO驱动器平均无故障时间为100%负载循环时250,000小时。
1989年出现的第一代DDS硬盘,在12%负载循环时号称平均无故障时间为300,000小时;换算过来就是100%负载循环时平均无故障时间为36,000小时。LTO驱动器要比第一代的DDS可靠大约700%倍。
当然,重要数据应该写在两个磁带盒里,而且其中一个还应该放置在远程位置,保证在灾难出现后数据可以得到恢复。这种移动便携性正是磁盘技术的一个关键特性。相比硬盘的常见故障,我们会发现古老的的磁带系统可靠性极高。
谣言四:没有人买磁带了
有些人声称磁带市场已经是一堆死灰了,虽然有些磁带机销量呈下滑趋势,但也不能代表整个磁带市场的低迷。事实上,磁带市场的估价超过40亿美元,而中端的需求还在不断增加。超过150万LTO磁带机在用,以PB级存储数据量存在的磁带显示了这种缓慢而持续的需求增长。
一家主要磁带机供应商2003年一季度的出货量大约是可存储600PB数据的磁带机,到了2004年第一季度这个数字上升到了900PB。而2005年初,出货量已经达到了1300PB。2006年一季度则超过了1700PB。在过去的三年中,年增长率大概为36%。
从上述这些数据可以看见,今天的数据中心仍然在购买大量的磁带作为存储数据的重要部件。
有些人相信磁带将不能在大型的数据中心占有一席之地。但在上文中,我们明确了数据中心依然在购买磁带产品。我们现在假设一下,有一部分数据中心计划摒弃磁带,那么,我们现在存储在磁带上的数据该如何处理呢?
把磁带扔出门外?这些磁带上记录了历史数据,可能需要保存一段时间,或是出于客户的要求,或是要做性能分析,又或者是法规遵从的需要,扔出门外是肯定行不通的。那么把这些磁带上的存档信息拷贝到硬盘上,这样做真的现实吗?
我们假设有10,000盘磁带,其中有6,000盘LTO-2磁带,保存了400GB的压缩数据,以及4,000盘LTO-3磁带,保存了800GB的压缩数据,相当于:6,000 LTO-2磁带*400GB=240万GB,4,000 LTO-3磁带*800GB=320万GB,也就是说所有磁带的容量是560万GB。
考虑以下情况:一个存满数据的SATA硬盘存储系统可以存储56TB(或者说是56,000GB数据),我们需要购买100套这样的硬盘存储系统。一个高性能的磁盘阵列支持332TB的内部存储,我们需要购买17个这样的存储阵列。
你当然可以把所有的磁带换成硬盘。将会占据不小的空间,还需要增加电力和降温系统的能源消耗,也就意味着要花很多钱——卖给你硬盘的人肯定会喜笑颜开的。
因此,在中型和大型数据中心,用硬盘代替磁带将是一项耗资巨大的工程,数据中心还将继续使用磁带来存储数据。