数据分级存储
第五章 数据分级存储
数据分级存储,是指数据客体存放在不同级别的存储设备(磁盘、磁盘阵列、光盘库、磁带库)中,通过分级存储管理软件实现数据客体在存储设备之间的自动迁移。数据迁移的规则是可以人为控制的 离线存储
离线存储采用磁带作为存储介质,其访问速度低,但能实现海量存储,同时价格低廉。
以前用户有这样的想法:反正数据存放在磁带上面,性能都不高,只要在灾难发生时能够使用它们将需要的数据恢复回来就可以了。其实,这是很不正确的。要知道,用户的数据越来越多,原有的数据也不能丢弃,当这些数据逐年累积以后管理它们就成了一件十分困难的事
情,而且还要进行磁带定期维护的工作。
因此,许多磁带库厂商在这方面进行了加强,提供了完整的数据生命周期管理,专为数据密集型SAN 环境而设计,尤其适用于高强度、大容量的数据访问和数据存储,减少了管理 SAN 数据的时间和成本,从数据生成到其生命周期结束,其中的每一步骤都提供了相应的功能。这也说明磁带库管理更注重“智能”。
近线存储
随着用户需求的日益细分,人们越来越发现原有的两级模式(在线与离线)已经不能很好地满足用户的存储需求,在这两个“极端”之间有大量的空白,于是就产生了近线存储的概念。近线存储的概念一产生就得到了厂商与用户的赞同,定位于此领域的产品很快就纷纷出现,形成了近一时期最为活跃的中间层。
NetApp 推出的R100 近线存储设备,获得巨大成功,仅1 年时间在全球就拥有了100 多个用户,总部署容量超过3PB。
Quantum 推出的基于磁盘的产品DX30,能够模拟各类磁带库,保留了与存储管理软件的兼容性,而又具有比磁带库
更高的速度,用户可以先将数据备份到DX30 中,然后再转移到磁带上。
以磁带产品知名的StorageTek 公司在业界较早提出了数据生命周期管理的概念,并拥有针对数据的不同生命周期提供的相应的解决方案,包括磁带设备和磁盘系统及软件产品,以帮助用户“将适当的数据,在适当的时间,存储到适当的设备上”。
Legato ,引入了磁盘备份与磁带备份相结合的新方式,通过磁盘备份可以为用户提供更多性能优势。采用磁盘进行备份避免了一些磁带备份的弊端:磁带只能进行顺序读写,而且每盘磁带都需要完全倒回才可取出,加载卸载时间很长。磁盘备份解决方案还完全包括了“虚拟带库”的功能,而且可以在读一部分内容的同时进行写另一部分内容,因而可以实现了在设备进行备份时的恢复、搬移/克隆操作。
分级存储的管理
存储实现分级以后,在线、近线与离线存储存放的数据价值不同,在同一级别存储内部(比如在线和离线存储),存放的数据也应该不同,实现每一级别内的
"分级存储"。如何将各个级别存储中数据统一管理起来便成了最为关键的问题。
分级存储管理(Hierarchical Storage Management,HSM) 起源于1978 年,首先使用于大型机系统。近10 年来,HSM 被广泛应用于开放系统的Unix 和Windows 平台。
分级存储管理是一种将离线存储与在线存储融合的技术。它将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,然后将磁盘中常用的数据按指定的策略自动迁移到磁带库等二级大容量存储设备上。当需要使用这些数据时,分级存储系统会自动将这些数据从下一级存储设备调回到上一级磁盘上。对于用户来说,上述数据迁移操作完全是透明的,只是在访问磁盘的速度上略有怠慢,而在逻辑磁盘的容量上明显感觉大大提高了。通俗地讲,数据迁移是一种可以把大量不经常访问的数据存放在磁带库、光盘库等离线介质上,只在磁盘阵列上保存少量访问频率高的数据的技术。当那些磁带等介质上数据被访问时,系统自动地把这些数据回迁到磁盘阵列中;同样,磁盘阵列中很久未访问的数据被自动迁移到磁带介质上,从而大大降低投入和管理成本。
HSM 应用也具备监测磁盘容量并在关键容量情况下作出反应的能力。这种软件经过配置后可以为某个卷设定一个最小的剩余空间,如20% 。
如果软件发现该卷的剩余容量已经不足20% ,数据就会被从该卷移动至备用存储介质。这样便可以立即释放空间,管理员也可以在今后有空闲时再来解决空间的问题。
由此可见,分级存储管理更多从降低成本、不影响数据应用效果的角度解决数据的存储问题。事实上,降低成本、提高效率已成为IT 厂商追逐技术进步的一个目标。近线存储就是这种进步的产物。伴随单盘成本的下降,近线存
数据分级存储 来自淘豆网m.daumloan.com转载请标明出处.