所谓分级存储,就是根据数据不同的重要性、访问频次等指标分别存储在不同性能的存储设备上,采取不同的存储方式。这样一方面可大大减少非重要性数据在一级本地磁盘所占用的空间,还可加快整个系统的存储性能。在这里就涉及到几种不同性能的存储设备和不同的存储形式了。
目前常用于数据存储的存储设备主要有磁盘(包括磁盘阵列)、磁带(包括磁带机和磁带库)和光盘(包括一切CD-R、CD-RW、DVD-R、DVD-RW等光盘塔和光盘库设备)。从性能上来说,磁盘当然是最好的,光盘次之,最差的是磁带。而从价格上来说,单位容量成本上升磁盘最贵、光盘次之,磁带最低。这就为我们不同的应用追求最佳性价比提供了条件,因为这些不同的存储媒介可应用于不同的存储方式中。这不同的存储形式包括在线存储(OnStore)、近线存储(NearStore)和离线存储(OffStore)。
在线存储
在线存储又称工作级的存储,存储设备和所存储的数据时刻保持“在线”状态,是可随意读取的,可满足计算平台对数据访问的速度要求。如我们PC机中常用的磁盘基本上都是采用这种存储形式的。一般在线存储设备为磁盘和磁盘阵列等磁盘设备,价格相对昂贵,但性能最好。
离线存储
离线存储主要是用于对在线存储的数据进行,以防范可能发生的数据灾难,因此又称备份级的存储。离线海量存储的典型产品就是磁带或磁带库,价格相对低廉。离线存储介质上的数据在读写时是顺序进行的。当需要读取数据时,需要把带子卷到头,再进行定位。当需要对已写入的数据进行修改时,所有的数据都需要全部进行改写。因此,离线海量存储的访问是慢速度、低效率的。
近线存储
所谓近线存储,就是指将那些并不是经常用到,或者说数据的访问量并不大的数据存放在性能较低的存储设备上。对这些的设备要求是寻址迅速、传输率高。因此,近线存储对性能要求相对来说并不高,但由于不常用的数据要占总数据量的大多数,这也就意味着近线存储设备首先要保证的是容量。
在分级数据存储结构中,磁带库等成本较低的存储资源用来存放访问频率较低的信息,而磁盘或磁盘阵列等成本高、速度快的设备,用来存储经常访问的重要信息。数据分级存储的工作原理是基于数据访问的局部性。通过将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本的存储空间给更频繁访问的数据,可以获得更好的总体性价比。
数据迁移策略:
数据迁移策略的选择,如自上次访问以来的最短时间、最短文件长度、文件类型、磁带设备容量与硬盘容量的比例等,条件可有复合的选择,在满足条件的前提下,然后,系统会自动进行迁移操作。转移后的文件被用很小的“占位”文件取代,由该占位文件指向原文件被转移后的新位置。因此该文件对于应用和用户仍是可见的。一旦系统接收到对被转移文件的请求,它会从最快捷的途径进行检索,以透明的方式恢复该文件。部分文件高速缓存使应用可以立即访问文件中的某一部分;而同时系统则取回整个文件。
当用户需要访问被迁移文件时,系统会将磁带设备上的相应数据调回到硬盘供用户访问。本方案中,文件系统的备份只需写入被转移文件的占位文件即可。同时,您也可以对系统进行配置,使文件在转移时被写入备份系统。这样,您所有的数据都可以随时恢复,而且备份的速度大大提高。
数据分级存储之所以重要,是因为它既能最大限度地满足用户需求,又可使存储成本最小化。数据分级存储的优点具体表现在:
1.减少总体存储成本
不经常访问的数据驻留在较低成本的存储器中,可综合发挥磁盘驱动器的性能优势与磁带的成本优势。
2.性能优化
分级存储可使不同性价比的存储设备发挥最大的综合效益。
3.改善数据可用性
分级存储把很少使用的历史数据迁移到辅助存储器中,或归档到离线存储池中,这样就无需反复保存,减少了存储的时间;同时提高了在线数据的可用性,使磁盘的可用空间维持在系统要求的水平上。
4.数据迁移对应用透明
进行分级存储后,数据移动到另外的存储器时,应用程序不需要改变,使数据迁移对应用透明。对被转移数据的透明访问——在主磁盘上会留下一个占位文件。因此该文件对于应用和用户仍是可见的。一旦数据迁移软件接收到对被转移文件的请求,它会从最快捷的途径进行检索,以透明的方式恢复该文件。部分文件高速缓存 (目前仅适用于UNIX系统)使应用可以立即访问文件中的某一部分;而同时数据迁移软件则取回整个文件。