通过删除重复数据避免冗余

1237阅读 0评论2008-09-23 joey
分类:IT职场

重复数据删除是一种新兴的热门存储技术,用于管理数据的爆炸性增长并提供数据保护。 该备份技术可保存相同数据的一个副本,并使用指向这份副本的指针来代替其它所有实例,从而避免存储冗余的数据。

简单示例

下面是一个简单的例子: 假设 500 个人都收到一封在公司内发送、带有 1 MB 附件的电子邮件。 如果每个收件人都在本地保存该附件,则备份这些台式机时会将其复制 500 次,多占用 499 MB 备份空间,而这完全没有必要。

重复数据删除技术只备份该附件中数据的一份实例,并使用指向该副本的指针来代替其它 499 个实例。

该技术还具备另一个功能: 如果对原始文件进行了更改,则重复数据删除技术将只保存实际上已改变的数据块。 一个块通常很小,一般包括 2 KB 到 10 KB 之间的数据。

如果上述 1 MB 演示稿的标题发生了变化,则重复数据删除技术只会使用 4 KB 的数据块保存新标题,且指针指向文件的第一个版本。 所以,只保留 4 KB 的新备份数据。

如果与其它数据删减方法一起使用,如传统的数据压缩方法,重复数据删除技术还可以进一步减少数据量,从而帮助您:


计算节约的备份存储空间

有人可能认为,通过将更多数据挤压到较小空间中,就能有更多空间来存储新数据,但重复数据删除技术的工作原理并非如此。 因为该技术使用指针来定位重复数据,所以可存储的数据比率会随着每次备份而增加。

不过,在增加更多独特数据时,并不能利用指针来节约空间。 (有关比率的详细信息,请参见。) 所以,通过删除重复数据,可以使用相同空间来将更多备份保存更长时间。

哪种方法最适合我的企业?

最适合的重复数据删除方法取决于您公司的规模和备份需要。 某些公司仅提供一种方法,或者基于其它对象级区分或散列的分块方法。 不过,在不同环境中,这两种技术具备不同的优势和缺陷。 所以,惠普 (HP) 目前根据不同业务环境的需要,提供两种量身定制的配置选择:


无论您有什么样的需要,惠普 (HP) 都能提供多种选项来任您选择,而不仅仅是提供一个大小不同的单一解决方案。
上一篇:在开放式办公室中生存的 8 个提示
下一篇:virtualization: Storage-based performance gotcha