Top
首页 > 老文章 > 正文

专栏八:CommVault重复数据删除技术

数据中心
发布时间:2010-02-09 08:10        来源:        作者:赛迪网
大量的冗余数据一直是企业在数据管理上头疼的问题。分析机构估计,企业中多达80%至90%的备份数据和归档数据是冗余数据,即使冗余数据只有20%,其造成的企业资源浪费也是惊人的――如果把这些冗余数据保存到磁盘上,不断增加的存储设备会耗费更多的场地和能源。 冗余数据催生重复数据删除技术 之所以有如此惊人的冗余数据,是因为对于备份或者对于数据保护来说,其所要花费的存储容量或者存储的空间,会在原始生产数据的五倍到十倍左右。最简单的例子,比如对生产数据做备份保护,肯定不止备一次,如果每天要做一份保护,一周就有七次。但这七次中,只有一点增量数据是不一样的。 重复数据删除技术能够帮助企业消除冗余数据,减少备份所需的存储空间。需要指出的是,尽管重复删除技术与压缩技术都能够减少备份数据的大小,但是这两种方法的流程和结果却有很大不同。压缩只能够降低需要处理的数据大小,而重复数据删除则能够覆盖隐藏数据,辨识不同目录下的相同文件、数据变更并在子文件层级捕获唯一不同的拦截,从而影响到存储这些数据的空间。 重复数据删除的过程可以通过软件或硬件两种方式完成。硬件方式是在数据被写入目标磁盘位置前删除重复数据,从而减少存储占用。目前,包括虚拟磁带库(VTL)在内的重复数据删除设备提供了在后端存储设备消除重复数据的能力,但这种方法功能有限,应对不了数据快速增长带来的更大挑战。表现在,购买、管理和扩展重复数据删除应用的成本极高;无法在多个重复数据删除设备之间删除冗余数据;重复数据删除设备处理优化是以牺牲关键恢复性能为代价的;特别是当写入磁带的时候,由于在创建磁带拷贝的时候,重复数据删除设备会将所有数据全部还原组合,重复数据删除设备就更无优势可言。 软件方式是在数据被发送到备份前删除客户端的重复数据。基于软件的重复数据删除能够降低带宽消耗并优化存储利用率,适用于带宽和生产力有限的企业环境,尤其是远程站点、服务器分散的中型站点或是虚拟服务器环境。 CommVault重新定义存储经济 CommVault提供了业界领先的内嵌式全局重复数据删除技术。这一端对端的重复数据删除技术创新性地在业界首次把重复数据删除功能的好处扩大到磁带介质,适用于任何磁盘类型,具有高效率、分布式、可扩展、与硬件无关等特点。这种端对端的解决方案具有诸多好处,例如加快网络数据传输、缩短备份窗口时间、提高恢复速度以及更有效地利用二级存储基础架构,从而削减保存备份和归档副本所需磁盘或者磁带空间高达90%。 CommVault重复数据删除技术具有可识别内容功能,能够更精确地找到并且删除所有独立应用、文件系统和数据类型中数据流的共有模式,而且还包括对数据集加密和保护功能。Simpana软件还能够利用对开放磁盘架构的精确编目索引,彻底消除了重组延迟和恢复负担,从而加快了恢复流程和降低了开支。此外,Simpana软件可以在多媒介代理之间实施重复数据删除的特点,突破性地实现了将重复删除数据副本透明地迁移到磁带中而不需要“再组装”。 CommVault重复数据删除技术全面消除多个备份周期以及备份和归档数据存储区所出现的重复数据,提高了重复数据删除比率,加快恢复保留期较长的数据,通过优化的数据存储/分层,提高易管理性。 更为重要的,CommVault重复数据删除技术能确保恢复方面的度量指标不受影响。不像市面上许多其它重复数据删除解决方案,CommVault解决方案从经重复数据删除后的存储区读取数据的速度仍然很快,而且从重复数据删除目标进行的拷贝操作与从普通非重复数据删除目标进行的恢复一样快。 概括来说,CommVault重复数据删除优势表现在:  最优化磁带恢复和空间节省。具有更高的重复数据删除比率,磁盘和磁带上的备份和归档数据减少达90%以上。  范围更广、更全面。重复删除到硬盘,重复删除到磁带,并可以跨备份和归档数据。  大幅度降低成本。CommVault重复数据删除技术充分利用现有的二级存储设备,减少到磁带的写入数据(减少磁带驱动器和磁带) ,减少占用网络带宽,更具成本效益。  显著加快恢复速度。CommVault重复数据删除技术结合了共享索引/目录(Shared Index/Catalog)与独到的分片存储(Silo Storage)技术,能够跟踪和检索所需数据,不需要漫长的恢复过程,也不需要搜遍整个数据卷,显著提高恢复速度。 研究机构的分析显示,企业每年需要管理的主存储量以50%~100%的速度增长,而二级数据副本也以12倍的惊人速度增加。CommVault建议企业选择和部署重复数据删除技术来克服数据快速增长的挑战,而不应把重复数据删除方案作为“权宜之计”的单点产品来部署。通过把CommVault重复数据删除功能内嵌到端到端的备份和归档解决方案中,不仅可提高后端存储效 率,还能充分利用企业数据管理解决方案的全部功能,以应对快速增长的数据,满足延长数据保留期的需求,并且便于快速恢复数据,不给基础架构带来过大负荷担。
加载更多

专题访谈

合作站点
stat