随着服务器虚拟化的兴起,基于主机的虚拟化备份和恢复技术有逐渐赶超传统基于代理备份工具的趋势。但全新的工作在数据块层面的基于代理的备份正在改变人们的观点。借助虚拟机内置代理和卷一级的过滤驱动,这些新技术已经开始把注意力从主机备份方式重新带回传统模式中。
为理解最新的数据块级代理备份需要一些背景知识。
早期基于代理的备份
在服务器虚拟化出现之前,Windows系统直接运行于物理硬件之上,而备份系统也非常简单,虽然要实现每天都可以成功的备份并不是那么容易。备份代理每天扫描所有的Windows文件系统并备份时间戳发生改变的所有文件。这种基于单个文件变化的备份方式是当时的主流模式。
同样,当时的备份体系搭建也相对的简单。你只需要购买磁带、磁带驱动器和备份软件,并在每台计算机上安装备份代理。在系统连接和安装完成后,剩下的只是每天的日常维护工作。
虚拟化和主机备份模式的崛起
之后,虚拟化风潮来临。几乎一夜间,大量的OS实例从物理计算机迁移到虚拟机。而且这种架构也为IT系统带来大量便利,如增加了可用性和提高效率。
当然,想获得便利也需要投入:设计一个虚拟架构下的备份体系要复杂得多。通过虚拟化的Windows系统,向数据中心内添加了多个新的IT系统层。每一层都是潜在的备份代理的位置(例如,在虚拟机内、在虚拟宿主机上、在存储层上、或者虚拟环境之外等等)。
在其中每一层中安置备份代理都有其各自的优缺点。例如,在宿主机层,虚拟备份工具可以轻松捕捉到所有虚拟机状态,但是需要独立的文件和文件夹用于恢复。在存储层的备份代理可以获得很好的性能,但是当不同层面之间不能很好同步的话,存在数据不一致的风险。
企业软件供应商迅速提供了基于每个层面的备份产品供客户选择,而这种设计也使得备份过程更有保障。在物理机时代,要实现Windows系统备份需要准确捕捉所有的OS系统文件,而这大量的文件中只要丢失一个,在系统崩溃后就无法成功恢复。
在现在虚拟化数据保护市场中,通常IT达人要面对复杂的选择,有如此多的供应商的不同产品提供差异化的备份方式,而要弄明白差别在哪儿非常地困难。对于虚拟化外行来说,核心的差别在于这些产品是如何把虚拟机数据捕获到备份介质中的。
基于主机的虚拟化备份是有问题吗?
最为流行的备份方式是把所有的虚拟机磁盘文件备份到同一个单一文件中,也就是所说的基于主机备份、镜像备份或者单一文件备份。这种方法可以确保备份数据的一致,只需把备份文件拷贝到新站点,然后启动虚拟机,恢复过程完成。
乍一看这种方式要优于其它模式。不过新的基于卷一级的过滤驱动,完全不同于传统的文件系统级的工具,开始逐步显示出其优势,对基于主机的备份模式造成威胁。
这些厂商依然支持传统备份模式——位于操作系统内进行。差别是数据捕捉的层面,不再基于文件和文件夹的改变量,而是跟踪单个数据块的改变。备份产品的代理不断地把细小的数据块的改变从每个虚拟机传送到备份介质。这种架构提供了很好的性能,而且在保持虚拟机和物理机备份系统的一致性方面也做的很好。
这种模式相比主机备份也简化了恢复过程。例如代理备份不需要恢复整个虚拟机之后才能访问内部的数据。而是可以自动的恢复所需的数据。
代理备份提供优势还包括应用的可识别性以及访问备份数据的能力,这对需要测试和进行数据验证的环境很有用。最后,新的代理备份工具可以恢复单个文件、文件夹或应用,从而不需要关注整个虚拟机磁盘文件。
虚拟化备份产品市场现状
在今天的虚拟化备份市场中,历史似乎在重演。早期的物理备份工具是基于记录文件和文件夹的,因此整体带来了额外的费用。而虚拟化市场和第二代数据备份产品的兴起改变了这一现状,通过备份整个虚拟机极大改善了数据恢复能力,不过同时也为内部数据的备份恢复带来额外的麻烦。
而基于主机的备份工具依然很流行的今天,时间会证明是否基于数据块的代理备份产品是数据中心最合理的数据保护和恢复方式。