8 Linux管理员手册--备份

硬件不肯定是可靠的
软件肯定是不可靠的
人不肯定是不可靠的
而自然肯定是可靠的

本张说明为什么、如何、何时要做备份,及如何回存备份的东西 。

备份的重要

数据是有价值的 。重新产生它需要你花费时间和努力,并且要花费金钱或至少伤心和眼泪,有时甚至不可能重新产生,例如一些实验结果 。由于数据是一种投资,你必须保护它,并采取措施避免丢失 。

丢失数据一般有4个原因:硬件失败、软件曲线、人为因素或自然灾害 。虽然现代硬件已经相当可靠,但仍可能自然损坏 。存储数据最决定性的硬件是硬盘,它依赖微小的磁区在充满电噪声的世界上保存数据 。现代软件依然不可靠,一个真正可靠的程序是理想、罕见的,而不是规律 。人更不可靠,他们很容易犯错误,甚至为某种目的恶意地破坏数据 。自然可能不是邪恶的,但也可能造成破坏 。一切的一切,希望什么都正常、完美几乎是不可能的 。

备份是保护数据投资的方法 。有数据的多个拷贝,就不怕某个损坏(所需做的仅仅是从备份中恢复丢失的数据) 。

正确的备份是很重要的 。正如物理世界中任何东西都与其他相关,备份也迟早会失效 。好的备份确保有效,你不希望你的备份无效 。如果你的备份又坏了,这将雪上加霜,如果你只有一个备份,它可能根本是坏的,只留下你和硬盘中冒烟的灰烬 。或者当你恢复时,发现忘了备份一些重要的东西,比如15000个用户站点的用户数据库 。Best of all, all your backups might be working perfectly, but the last known tape drive reading the kind of tapes you used was the one that now has a bucketful of water in it.

When it comes to backups, paranoia is in the job description.

选择备份介质

备份所需的最重要的决定是选择备份介质 。需要考虑成本、可靠性、速度、可得到、可用性 。

成本是很重要的,因为你的数据可能需要多个存储、多个备份 。便宜的介质可以用很多 。

可靠性是最重要的,因为坏的备份会雪上加霜 。备份介质必须能存储数据多年而不损坏 。作为备份介质,使用方法影响可靠性 。硬盘一般是很可靠的,但作为备份介质并非很可靠,如果它和备份源在同一计算机里的话 。

速度通常不太重要,如果备份可以非交互地完成 。备份花2个小时无所谓,无须监督,多长时间都没有关系 。另一方面,if the backup can"t be done when the computer would otherwise be idle, 那么速度也是个问题 。

可得到是明显必要的,因为你无法使用不存在的备份介质 。不太明显的是要在将来还能得到这种介质,并且能在其他计算机上使用 。否则灾害之后,你可能无法恢复你的备份 。

可用性是决定备份周期的主要因素 。备份越容易使用越好 。备份介质不能难以使用 。

一般用软盘和磁带 。软盘很便宜,还算可靠,不太快,很容易得到,但数据量大时不容易使用 。磁带也很便宜,还算可靠,还算快,很容易得到,而且,依赖于磁带的容量,使用很轻松 。

还有其他选择 。但通常可得性不好,但如果这不成问题,有时也不错 。例如,磁光盘同时具有软盘(随机存取,可以快速地恢复单个文件)和磁带(大容量)的优点.
选择备份工具

备份有很多工具,传统的UNIX备份工具是tar 、 cpio 和dump。另外,还可以使用大量第三方软件包(包括freeware和商业版) 。备份介质的选择可能影响工具的选择 。

tar 和cpio 类似,从备份来看二者基本等效 。都能将文件存到磁带并取出文件 。都能使用几乎所有介质,因为核心设备驱动处理低级设备操作,对用户级程序看来所有设备都差不多 。有写Unix版本的tar 和cpio 对不是普通文件可能有问题(符号连接、设备文件、极长路径名的文件等等),但Linux的能正确处理所有文件 。

推荐阅读