改进灾难恢复策略的九个建议

无论组织是否已经制定完善的灾难恢复计划,还是刚刚开始实施,需要了解将其灾难恢复策略提升到更高水平的方法 。
无论组织采取多少安全措施来保护其资源,最终不可避免地会发生一些故障、失败或其他灾难 。在实施灾难恢复措施时,最好是做好准备,而不是匆忙地决定和实施计划 。
由于现代企业都依赖于数据和IT基础设施,因此灾难恢复(DR)计划是业务运营的重要组成部分 。面临的灾难事件从网络攻击到硬件故障,再到小规模的停电,所有这些问题都会导致停机,从而使组织面临糟糕的客户和员工体验、声誉受损和盈利能力下降 。
采用可靠的灾难恢复计划,企业可以更快地恢复数据,并显著减少损失 。无论组织开始制定灾难恢复策略,还是已经制定了正在寻求改进的策略,以下九个建议都将能够改进灾难恢复计划,并帮助从组织遇到的任何灾难中快速恢复 。
1.拥有完整的文档
文件存档从来都不是一件有趣的事,但是记录组织的灾难恢复计划是全面、快速恢复的重要组成部分 。
其文档应包括恢复计划的目的和方法、每个策略的步骤、每个角色的职责以及计划每个阶段涉及的角色 。其语言应该清晰明了,以便任何人都能按照指示行事,高级管理人员应具有明确的指挥系统,以防发生灾难 。
如果组织没有制定策略文件,灾难恢复负责人不在现场或在灾难期间无法联系,则可能会造成极大的破坏,因此必须立即执行这一步 。
2.评估风险
业务中所有最佳实施的事情都始于风险评估,灾难恢复也不例外 。而良好的灾难恢复策略将考虑业务的所有功能领域,了解面临哪些潜在威胁以及依赖哪些IT资源 。
完整的IT清单和数据审核可以通过识别关键软件应用程序,以及运行它们所需的任何硬件基础设施来帮助完成此任务 。
风险评估还应考虑任何可能影响外部合作伙伴和服务供应商的问题,尤其是在云计算环境中,这将构成灾难恢复计划的基础 。
3.灾难演习
组织为其数据中心设施制定疏散策略并不能阻止火灾的发生,但是定期进行消防演习意味着,当警报响起时,每个人都知道该怎么办以及要去哪里避险,并且在理论上都要安全撤离 。
灾难恢复策略需要进行定期的测试,以确保每个流程和系统都能正常工作 。组织制定有效的灾难恢复计划是目标,但是让人放心的是,如果发生灾难,将会遵循该计划 。
4.为不同级别的灾害做好准备
灾难的类型和规模多种多样,如果组织不做好准备,有时一个小灾难就可能导致更长时间的停机 。
良好的灾难恢复策略将对不同级别的灾难做出不同程度的响应,以确保较小的问题能够让负责的团队立即处理 。
5.采用云计算
【改进灾难恢复策略的九个建议】并非所有基于云计算的灾难恢复系统都是以相同的方式工作 。其中一些提供基于云计算的备份和恢复,而其他一些则使用虚拟化来维护服务器和应用程序的副本,数据从生产系统复制到虚拟化的故障转移系统 。
云计算灾难恢复具有其优点和缺点,但与许多基于云计算的服务一样,它可以被广泛使用,而无需备份和恢复硬件的前期投资成本 。
6.优先考虑弹性
灾难恢复是IT服务组织希望永远不会被使用的服务之一 。这就是为什么将弹性作为IT基础设施中的指导原则很重要的原因 。
确保基础设施具有弹性,这需要良好实践以及对技术和服务的投资,这些技术和服务既支持业务,又可以最大程度地降低故障风险 。
在追求弹性时,最重要的原则是避免出现单点故障 。如果关键应用程序是在某台服务器运行的,并且只能在这台服务器运行,那么这就是一个潜在的弱点 。

推荐阅读