网络安全知识:灾难恢复计划简介

每次灾难发生时,如果不立即采取适当的行动,可能会对您的组织造成严重损害。负责任的企业主明白灾难恢复规划是一个复杂的过程,应该以负责任的方式进行。

什么是灾难恢复计划?

灾难恢复 (DR) 计划包括一组明确的准则和详细说明,说明如何在灾难之前、期间和之后采取行动,以尽量减少灾难对组织的负面影响,并恢复关键任务运营。一般来说,基本的灾难恢复计划应包括以下组成部分:恢复目标、事件报告、行动响应和恢复程序。请注意,每个灾难恢复计划都是独一无二的,因为它考虑了自定义业务需求、恢复目标和特定组织的系统漏洞。

什么是灾难恢复清单?

除了灾难恢复计划之外,还需要有灾难恢复清单。灾难恢复清单包括在造成任何严重损害之前快速恢复业务运营应采取的步骤。灾难恢复清单可用于快速参考,以验证灾难恢复计划中是否包含所有重要组件。另一方面,灾难恢复清单在实际灾难期间也非常有帮助。您可以查阅该列表来仔细监控灾难恢复过程并验证计划是否得到充分实施。灾难恢复清单,其中概述了成功灾难恢复所需的关键步骤。

进行风险评估和业务影响分析

为了确定哪种灾难恢复机制在实际灾难期间最有效,首先需要确定组织最容易受到的威胁和危险。通过执行风险评估和业务影响分析,可以识别最可能的威胁和危险,评估其发生的概率,并计算灾难对您的业务可能产生的影响。因此,可以提出有效的预防和缓解措施,并决定灾难恢复计划应包括哪些内容。

确定恢复目标

灾难恢复计划清单的下一点是建立灾难恢复目标。
恢复时间目标 (RTO)和恢复点目标 (RPO),是灾难恢复规划中最关键的值。RTO 确定信息系统或业务功能从停顿到必须恢复的时间要求。另一方面,RPO 规定了及时测量的可容忍数据丢失量,即系统和数据必须恢复到的时间点要求。两者一个是时间长度,一个时间点。
需要确定哪些业务服务和操作对组织最重要,并设置适当的恢复目标。科学的RTO 和 RPO 有助于确定采用哪些灾难恢复策略以实现预期的灾难恢复结果。

在灾难恢复团队内分配角色和职责

如果希望灾难恢复计划发挥作用,应该找到在灾难恢复活动期间负责其实施的人员。为此,应该创建一个灾难恢复团队,为每个团队成员分配一个特定的角色和一组职责。应该清楚地说明并记录对他们的期望以及灾难发生时他们应该采取的行动。因此,将能够避免在实际灾难期间出现任何混乱,并确保实现灾难恢复计划清单上的每一项。

创建灾难恢复站点

灾难总是有可能严重损害生产中心,从而导致主站点无法恢复运营,并迫使我们将关键工作负载迁移到另一个位置。因此,灾难恢复计划清单建议构建一个灾难恢复站点,用于紧急迁移关键数据、应用程序、人员和物理资源。辅助站点应配备足够的硬件和软件来承担最关键的工作负载。

准备故障回复

故障恢复是在故障转移期间将主生产中心的操作转移到灾难恢复站点后恢复操作的过程。灾难恢复站点只能用于紧急目的,不能用于日常运营。它们通常是为了在很短的时间内使用而建造的(直到主站点恢复或建立新的生产中心)。因此,应该提前考虑如何执行故障回复操作而不会对您的业务运营造成任何严重干扰。

将重要文档存储在远程位置

每个灾难恢复计划清单中应包含的另一点涉及文档安全。任何给定的大型组织每天都必须处理大量数据。关键文件的意外丢失可能会导致业务运营中断,并损害公司的声誉。此外,一旦丢失重要文档,无论是数字文档还是硬拷贝,都很难恢复。因此,您应该确保所有重要文档都安全备份并存储在远程位置。
基础设施文档也是如此,它是灾难恢复流程中不可或缺的组成部分。无论 IT 团队多么优秀,如果没有有关原始系统及其组件的所需信息,他们都很难从头开始恢复整个IT基础设施。在灾难恢复活动期间,时间极其宝贵。此,需要意识到,花费太多时间来恢复业务运营和服务可能会对您的组织造成不可挽回的损害。

确定设备需求

对于灾难恢复计划清单的这一点,建议对所有办公设备(包括计算机、家具和其他配件)进行完整盘点。有了这些信息,将了解需要多少设备才能将整个基础设施恢复到原始状态,并确定有多少设备足以支持至少关键任务工作负载。

启用沟通渠道

灾难恢复计划清单的下一点是启用内部通信。为了成功开展灾难恢复活动,员工、管理团队和灾难恢复团队应该能够不间断地进行沟通。反过来,必须确定当主数据中心遭受灾难且网络基础设施出现故障时应使用哪些通信通道。

详细灾难响应程序

如果尽管采取了所有预防措施,灾难仍然影响您的生产中心,需要保持专注并快速响应特定的不幸事件,以尽量减少任何可能的损失。灾难恢复的最初几个小时至关重要;因此,需要清楚地了解灾难发生时该做什么以及从哪里开始。
为此,创建一份文档,详细说明灾难响应过程的每个步骤,包括如何执行灾难响应活动、谁负责执行和监控灾难恢复过程、如何故障转移到灾难响应站点、如何验证系统已已成功恢复等。此外,还应考虑各种灾难恢复场景,并针对不同类型的灾难准备响应指南。确保所有内容都以清晰、直接的语言编写,并且每项灾难恢复活动都有尽可能多的细节。

向利益相关者报告事件

一旦灾难发生,不仅需要通知负责执行灾难恢复活动的人员,还需要通知关键利益相关者,例如公关和营销团队成员、供应商、第三方供应商和客户。
另外,考虑如何最好地通知每个群体并制定解决他们的担忧的答案。建议提前撰写新闻稿,以便在实际灾难发生时不浪费时间并准备好发布

测试并更新灾难恢复计划

公司有随着时间的推移而发展和变化的趋势。因此,一年前创建的灾难恢复计划可能不符合当前的业务需求和恢复目标,并且会变得过时。这种忽视的结果是灾难恢复失败并对业务造成严重影响。

请注意,创建全面彻底的灾难恢复计划仍然不足以确保业务连续性和数据安全。需要查看灾难恢复计划的实施情况并验证其效率。为此,请定期审查和测试灾难恢复计划,以查看是否存在任何不一致之处,并确定应改进哪些方面以实现最佳灾难恢复结果。

决定正确的灾难恢复策略

灾难恢复计划清单还应包括有关发生灾难时要实施的灾难恢复策略的信息。恢复整个IT基础设施可能是一项具有挑战性的任务,尤其是对于大型企业而言。每个组织都是独一无二的。

因此,应该选择符合业务需求和期望的灾难恢复策略。

可以选择自行执行灾难恢复(一种廉价但容易出错的选项)或求助于第三方供应商(一种昂贵但可靠且有效的选项)。考虑组织的各个方面(例如员工数量、IT 基础设施规模、可用预算、风险因素等),以确定什么最适合自己团队。

猜你喜欢

转载自blog.csdn.net/qq_51301115/article/details/142477956