最近欽奈的洪水清楚地提醒我們現代大城市的脆弱性。在一個以全球異常天氣事件為特征的世界中;該事件再次強調了大自然的怪異以及組織實施有效業務連續性計劃 (BCP) 的必要性,以確保在發生災難時將中斷和損失降至最低。
BCP 是指組織實施的一組計劃措施,以確保在發生自然災害和人為災害時繼續業務運營。它包括仔細檢查組織面臨的各種威脅和風險,并準備一個可操作的藍圖,以便在發生災難時將業務中斷降至最低。BCP 計劃包括企業的 IT 和非 IT 相關方面,包括數據保護和恢復、技術基礎設施、員工安全、設施管理、危機溝通等。在這篇博客中,我們將只關注 IT 災難恢復,這是當今數字時代業務連續性規劃的一個重要子集。
根據維基百科,災難恢復 (DR)是一套政策和程序,用于在發生自然或人為災難后恢復或繼續重要技術基礎設施和系統。自然災害包括洪水、火災、地震、颶風,而人為災害則指黑客和病毒攻擊、安全漏洞、技術和電力故障等。
組織需要根據技術基礎架構對其業務的重要性來制定災難恢復計劃。例如 – 幾個小時的停機時間可能會給電子商務企業造成嚴重的業務損失。同樣,像零售銀行這樣的金融機構無法承受長時間的技術中斷。想象一下客戶在幾個小時或幾天內無法訪問銀行的 ATM 網絡。這不僅會導致業務損失,還會導致成千上萬的消費者不滿,并嚴重損害其品牌聲譽。
考慮到企業對技術基礎設施的依賴性越來越大,災難恢復計劃人員需要與組織內的各種職能部門(運營、人力資源、財務、采購、銷售)合作,以定義恢復點目標 (RPO) 和恢復時間目標 (RTO )為他們的各種業務功能。一旦指定了這些,災難恢復規劃人員就應該將其映射到底層 IT 基礎設施以支持這些流程的運作。雖然大多數業務職能部門都希望在發生災難時實現零數據丟失和快速恢復,但維持這種系統敏捷性水平可能需要極高的成本,因此只有一小部分組織選擇這樣做。考慮到這些因素,災難恢復規劃人員為確保數據保護和快速恢復而采用的最常見措施是:
- 在磁帶上備份并定期發送到異地
- 備份到現場磁盤并自動復制到異地磁盤,或直接備份到異地磁盤
- 使用存儲區域網絡 (SAN) 技術將數據復制到異地
- 保持數據和系統異地復制的高可用性系統,支持對系統和數據的持續訪問
確保全面的災難恢復計劃的另一個重要步驟是選擇發生災難時的備份站點類型。再一次,這個決定必須基于業務對技術的依賴。如果組織能夠在不影響其業務的情況下管理幾天的停機時間,則可以考慮冷 DR 站點。如果技術很重要但預算有限,則應考慮使用暖站點。如果技術對電子商務公司或銀行等企業的運作極為關鍵,那么唯一的選擇就是熱 DR 站點,該站點成本高昂但可確保幾乎零停機時間。
傳統上,災難恢復規劃和恢復一直是內部 IT 團隊的支柱。然而,在過去幾年中,越來越多的組織開始將災難恢復外包給專門從事此類服務的第三方數據中心公司。簽訂災難恢復即服務 (DRaaS)合同的好處包括啟動成本極低或無啟動成本、共享人員和技術資源成本、現場安全管理和全天候技術援助。對于非技術企業,DRaaS 提供了專注于核心業務活動的自由,而他們業務的這一關鍵要素由專門的外部合作伙伴管理。
對 DRaaS 不斷增長的需求促使多家科技公司將其作為當前數字時代的關鍵服務之一提供。計劃外包其 DR 服務的組織需要在最終確定之前對這些參與者的能力進行徹底的偵察,以確保他們的 IT 基礎設施處于安全狀態。