最近欽奈的洪水清楚地提醒我們現(xiàn)代大城市的脆弱性。在一個(gè)以全球異常天氣事件為特征的世界中;該事件再次強(qiáng)調(diào)了大自然的怪異以及組織實(shí)施有效業(yè)務(wù)連續(xù)性計(jì)劃 (BCP) 的必要性,以確保在發(fā)生災(zāi)難時(shí)將中斷和損失降至最低。
BCP 是指組織實(shí)施的一組計(jì)劃措施,以確保在發(fā)生自然災(zāi)害和人為災(zāi)害時(shí)繼續(xù)業(yè)務(wù)運(yùn)營。它包括仔細(xì)檢查組織面臨的各種威脅和風(fēng)險(xiǎn),并準(zhǔn)備一個(gè)可操作的藍(lán)圖,以便在發(fā)生災(zāi)難時(shí)將業(yè)務(wù)中斷降至最低。BCP 計(jì)劃包括企業(yè)的 IT 和非 IT 相關(guān)方面,包括數(shù)據(jù)保護(hù)和恢復(fù)、技術(shù)基礎(chǔ)設(shè)施、員工安全、設(shè)施管理、危機(jī)溝通等。在這篇博客中,我們將只關(guān)注 IT 災(zāi)難恢復(fù),這是當(dāng)今數(shù)字時(shí)代業(yè)務(wù)連續(xù)性規(guī)劃的一個(gè)重要子集。
根據(jù)維基百科,災(zāi)難恢復(fù) (DR)是一套政策和程序,用于在發(fā)生自然或人為災(zāi)難后恢復(fù)或繼續(xù)重要技術(shù)基礎(chǔ)設(shè)施和系統(tǒng)。自然災(zāi)害包括洪水、火災(zāi)、地震、颶風(fēng),而人為災(zāi)害則指黑客和病毒攻擊、安全漏洞、技術(shù)和電力故障等。
組織需要根據(jù)技術(shù)基礎(chǔ)架構(gòu)對(duì)其業(yè)務(wù)的重要性來制定災(zāi)難恢復(fù)計(jì)劃。例如 – 幾個(gè)小時(shí)的停機(jī)時(shí)間可能會(huì)給電子商務(wù)企業(yè)造成嚴(yán)重的業(yè)務(wù)損失。同樣,像零售銀行這樣的金融機(jī)構(gòu)無法承受長時(shí)間的技術(shù)中斷。想象一下客戶在幾個(gè)小時(shí)或幾天內(nèi)無法訪問銀行的 ATM 網(wǎng)絡(luò)。這不僅會(huì)導(dǎo)致業(yè)務(wù)損失,還會(huì)導(dǎo)致成千上萬的消費(fèi)者不滿,并嚴(yán)重?fù)p害其品牌聲譽(yù)。
考慮到企業(yè)對(duì)技術(shù)基礎(chǔ)設(shè)施的依賴性越來越大,災(zāi)難恢復(fù)計(jì)劃人員需要與組織內(nèi)的各種職能部門(運(yùn)營、人力資源、財(cái)務(wù)、采購、銷售)合作,以定義恢復(fù)點(diǎn)目標(biāo) (RPO) 和恢復(fù)時(shí)間目標(biāo) (RTO )為他們的各種業(yè)務(wù)功能。一旦指定了這些,災(zāi)難恢復(fù)規(guī)劃人員就應(yīng)該將其映射到底層 IT 基礎(chǔ)設(shè)施以支持這些流程的運(yùn)作。雖然大多數(shù)業(yè)務(wù)職能部門都希望在發(fā)生災(zāi)難時(shí)實(shí)現(xiàn)零數(shù)據(jù)丟失和快速恢復(fù),但維持這種系統(tǒng)敏捷性水平可能需要極高的成本,因此只有一小部分組織選擇這樣做??紤]到這些因素,災(zāi)難恢復(fù)規(guī)劃人員為確保數(shù)據(jù)保護(hù)和快速恢復(fù)而采用的最常見措施是:
- 在磁帶上備份并定期發(fā)送到異地
- 備份到現(xiàn)場(chǎng)磁盤并自動(dòng)復(fù)制到異地磁盤,或直接備份到異地磁盤
- 使用存儲(chǔ)區(qū)域網(wǎng)絡(luò) (SAN) 技術(shù)將數(shù)據(jù)復(fù)制到異地
- 保持?jǐn)?shù)據(jù)和系統(tǒng)異地復(fù)制的高可用性系統(tǒng),支持對(duì)系統(tǒng)和數(shù)據(jù)的持續(xù)訪問
確保全面的災(zāi)難恢復(fù)計(jì)劃的另一個(gè)重要步驟是選擇發(fā)生災(zāi)難時(shí)的備份站點(diǎn)類型。再一次,這個(gè)決定必須基于業(yè)務(wù)對(duì)技術(shù)的依賴。如果組織能夠在不影響其業(yè)務(wù)的情況下管理幾天的停機(jī)時(shí)間,則可以考慮冷 DR 站點(diǎn)。如果技術(shù)很重要但預(yù)算有限,則應(yīng)考慮使用暖站點(diǎn)。如果技術(shù)對(duì)電子商務(wù)公司或銀行等企業(yè)的運(yùn)作極為關(guān)鍵,那么唯一的選擇就是熱 DR 站點(diǎn),該站點(diǎn)成本高昂但可確保幾乎零停機(jī)時(shí)間。
傳統(tǒng)上,災(zāi)難恢復(fù)規(guī)劃和恢復(fù)一直是內(nèi)部 IT 團(tuán)隊(duì)的支柱。然而,在過去幾年中,越來越多的組織開始將災(zāi)難恢復(fù)外包給專門從事此類服務(wù)的第三方數(shù)據(jù)中心公司。簽訂災(zāi)難恢復(fù)即服務(wù) (DRaaS)合同的好處包括啟動(dòng)成本極低或無啟動(dòng)成本、共享人員和技術(shù)資源成本、現(xiàn)場(chǎng)安全管理和全天候技術(shù)援助。對(duì)于非技術(shù)企業(yè),DRaaS 提供了專注于核心業(yè)務(wù)活動(dòng)的自由,而他們業(yè)務(wù)的這一關(guān)鍵要素由專門的外部合作伙伴管理。
對(duì) DRaaS 不斷增長的需求促使多家科技公司將其作為當(dāng)前數(shù)字時(shí)代的關(guān)鍵服務(wù)之一提供。計(jì)劃外包其 DR 服務(wù)的組織需要在最終確定之前對(duì)這些參與者的能力進(jìn)行徹底的偵察,以確保他們的 IT 基礎(chǔ)設(shè)施處于安全狀態(tài)。