最近,不同的數據中心發生了幾起不同的火災。這些火災包括位于洛杉磯的網絡托管服務提供商WebNX和位于法國斯特拉斯堡的OVHcloud數據中心。雖然數據中心和云提供商擁有經過深思熟慮的系統,但由于最近發生的事件,許多人現在質疑這些特定系統的可靠性。這些事件可能由許多不同的因素引起,需要解決和討論。我們可以從這些災難中學到什么?
使用數據中心服務有風險嗎?
數據中心是幾乎所有現代行業都在使用的運轉良好的機器,但就像其他任何事情一樣,事情可能會發生。這是我們從幫助人們、企業和行業共同成長的情況和事件中學習的方式。盡管這些事件的確切細節還沒有被報道;我們可以從中學習到幾個要點。
雖然數據中心運行時考慮到了最好的可用技術和最佳實踐,但數據中心火災并不總是完全可以避免的。長期以來,數據中心火災一直是一種風險,并且是使用任何類型的數據中心服務的一部分。Uptime Institute 表示,最近發生了 25 起數據火災,其中包括 11 起未公開報道的數據中心火災。這些最近發生的事件應該讓用戶意識到使用每種類型的數據中心服務的風險。包括您當前正在使用的那個。這甚至適用于 Google Drive、Amazon Web Services 和 iCloud。數據存儲系統總是伴隨著一些風險。了解這一點很重要,但要找到值得信賴的數據中心提供商 可以幫助您和您的企業度過任何這些災難。
哪些方面可能導致數據中心火災?
數據中心的許多方面都可能引發火災。這包括數字設備、電纜、活動地板、電線、HVAC 設備和吊頂等等。由于調查和中斷報告可能需要時間,因此 OVHcloud 災難的詳細信息要到明年才能披露。盡管如此,關于火災的起因有幾種理論。
據報道,當天早些時候,至少有一個備用電源或UPS(不間斷電源)已經完成了大量工作。這可能是維護問題或配置問題。火災發生后,一些人開始質疑使用基于對流冷卻的自動通風塔的設計。當冷空氣進入時,它通過直接液體冷卻系統的熱交換,然后熱空氣通過塔上升到建筑物的內部。有些人認為這可能會形成類似煙囪的情況。但導致火災的主要理論是 OVHcloud 沒有 VESDA 系統(非常早期的煙霧探測設備)或滅火系統。
自動滅火系統對數據中心至關重要
滅火系統的設計目的是在火災開始時立即檢測并立即將其撲滅。目標是防止火勢蔓延到其他地區。如果系統檢測到熱量和火焰,系統就會啟動并開始滅火過程。
有幾種不同類型的滅火系統,這些不同的系統可以完全不同。所有這些不同的系統都屬于兩大類。這包括工程滅火系統和預制滅火系統。
工程滅火系統的工作原理是用所謂的“清潔劑”淹沒房間,這種清潔劑由氣體組成,可以在不傷害設備的情況下抑制火災,更重要的是,對在數據中心工作的人員造成傷害。其中一些工程系統的清潔劑以液體形式儲存,但以氣體形式釋放,以免損壞設備。預制滅火系統不會像工程系統那樣用清潔劑淹沒整個房間。預制滅火系統可保護較小的區域,例如發動機艙、電氣面板,甚至 CNC 和 EDM 機器。
也有不同的火災探測方法,包括主動探測系統和非電子火災探測系統。主動檢測持續不斷地監控熱量和/或煙霧的位置。這種方法可以很好地感知火災并自動觸發滅火系統。這種方法的缺點是它需要電力。這意味著如果正在使用的電源出現故障,系統也會隨之出現故障。另一個過程稱為非電火災探測系統,顧名思義,它不需要電來運行。相反,安裝了火災探測管。一旦管子被加熱和/或著火,管子就會爆裂,釋放清潔劑以撲滅火災。
所有這些不同的火災探測方法和滅火系統類型都可能有利于所有數據中心的運營。所有這些不同的系統的最終目標都是盡快停止火災,因此它不會增長并影響其他區域。
結論
關于這些數據中心火災的主要收獲之一應該是整個行業如何處理這些情況。由于最近有兩個數據中心完全丟失,因此需要更多關于數據中心火災的討論。這些數據中心災難只有在報道火災時才會成為新聞。數據中心行業需要對這些實例以及每個數據中心和云提供商所面臨的風險更加透明。即使是最高級別(第 4 層),它需要包括最高級別的冗余電源、硬件、容錯組件和冷卻,作為允許的兩個單點故障之一仍然存在火災導致停機。唯一的另一個是緊急斷電。
火災風險一直存在。只有時間才能證明該行業是否采取了適當的措施來幫助傳播這種意識。我們所知道的是,數據中心需要定期和適當的維護以及優秀的數據中心管理團隊。此外,滅火系統對數據中心的運營至關重要。這包括 VESDA 系統和水或氣體滅火系統。這些事件可能可以避免,也可能無法避免,但數據中心滅火系統可能有助于拯救整個數據中心,使其免于面臨與最近兩次災難相同的命運。