熄燈數據中心其實是一種無人值守的數據中心,也是一種完全實現自動化的數據中心設施,可以更顯著地節約能源和管理成本。
“熄燈”這個術語可以追溯到Philip K Dick在1955年發表的一篇短篇小說。例如在制造行業中,荷蘭飛利浦公司的一家工廠在少數質檢人員的監督下生產剃須刀;而日本Fanuc公司生產工業機器人的工廠可以長期關閉空調和供暖系統,以使機器人的生產不受干擾。
當最初構建的熄燈數據中心運營時,其計算機系統仍然需要定期維護和保養。現場工作人員不得不經常進入機房重置服務器或重新連接交換機。
但這種情況正在改變,如今的IT組件變得越來越可靠。而軟件定義網絡(SDN)意味著通過軟件重新設置服務器或連接網絡。采用虛擬化技術使工作負載獨立于物理服務器,而采用自動化技術意味著可以遠程完成重置和調整。
多年來,傳統數據中心一直通過運營人員管理和維護數百臺甚至數千臺服務器。除非更換硬件或修復故障,通常不會進入機房。數據中心的機械和電氣設備采用自動化技術,而空調制冷系統也可以在無人值守的情況下運行,并且提示工程師或制造商進行預防性維護。
傳統數據中心“浪費”了更多的空間和能源,這是因為需要為運營人員提供工作環境和條件,并設置了滿足安全和生理等需求的安全出入口和洗手間等設施。
熄燈數據中心首次在2011年亮相,美國互聯網服務提供商AOL公司當時宣布將采用一種激進的模式,推出名為ATC的小型無人值守的數據中心。AOL公司技術副總裁Mike Manos曾是在微軟公司的數據中心專家,他在一篇博客文章對熄燈數據中心的理念表示贊賞,認為這種技術可以從根本上改變一切。
對熄燈數據中心的宣傳和炒作
但是十年過去了,AOL公司早已不復存在,而數據中心仍然需要運營人員的運營和維護。但熄燈數據中心的的想法一直存在,通常可以采用預先安裝服務器的方式將機架安裝在這樣的數據中心中。
數據中心設計師指出,如果無需工作人員運營和維護的話,數據中心的機架和服務器等IT設備將部署得更緊湊,在更高的溫度下運行,并且大幅削減冷卻費用。而抽取空氣中的氧氣可以防止火災,減少腐蝕。
但是事實表明,大型數據中心設施仍然需要配備運營人員。
Uptime Institute是數據中心可靠性方面的全球權威機構,該機構一直建議數據中心運營人員需要隨時準備處理出現的任何問題。該機構的技術專家Richard F.Van Loo在2015年發布的一份簡報中說:“對于需要在Tier III級或Tier IV數據中心設施運營關鍵業務的組織來說,我們建議至少有一到兩家數據中心運營商的工作人員全天候在現場工作,而配備適當數量的數據中心人員是可靠運營的關鍵。”
熄燈數據中心的發展在此后發生了一些變化,尤其是規模較小的數據中心提供商,例如EdgeConneX公司。
EdgeConneX公司席信息官Lance Devin表示:“我們的業務是建立在熄燈數據中心的基礎上,我們通常部署電力容量為2MW的數據中心,而不是100MW的大型數據中心。因為我們公司無法承擔在數據中心雇傭更多的工程師、安全人員以及維護人員的成本。”
EdgeConneX公司運行了分段管理系統,該系統可讓客戶控制IT硬件,而EdgeConneX公司則負責管理電源和冷卻基礎設施。
但這樣的數據中心并非完全熄燈,EdgeConneX公司具有遠程控制安全性,因此可以通過蜂鳴器通知客戶或運營商的運營人員。
疫情鎖定和熄燈運營
擁有和運營規模更大的數據中心設施的運營商并不需要這樣做。但是他們需要具有遠程管理數據中心的能力,由于2020年發生了冠狀病毒疫情,這些能力得到了驗證。
當很多組織的員工在家遠程工作時,數據中心運營商采用的遠程控制服務激增。數據中心運營商QTS Data Centers公司首席技術官Brent Bensten表示,在由于疫情而導致封鎖的前三周內,該公司遠程管理門戶(服務交付平臺或SDP)的登錄量增長了30%,而用戶在該系統上花費的時間增加了一倍。
雖然允許工作人員進入數據中心,但是需要相互遠離,并且發現數據中心仍然可以在更少的人為干預下運行,因此我發現了遠程管理的更多價值。Bensten說:“冠狀疫情加快了遠程管理平臺和工具的應用,因此可以遠程完成以前在現場完成的工作。”
熄燈運營是為了解決技能短缺問題?
在許多情況下,“熄燈”是降低數據中心技能要求的一種方式,既可以作為一種削減成本的措施,也可以作為解決難以尋求熟練員工問題的一種方式。