日前,全球知名的數據中心設施咨詢機構Uptime Institute發布的全球數據中心調查報告提供了數據中心業務的內部視圖。該調查于今年早些時候開展,收集了近900家數據中心運營商和與企業和服務提供商數據中心設施相關的IT從業者的反饋。
開展這個調查的Uptime Institute公司是一家總部位于西雅圖的組織,專注于數據中心各方面設施的運營,也是全球眾所周知的數據中心“Tier標準”及其相關認證的創建者。
2018年的調查結果表明與以往的報告相同,主要是一些積極的指標,但有一些領域面臨風險,可能需要改善。
Uptime Institute公司執行董事Lee Kirby表示,“如果我進行一下總結,我認為企業對可靠的數字基礎設施的需求日益增長,因為數字經濟如此依賴它,并且每天都變得越來越多,美國站群服務器 亞洲服務器,國內服務器租用 服務器托管,停電對企業造成了更大的影響,并付出了更多的代價。因此數據中心行業需要改進,可以采用全球通用標準設計、建造和運營數據中心來做到這一點。”
他指出,數據中心業務中斷或停電可能是最令人擔憂的風險。今年,31%的受訪者表示他們在過去一年中遇到了停機事件或嚴重的服務質量下降,高于去年調查中的25%。數據中心內部電源故障、網絡故障以及軟件或IT系統錯誤是最常見的主要原因,近80%的受訪者表示可能已經阻止了最近的中斷。大多數中斷的完全恢復時間為一到四個小時,超過三分之一的恢復時間為五小時或更長時間。
考慮到與停機相關的巨大費用,以及數據中心采取的主動方法來保持“9個9”的可靠性,這是一個令人驚訝的結果。Kirby表示,這樣的結果可能集中在數據中心日益復雜化,因為IT部門在邊緣增加了資源。
他說,“我認為隨著采用率的提高,以及物聯網的使用和所有設備的部署,企業對數字基礎設施的的投資將會加大,這將對經濟產生影響。因為通信行業發生變化也會影響整個市場。不同的企業會受到影響。”
在很多方面,數據中心的安全運營似乎是問題的關鍵所在。68%的受訪者采用了傳統方法,試圖保證從災難性故障中快速恢復,定期備份到輔助站點,51%的受訪者表示實時將數據復制到輔助數據中心(40%的受訪者表示已復制到兩個或更多數據中心)。其升級的方法也越來越受歡迎。42%的的受訪者表示他們將某種災難恢復作為一個服務計劃,36%的人利用基于云計算的高可用性服務。
隨著停機時間的增加,許多數據中心運營商都沒有更多關注氣候變化可能對其數據中心設施造成的影響。根據調查,45%的受訪者表示他們的組織此時并未適應氣候變化影響。
Kirby說,“這對我來說很驚訝,氣候變化對數據中心的運營產生的影響越來越大,我認為這意味著數據中心行業需要更加勤勉地規劃災難恢復。不僅要在基礎設施層面進行研究,還要進行全面的業務恢復計劃,并解決數據中心不能正常運行的情況。”
盡管存在這些負面影響,但大多數調查顯示數據中心運營商在許多關鍵領域都處于領先地位。例如,冷卻成本占數據中心總功率支出成本的比例繼續提高。根據調查結果,2018年數據中心的的平均能源使用效率(PUE)值始終處于1.58的歷史最低點(越低越好)。該調查報告指出,Uptime Institute在2007年進行的另一項調查中,能源使用效率(PUE)為2.5,到2013年已降至1.65。從那時起,PUE值的降幅逐漸增加。
Uptime Institute在報告中指出,“近年前,最重要的是基礎設施效率得到大幅提升。而進一步改進將需要大量投資和努力,其回報越來越低。組織將繼續提高效率,以降低運營成本或最大化可用功率(或二者兼而有之),包括人工智能驅動的數據中心管理即服務(DMaaS),軟件定義電源和其他方法。”
數據中心機架的功率密度也在上升。當被問及最高的現場服務器密度時,調查報告表明,一半的受訪者表示,其每個機架功率為10 kW到29 kW之間,而19%的受訪者表示其機架功率密度為30 kW或更高。
然而,最高的機架功率密度遠遠低于平均值。在去年的調查中,67%的受訪者表示平均每個機架功率低于6千瓦,只有9%的受訪者表示每機架為10千瓦或更高。報告中沒有包括當前平均機架功率密度的數據。
增加計算密度并提升速度就是采用冷卻設施。雖然只有30%的受訪者表示仍然依賴于傳統機房空調,56%的受訪者表示他們依賴精密空調進行冷卻,但只有14%的受訪者表示使用液體冷卻,這可以實現最高的服務器功率密度。大多數受訪者表示,他們使用精密空調解決方案冷卻IT設備。
報告指出,在必要時需要進行改變,因為針對人工智能(AI)工作負載優化的服務器硬件具有比標準x86服務器高得多的電源和冷卻要求。