機器學習為數據中心運營商帶來了更好的散熱,功耗和性能。
隨著企業開始采用經過大型數據中心運營商和托管服務提供商試用和測試過的機器學習技術,人工智能將在數據中心運營中扮演更重要的角色。
今天的混合計算環境通??缭搅藘炔?a href="http://www.qzkangyuan.com/cnidc/dc/ups/20160909/2023.html">數據中心、云和配置站點以及邊緣計算。企業發現傳統的數據中心管理方法并不是最優的。通過使用人工智能,機器學習,可以簡化復雜計算設施的管理。
目前,數據中心的AI主要圍繞機器學習來監控和自動化設施組件的管理,如電力和配電元件,冷卻基礎設施,機架系統和物理安全。
在數據中心設施內部,越來越多的傳感器正在從設備(包括備用電源,云服務器租用,配電設備,開關設備和冷卻器)收集數據。有關這些設備及其環境的數據將通過機器學習算法進行分析,例如,該算法可以詳細了解性能和容量,并確定適當的響應,更改設置或發送警報。隨著條件的變化,機器學習系統能從變化中不斷學習 - 它本質上是通過訓練進行自我調整,而不是依靠特定的編程指令來執行其任務。
目標是使數據中心運營商能夠提高設施的可靠性和效率,并更自主地運行它們。但是,獲取數據并不是一項簡單的任務。
基本要求是獲得來自主要組件的實時數據,施耐德電氣數據中心全球解決方案高級總監Steve Carlini說。包括冷水機組,冷卻塔,空氣處理機,風機等等設備。在IT設備方面,你需要收集諸如服務器利用率,溫度和功耗等指標。
“計量一個數據中心不是一件容易的事。”Carlini說, “如果你想嘗試做人工智能,你需要從數據中心獲取數據,并且確保在數據中心有很多連接點用于供電和散熱。”
IT專業人員習慣于設備監控和實時警報,但在房屋設施方面則沒有這個傳統。“人們希望即時得到IT設備的通知。但在你的電力系統上,這不是直接能夠得到的數據,”Carlini說。 “這是一個不同的世界。”
只有在過去的十年左右,第一批數據中心才完全裝備了儀器,并使用儀表來監控電力和制冷。只要存在計量的地方,標準化的實現往往都是困難的:數據中心運營商依賴于使用多種通信協議來構建管理系統——從Modbus和BACnet到LONworks和Niagara——它們必須滿足于那些無法共享數據或不能通過遠程控制操作的設備。“TCP/IP,以太網連接——這些連接以前在動力系統端和冷卻端是聞所未聞的,”Carlini說。
好消息是,數據中心的監控正在向高級分析和機器學習所需的深度發展。服務提供商和托管服務提供商一直非常擅長在機架級別進行監控,特別是監控能源使用情況。企業正在開始部署它,這取決于數據中心的規模,“Carlini說。
機器學習使數據中心時刻保持涼爽
由于電力系統故障導致的達美航空數據中心停運事件,使其在2016年的三天時間內停飛約2000次航班,造成損失1.5億美元。這正是基于機器學習的自動化技術可以避免的場景。 由于數據中心計量技術的進步以及云中數據池的出現,智能系統有可能以手動流程無法發現的方式發現數據中心運行中的漏洞并提高效率。
機器學習驅動智能的一個簡單示例是基于條件的維護策略,它應用于數據中心中的消耗品,例如,冷卻過濾器。Carlini說,通過監測通過多個過濾器的空氣流量,智能系統可以檢測出一些過濾器是否比其他過濾器堵塞更多,然后將空氣導向堵塞較少的單元,直到需要更換所有過濾器為止。
另一個例子是監控UPS系統中電池的溫度和放電。智能系統可識別在較熱環境中運行且可能比其他系統更頻繁運行的UPS系統,然后將其指定為備用UPS而不是主系統。 “它可以為你做一些思考。這原本是需要手動完成的,但現在機器也可以做到。這些是基本的案例,”Carlini說。
更高層次的功能是動態冷卻優化,這是當今數據中心中最常見的機器學習的例子之一,特別是在較大的數據中心操作人員和托管服務提供商之間。
通過動態冷卻優化,數據中心管理人員可以根據環境條件監控和控制設施的冷卻基礎設施。當設備移動或計算流量激增時,建筑物內的熱負荷也會發生變化。動態調整冷卻輸出以轉移熱負荷可幫助消除不必要的制冷量并降低運營成本。
451 Research數據中心技術和生態高效IT頻道的研究主管Rhonda Ascierto說,托管服務提供商是動態冷卻優化的主要采用者。“機器學習對數據中心來說并不陌生,”Ascierto說。 “在很長一段時間內人們都試圖根據容量和需求來改善散熱,機器學習可以讓你實時做到這一點。”
Vigilent是動態冷卻優化領域的領導者。其技術可以優化數據中心設施的氣流,自動發現并消除熱點。