對大家而言,人工智能不再只是一個未來概念,它正迅速、成功地部署在無數行業中,以優化業務的不同方面。而伴隨著AI技術的不斷普及,越來越多地企業將他們的網絡和計算需求轉移到云端,以及從智能手機到機器人的聯網智能設備激增,整個計算行業對數據中心資源的需求呈指數級增長,國內服務器租用 服務器托管,這對于作為存儲人工智能所需數據的數據中心是個不小的挑戰,特別是已經在高容量工作的數據中心設備。這迫使數據中心不得不添加更多的服務器和硬件,這些服務器和硬件的管理變得越來越復雜,能源消耗成為了數據中心最急待解決的問題。
就在前不久,亦莊某地區數據中心的柴油發電機起火,北京也有幾家數據中心因使用柴油發電機發電導致起火。其主要原因是數據中心忽略了政府“限電令”的頒布,數據中心原本以為使用柴油發電機發電已經足夠給予服務器的用電,導致起火事故的相繼發生,數據中心無法運營更多的服務器和硬件,只能用過柴油發電機發電,不僅僅增大了能源消耗,還將數據中心危險指數升級。
面對AI技術的加入對數據中心有了更高的設施要求,許多公司已經開始致力于消減數據中心的碳足跡的電力解決方案中。前不久,微軟進行了一個大膽而又瘋狂的實驗,利用潛艇技術,并與海洋能開拓者合作,建立了一個水下數據中心,目前正在試運行階段。一旦運行成功,就可以輕松實現在很短的距離內將數據傳輸到沿海城市,讓人們享受到快速流暢的上網、視頻直播、游戲以及其他基于人工智能技術的體驗的同時,減少對碳能源的消耗,解決了數據中心用電困難局面,并減少了數據中心的安全風險指數,可謂是一舉數得。
人工智能來襲,實現能源實時監控
很多數據中心嘗試使用人工智能,那么數據的獲取就顯得極為重要,但這個獲得數據的過程卻并不簡單。在過去的十多年時間里,數據中心IT專業人員習慣于設備監控和實時警報,但由于數據中心連接著用于供電和散熱的不同設備,數據的計量的標準化變得讓人難以捉摸。
機器學習計算的基準要求是來自數據中心主要組件的實時數據,其中包括了冷水機組,冷卻塔,空氣處理機,風機等,也包括了服務器利用率,溫度和功耗等指標。機器學習對這些設備及其環境數據產生的數據進行實時分析,詳細了解其性能和容量,并確定適當的響應。隨著數據中心條件的不斷變化,機器學習系統開始從變化中分析,亞洲服務器租用 歐洲服務器,不依靠特定的編程指令來執行其任務,具有極強的靈活性。
目前,數據中心設施內部越來越多的傳感器正在從設備收集數據,其中包括備用電源(UPS),配電設備,開關設備和冷卻器等。與此同時,越來越多的企業也開始采用高級分析和機器學習來深度監控數據中心能源使用情況。
自動化避免故障發生
機器學習對于數據中心而言并不陌生,很長一段時間,當我們還在試圖根據容量和需求改善機器正確尺寸的散熱時,機器學習就能夠快速幫我們做到這一點,它能夠通過使用現有數據和實時監控為數據中心避免事故的發生,減少不必要的損失,最大限度地提高生產力,讓數據中心時刻保持冷靜。
機器學習的自動化能有效避免因系統故障而導致的事故的發生,這主要基于數據中心計量技術的進步以及云中數據池的出現,智能系統在提高效率的同時,還能發現手動流程無法發現的數據中心運行中的漏洞。例如2016年,達美航空數據中心因電力系統故障停運三天時間事件,約2000次航班,造成航空公司損失1.5億美元。
而在大型數據中心運營商和主機托管提供商中,動態散熱優化是數據中心機器學習最常見的,通過動態冷卻優化,數據中心管理人員可以根據環境條件監控和控制設施的冷卻基礎設施。當設備移動或計算流量激增時,建筑物內的熱負荷也會發生變化。動態調整冷卻輸出以轉移熱負荷可幫助消除不必要的制冷量并降低運營成本。目前,數據中心運營商正在努力將動態制冷優化的成功擴展到其他領域。