冬季是不是數(shù)據(jù)中心運營商最喜歡的季節(jié)?
畢竟,在低溫和寒風(fēng)的幫助下,大量北方DC可采用自然冷卻,南方DC的能耗也大大降低。此時的數(shù)據(jù)中心PUE低、電費少,成本低,讓數(shù)據(jù)中心運營商們期盼如果全年如此就好了。
AI能效優(yōu)化——數(shù)據(jù)中心從“制冷”到“智冷”
如何實現(xiàn)數(shù)據(jù)中心全年都保持較低的PUE呢?
首先將遷往南北極這一“有效”方法排除——成本不合算,數(shù)據(jù)中心參數(shù)調(diào)優(yōu)是最常使用的手段。當(dāng)前的數(shù)據(jù)中心性能優(yōu)化大多依靠運維專家對(主要是冷凍站的)三五個參數(shù)進行調(diào)節(jié)和試驗,需要反復(fù)試驗,優(yōu)化效果全憑經(jīng)驗。有沒有更穩(wěn)妥、快捷、準(zhǔn)確的調(diào)優(yōu)方法呢?如果之前被問到這個問題,筆者多半會搖頭表示,數(shù)據(jù)中心降耗沒有捷徑可走。
然而近期一個聯(lián)合創(chuàng)新的AI節(jié)能數(shù)據(jù)中心——中國移動寧夏數(shù)據(jù)中心(中衛(wèi))的投產(chǎn)卻扭轉(zhuǎn)了業(yè)內(nèi)的固有看法。該數(shù)據(jù)中心采用華為的iCooling@AI能效優(yōu)化技術(shù)(簡稱“iCooling@AI”)后,在當(dāng)前冬季自然冷卻環(huán)境下現(xiàn)場測試總能耗降低3.2%,未來預(yù)計可達到5%-8%,每年節(jié)電600萬度。與傳統(tǒng)人工調(diào)優(yōu)相比,iCooling@AI顯示出極簡運維、極致節(jié)能、極致可靠三大特性,幫助數(shù)據(jù)中心從傳統(tǒng)“制冷”走向“智冷”,全年都如在冬天般省心省力地降PUE、省電費。
中國移動寧夏數(shù)據(jù)中心(中衛(wèi))
華為一貫秉承“自己造的降落傘自己先跳”理念,從不會拿沒有實踐過的理論和產(chǎn)品推向市場,作為業(yè)界首個商用的AI能效優(yōu)化解決方案的iCooling@AI也是如此。該技術(shù)此前就已率先在華為廊坊基地云數(shù)據(jù)中心、華為東莞云數(shù)據(jù)中心進行了應(yīng)用檢驗,單是華為廊坊基地云數(shù)據(jù)中心一年節(jié)省下來的電費近千萬人民幣,如此能效優(yōu)化水平著實讓業(yè)內(nèi)矚目。
說了這么多,數(shù)據(jù)中心到底是如何利用iCooling@AI能效優(yōu)化技術(shù)降低PUE的?過程可以總結(jié)為四步:
首先,數(shù)據(jù)采集。iCooling@AI對數(shù)據(jù)中心運維過程中的眾多參數(shù)進行長時間采集,此技術(shù)在華為廊坊云基地的應(yīng)用中,共采集700多種參數(shù),每5分鐘一次,共實時收集了該數(shù)據(jù)中心連續(xù)9個月的運行數(shù)據(jù),這一數(shù)據(jù)采集量是人工調(diào)優(yōu)無法比擬的。
第二,自動治理。iCooling@AI對收集到的海量數(shù)據(jù)進行脫敏、歸一、降噪、去重等治理,采用自動化的數(shù)據(jù)目錄服務(wù),利用數(shù)據(jù)工具從清洗后的數(shù)據(jù)中找到?jīng)Q定PUE的關(guān)鍵參數(shù)。華為廊坊云基地找到的關(guān)鍵參數(shù)有19+2個,遠超傳統(tǒng)人工調(diào)優(yōu)的3到5個。
第三,模型訓(xùn)練。iCooling@AI利用DNN(深度神經(jīng)網(wǎng)絡(luò))訓(xùn)練出PUE模型,經(jīng)過訓(xùn)練的PUE模型預(yù)測準(zhǔn)確率>99.5%,誤差<0.005。
第四,推理決策。將生成的數(shù)據(jù)中心PUE預(yù)測模型發(fā)布到推理平臺中,根據(jù)實時的氣象條件、IT負(fù)載等參數(shù)開始推理。iCooling@AI能在1分鐘內(nèi)從140萬種組合中尋找出最優(yōu)參數(shù)組合,下發(fā)執(zhí)行并反饋效果。
iCooling@AI能效優(yōu)化技術(shù)
簡單總結(jié)就是,iCooling@AI基于AI在給定的數(shù)據(jù)中心氣候條件、業(yè)務(wù)SLA(Service-Level Agreement)等條件下自動推理出最優(yōu)PUE下的系統(tǒng)參數(shù)并執(zhí)行,實現(xiàn)數(shù)據(jù)中心能效最優(yōu)。與傳統(tǒng)人工調(diào)優(yōu)對比,iCooling@AI能效優(yōu)化技術(shù)可以戲稱為“AI戰(zhàn)勝老師傅”的數(shù)據(jù)中心調(diào)優(yōu)法,因其能發(fā)現(xiàn)更多PUE決定參數(shù),總能根據(jù)當(dāng)前給定條件自動推理,給出的最優(yōu)參數(shù)組合有據(jù)可依。
用AI降PUE——華為緣何能為業(yè)內(nèi)先?
2018年中國數(shù)據(jù)中心總用電量為1,608.89億千瓦時,超過上海市2018年全社會用電量(1,567億千瓦時),占中國全社會用電量的2.35%(未含港澳臺數(shù)據(jù))。數(shù)據(jù)中心產(chǎn)業(yè)如此巨大的能耗量早已被重點關(guān)注。2019年2月,工信部等三部門出臺《關(guān)于加強綠色數(shù)據(jù)中心建設(shè)的指導(dǎo)意見》,其中要求到2022年,“數(shù)據(jù)中心平均能耗基本達到國際先進水平,新建大型、超大型數(shù)據(jù)中心的PUE(電能使用效率)達到1.4以下”。而自2017年開始,北京、上海、深圳等數(shù)據(jù)中心密集城市也紛紛出臺能耗限制政策控,其中北京市政府規(guī)定全市層面禁止新建PUE1.4以上的數(shù)據(jù)中心,上海市對新建數(shù)據(jù)中心限制“PUE值嚴(yán)格控制不超過1.3”。
隨著從國家到城市各級主管部門類似政策的不斷推出,降低能源損耗、實現(xiàn)數(shù)據(jù)中心綠色發(fā)展已經(jīng)成為數(shù)據(jù)中心從業(yè)方與政府的一致要求。