在近幾年的國際超級計算機展會上,中國企業(yè)憑借豐碩的成果在國際舞臺上贏得了業(yè)界的關(guān)注和認可。中國的超級計算機也首次在最新的全球超級計算機500強排行榜上以202臺的總數(shù)反超了美國,并從2013年開始穩(wěn)居全球超算速度之首。除了在計算速度上取得的矚目成就,國內(nèi)企業(yè)在商用超級計算機環(huán)保節(jié)能方面也大放異彩。其中一款備受矚目的“地球數(shù)值模擬裝置”來自中科曙光:此裝置運用了我國首款成功商業(yè)化的冷板式液冷服務(wù)器TC4600E-LP,可以完全模擬地球土壤、海洋和大氣運動變化,同時大幅提升速度、降低能耗,是一臺協(xié)助人工智能更進一步的深度學習一體機。該項目在幫助人類社會進一步了解地球環(huán)境的同時也做到了服務(wù)器全年自然冷卻,可謂在綠色發(fā)展道路上邁出了意義非凡的一步。
引領(lǐng)液冷服務(wù)器商業(yè)化
計算能力的突飛猛進使人工智能在各個行業(yè)都具備無限的可能性。大量的計算芯片需要高密度部署,一個服務(wù)器機柜的發(fā)熱量也將增至數(shù)十千瓦。CPU作為服務(wù)器的主要驅(qū)動力對電源和散熱有著極高的要求——電源系統(tǒng)需要提供更大的功率,冷卻系統(tǒng)也要做到與之相匹配的散熱能力。這是傳統(tǒng)的風冷技術(shù)無法達到的。因此,能夠精確到CPU的液冷技術(shù)成了曙光節(jié)能技術(shù)(北京)股份有限公司(以下簡稱曙光節(jié)能)主要的研究方向,也是解決目前數(shù)據(jù)中心節(jié)能問題的必然趨勢。相較風冷,液冷能達到更低的PUE值、有效降低風扇噪音和大幅降低耗電量。
雖然液冷技術(shù)問世已有一段時間,但囿于技術(shù)成熟度和成本等因素,液冷高性能計算機始終未能得到大規(guī)模應(yīng)用。對于習慣運營風冷機房的用戶來說,從風冷到液冷的過度也是一個充滿挑戰(zhàn)的過程。除了服務(wù)器架構(gòu)搭建上的不同,機房的維護方法和程序也需要做出相應(yīng)的改變。
以此為出發(fā)點,曙光節(jié)能開始與曙光服務(wù)器事業(yè)部、上下游廠商合作,致力研發(fā)性價比和用戶接受度高的產(chǎn)品,使其滿足科技商業(yè)化的必要條件。這一研發(fā)項目的成果就是TC4600E-LP冷板式液冷服務(wù)器。它采用風冷和液冷混合散熱模式對服務(wù)器主要部件進行冷卻,將液冷散熱占比提高至90%以上,從而降低了風機功耗。TC4600E-LP采用了集成管理模塊設(shè)計,在整箱刀片式液冷服務(wù)器中的CPU芯片和內(nèi)存上安裝固定水冷板,冷媒通過進出口循環(huán)流動。TC4600E-LP投入市場2年來,先后為中科院大氣所“地球數(shù)值模擬裝置原型系統(tǒng)”和國家電網(wǎng)電力科學研究院仿真中心超級計算系統(tǒng)項目提供了超過2000節(jié)點的計算能力,國內(nèi)服務(wù)器租用 服務(wù)器托管,整柜密度超過25kW,空調(diào)系統(tǒng)功耗直接降低70%,PUE值始終控制在1.2左右。
冷板式服務(wù)器因其對計算機系統(tǒng)較小的改動要求成為液冷技術(shù)商業(yè)化最合適的選擇,只需將原風冷散熱片替換為液冷板,并將冷媒管路引出機箱即可。快速插拔管路連接也使運行維護更加接近用戶現(xiàn)有的使用習慣,安全便捷。
建設(shè)中國HPC生態(tài)圈
據(jù)曙光節(jié)能總經(jīng)理何繼盛介紹,曙光節(jié)能專注于自己的專業(yè)領(lǐng)域,其價值在于讓其它應(yīng)用液冷技術(shù)的產(chǎn)業(yè)能夠?qū)P你@研自身的工作,取得經(jīng)濟與資源上的最高效率。這不僅需要曙光節(jié)能本身技術(shù)實力雄厚,也需要一個生機盎然的產(chǎn)業(yè)生態(tài)圈來幫助國內(nèi)高科技企業(yè)實現(xiàn)更快的技術(shù)應(yīng)用和大項目部署。
近年來,曙光節(jié)能通過研發(fā)制造過程中與上下游合作伙伴的接觸與溝通,將創(chuàng)新鏈與產(chǎn)業(yè)鏈結(jié)合,深度利用特定的應(yīng)用進行各類產(chǎn)品的開發(fā)和優(yōu)化。由于國內(nèi)的HPC產(chǎn)業(yè)鏈尚未成熟,曙光節(jié)能十分看重上游廠商的研發(fā)定制能力,在不同的應(yīng)用中與供應(yīng)商進行深入的技術(shù)交流,借此希望更多的廠家能在液冷技術(shù)配套原材料和零部件研發(fā)方面投入更多的精力。
對此,曙光節(jié)能液冷系統(tǒng)研發(fā)總監(jiān)崔新濤強調(diào):“液冷系統(tǒng)各個部件都是非常關(guān)鍵的,哪個部件出現(xiàn)問題對服務(wù)器來說都是致命的影響。正因為有了這些關(guān)鍵供應(yīng)商的支持,才促成這個液冷系統(tǒng)的誕生。”
上游零部件廠商合作:小部件,大作用
在液冷系統(tǒng)的設(shè)計中,液冷管路連接是其中重要的一環(huán)。機房的空間結(jié)構(gòu)、管路的安全性和易維護性是選擇與設(shè)計管路接頭關(guān)鍵的考量。崔總監(jiān)解釋道:“管路接頭是水冷模塊中比較核心的部件,需要保證用戶在使用和維護過程中可以快速插拔,并且冷卻液不泄露。”