2020年11月13日,以“Connect·Collaborate·Accelerate”為主題,由浪潮和OCP基金會聯合舉辦的第二屆OCP China Day 暨OCP Tech Week全球技術峰會中國專場在北京望京凱悅酒店隆重開幕。百度攜整機柜、OAI等多種解決方案亮相大會,與微軟、浪潮、Facebook、阿里、騰訊等OCP社區領袖企業和數百位參會嘉賓一道,共同探討開放計算在人工智能、邊緣計算等新興技術領域及未來數據中心基礎設施層面的發展與應用。
OCP(OpenCompute Project)是由Facebook聯合英特爾、Rackspace等公司于2011年發起成立的非營利組織,作為全球影響力最大的開放計算社區, OCP旨在解決未來數據中心技術的標準化、產業化問題。目前在機架式和整機柜式高密度服務器、下一代數據中心管理架構等領域的開源項目已經實現了數百萬的部署規模,人工智能、開源交換機操作系統等新領域的標準正在開放測試,是業內最有影響的開放技術項目。
整機柜,超大規模數據中心規模化應用
作為OCP 中國社區的重要成員,百度服務器資深系統工程師趙杰向與會者介紹了百度天蝎3.0整機柜以及中國開源整機柜技術與應用。
天蝎計劃最早由百度在2011年推出并商用,經過近十年的積累沉淀和兩次大版本的迭代升級,目前百度天蝎整機柜部署規模超2萬柜,生態產值超200億元。
天蝎3.0采用了全新的架構設計,在散熱、供電、結構三個方面進行了技術革新。散熱方面,同時布局多種散熱技術,風冷可支持最大350W的CPU,同時風扇能耗降低了35%。供電方面,支持最高48V供電,單機柜最高功率密度可達36kW。結構上,兼容21inch/19inch設計,以及風冷液冷兩種散熱方式,模塊化的快插設計,使成本降低了30%。
而這樣的技術創新則離不開百度與浪潮的深度合作,在此基礎上,不僅實現了整機柜的L11級高效交付,也刷新了多項紀錄,2019年,百度與浪潮8小時完成1萬臺服務器部署,交付效率較機架式服務器提升20倍,為支撐2019年春晚紅包項目發揮了關鍵作用。
OAI推動AI、5G開放創新
2019年,OCP社區成員百度、Facebook、微軟、浪潮等共同發起OAI(Open Accelerator Infrastructure)項目,計劃建立一套支持不同AI芯片的技術標準,涵蓋結構設計、溫度、管理、供電、硬件安全性、可用性等諸多方面。OCP大會現場,百度、浪潮、燧原科技等企業基于OAM標準的產品紛紛亮相。
百度系統架構師黎世勇表示,OAI標準不僅將極大提高不同AI硬件加速模塊和系統的互操作性,更將加速新AI硬件加速模塊的大規模落地應用,全球AI硬件生態系統都會從中受益。同時,為了更好地為上層各種各樣的AI負載提供高效靈活的硬件算力,百度不僅積極參與構建了AI芯片昆侖、AI服務器X-MAN系列產品、AI通信加速組件Halo以及AI訓練平臺Kongming,并可搭配高效的分布式存儲系統。
他還表示,百度X-MAN系列產品多項技術行業領先,如X-MAN1.0首次實現AI計算硬件解耦架構、X-MAN2.0首次將冷板式液冷散熱技術應用到AI計算產品里、X-MAN3.0首次倡導模塊化標準化設計,香港免備案主機,X-MAN4.0是首款實現支持OAI標準及液冷散熱的AI計算產品。
最后,百度云邊緣計算計算部總經理陳剛,帶來了他對開放計算的看法。他表示,邊緣計算依然處于初期階段,而在此基礎上產生的業務需求又非常的多樣化,導致了對基礎設施的需求也十分的多樣化,并由此帶來了一些技術方面的挑戰。對此,他認為應該設立一個統一的標準,來規范整個基礎設施,尤其是從物理形態上。這樣對開放計算的標準化能起到一定的作用。
接下來他提到了關于對邊緣計算的管控問題和平臺調度問題,他認為邊緣計算設備尚在發展初期,需要開放計算來給出指導,標準化相應的硬件規格,香港免備案主機,從而推進商業化進程并提高部署效率。
正是因為百度這樣的優秀合作伙伴在軟硬件技術上的革新與支持,才使得開放計算的生態不斷豐富和完善,這樣才能加快推動整個行業的發展和向傳統行業落地。這也讓更多合作伙伴和客戶看到了開放計算的優秀成果和未來潛在的發展,為吸引更多廠商加入這一生態做出了貢獻。
2020年初,一場突如其來的新冠肺炎疫情席卷全球,時至今日仍在影響著世界各國的經濟發展和日常工作生活,迫使各行各業加速數字化轉型的步伐。利用AI、5G、邊緣計算等前沿技術為新型基礎設施賦能,構建更靈活,更開放、更智能的開放數據中心,獲得彈性、可擴展和成本效益等優勢,是OCP長期以來的目標,也是本次大會“連接、協作、加速”主題的意義所在。