最近幾年,經常關注科技圈的朋友們總會發現,每次遇到廠商有重大發布,就總能看到“顛覆”、“極致”、“革命性”等概念出現在發布會上。
前幾天,iPhone12的發布現場,蒂姆庫克就用上了“新紀元”的字眼,準確地說應該是iPhone正式地步入了5G時代新紀元。但國內消費者對5G已經是見怪不怪了。蘋果自嗨的劃時代產品因為沒有達到市場的預期,當日股價就跌去3800億個小目標,后面就要靠銷量來證明蘋果自己有沒有跨入“新紀元”了。
相比較于關注度高的消費電子領域,本文要把重點放在大多數人不太熟悉的數據中心產業,及其更上游的數據中心計算芯片上面。因為我們看到隨著云計算的大規模普及和AI計算的指數級增長,數據中心被提到前所未有的重要位置。
最近在參加一個有關數字通信產業的論壇上,聽到一位中國信通院的專家的觀點是:數據中心,將成為和5G技術并肩,下一個數字技術的制高點。類似的觀點,我們也在英偉達線上2020年GPU技術大會,站群服務器,從黃仁勛那里聽到:數據中心已成為全新的計算單元。
黃仁勛之所以有這樣的底氣,就在于這次發布會上推出了一款全新處理器DPU,以及圍繞該處理器的軟件生態架構DOCA。據英偉達的介紹,DPU可以和CPU、GPU相結合,構成完全可編程的單一AI計算單元,實現前所未有的安全性和算力支持。
那么,DPU能否真正承擔起與CPU、GPU一樣的計算重要性,實現數據中心的一次巨大革新?其創新點到底在哪里?這些仍然是我們要去回顧和考察的問題。
英偉達DPU的過“芯”之處
從英偉達在GTC的介紹上來說,DPU(Data Processing Unit)處理器,其實是一種SoC芯片,其中集成了ARM處理器核、VLIW矢量計算引擎和智能網卡的功能,主要應用在分布式存儲、網絡計算和網絡安全領域。
DPU的主要作用就在于替代了數據中心原本用來處理分布式存儲和網絡通信的CPU處理器資源。在DPU之前,智能網卡(SmartNIC)正在網絡安全和網絡互連協議方面逐漸取代CPU。而現在DPU的出現,相當于是智能網卡的升級替代版本,一方面增強了智能網卡對網絡安全和網絡協議的處理能力,一方面又整合和加強了分布式存儲的處理能力,從而在這兩個領域更好地替代CPU,從而釋放CPU的算力給到其他更多應用。
英偉達在DPU上的技術突破,來自于去年收購以色列芯片制造公司Mellanox之后,在這家公司的硬件基礎上開發出BlueFeild系列的兩款DPU——英偉達BlueField-2 DPU與BlueField-2X DPU。
據介紹,BlueField-2 DPU具有英偉達Mellanox Connext-6 SmartNIC的所有特點,與8個64位的A72ARM處理器內核一起,實現可完全編程,并能提供每秒200千兆比特的數據傳輸速率,從而加速關鍵數據中心的安全、網絡和存儲任務。
最核心的一點是單個BlueField-2 DPU可以提供相當于消耗125個CPU內核所提供的數據中心服務,從而有效釋放CPU內核的算力資源。
而BlueField-2X DPU則擁有包括BlueField-2 DPU的所有關鍵特性,其特性能夠通過英偉達安培GPU的AI功能得以增強。而在英偉達的路線圖里,未來的Bluefield-4 將會引入CUDA 和 NVIDIA AI,極大加快網絡中計算機視覺應用處理的速度。
另外一個值得注意的是英偉達提出配合DPU處理器的軟件開發工具包——DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。英偉達的專家將DOCA類比為數據中心服務器領域的CUDA,其意圖在于幫助開發人員在DPU加速的數據中心基礎設施上構建相應的應用程序,從而豐富DPU的應用開發生態。
從以上介紹我們看出英偉達的兩個野心,一個是DPU試圖再一次復制“GPU替代顯示加速卡成為通用顯示芯片的路徑”,在一個是DOCA試圖再一次復制“CUDA在GPU通用化過程中所起到的開創生態之功”。
如果和不久前英偉達收購ARM的消息結合起來,我們看到英偉達的一個重要考量,就是以ARM架構的CPU為核心,從服務器的應用加速擴展到服務器的全部應用場景,國內服務器,從而實現在數據中心服務器領域的更大突破,目標自然是劍指英特爾CPU為代表的X86服務器生態。