在斯坦福大學(xué)前任校長、Alphbet公司董事長John L. Hennessy的大力支持下,英特爾開始全面轉(zhuǎn)向“域特定架構(gòu)”策略,并由此構(gòu)建起屬于自己的CPU、GPU、ASIC與FPGA等多個產(chǎn)品家族。從本質(zhì)上講,這項策略很可能正是異構(gòu)計算的重要縮影,但同時也給軟件開發(fā)人員帶來沉重的負擔(dān)。為了破解困局,英特爾開始著力開發(fā)其OneAPI軟件工具集。
目前,英特爾主要依靠至強產(chǎn)品線進行AI推理,領(lǐng)先Movidius實現(xiàn)嵌入式AI,并通過MobileEye支持汽車圖像處理。在數(shù)據(jù)中心方面,英特爾于2016年收購Nervana Labs,隨后于2019年12月收購了Habana Labs。上個季度,英特爾在AWS上一舉拿下模型訓(xùn)練設(shè)計大獎。AWS方面宣稱,與其他領(lǐng)先GPU平臺(很可能是指英偉達A100)相比,VPS租用,Habana Labs平臺在價格/性能方面保持著40%的優(yōu)勢。不過AWS也強調(diào),這一結(jié)果來自一攬子AI工作負載,可代表AWS上約八成AI運行負載的一般情況。
Gaudi芯片通過8 x 100Gb裸片搭載的標(biāo)準(zhǔn)以太網(wǎng)架構(gòu),借助“模型并發(fā)性”機制提高存儲容量處理能力。這套架構(gòu)能夠擴展至數(shù)千個節(jié)點,擁有廣闊的負載容納范圍。隨著DNN模型的規(guī)模擴張與復(fù)雜性增長(每3.5個月翻一番),國內(nèi)服務(wù)器,這種橫向擴展能力將變得愈發(fā)重要。Gaudi架構(gòu)能夠支持基于融合以太網(wǎng)的RDMA(ROCE)。ROCE的重要意義在于,能夠?qū)⑵湟胄酒?a href="http://www.qzkangyuan.com/cnidc/cio/jsgc/10475.html">英特爾能夠獲得8個超高速(100 Gb)互連端口且無需昂貴的網(wǎng)絡(luò)接口卡(NIC,價格可能遠高于1000美元)或者機架交換機(價格通常高于10000美元)。而且與需要消耗大量CPU周期的共享內(nèi)存管理軟件相比,RDMA能夠顯著簡化程序員在整體架構(gòu)中訪問共享內(nèi)在的挑戰(zhàn)并借此提高性能表現(xiàn)。
但在Habana之外,也有不少用戶更傾向于使用英特爾至強處理器執(zhí)行某些推理甚至是訓(xùn)練作業(yè)。Facebook就分享了其AI基礎(chǔ)設(shè)施設(shè)計心得,表示正在推薦、多層級感知器以及整體推理等作業(yè)中大量使用至強CPU。
目前無法斷言Facebook的態(tài)度到底有多堅定,畢竟社交巨頭對其他芯片也表現(xiàn)出了極大興趣,包括高通的A1100以及Facebook內(nèi)部自研的推理處理器Kings Canyon。Facebook目前每天處理超200萬億項預(yù)測與超過60億項語言翻譯操作,因此高效推理處理器將成為提升Facebook運營效率的關(guān)鍵所在。
Facebook AI每天需要處理數(shù)萬億次查詢。該公司在使用GPU的同時,也在廣泛使用CPU(很可能來自英特爾)。
作為英特爾的合作伙伴,Datatonic公司也分享了使用至強處理器提升AI推理性能并降低處理成本的心得。請注意,這部分數(shù)據(jù)的比較對象是上代英偉達GPU,而非最新的英偉達A100。但無論如何,Datatonic給出的結(jié)果仍然令人意外、甚至可以說是震驚。
英特爾客戶Datatonic最近分享了測試結(jié)果,英特爾至強處理器確實有能力成為速度更快、成本更低的AI實現(xiàn)途徑。
預(yù)計在AWS的強大設(shè)計之下,Habana Gaudi訓(xùn)練芯片將在2021年上半年迎來更多輝煌的戰(zhàn)果。Gaudi在大規(guī)模處理方面擁有獨特優(yōu)勢,我們也將其視為訓(xùn)練類工作負載的重要競爭選項。另外,Gaudi同樣擁有出色的可擴展性,這也成為英特爾陣營的核心優(yōu)勢。
借助ROCE帶來的100 Gb以太網(wǎng)端口,英特爾的Gaudi平臺能夠提供出色的可擴展性。
至于Habana Goya推理處理器,考慮到其短短兩年的發(fā)展歷程,我們對其設(shè)計水平還無法抱有太高的信心。事實上,英特爾方面甚至有可能暫時擱置Goya發(fā)展計劃,專注于推動至強處理器在數(shù)據(jù)中心領(lǐng)域的推理處理探索。這一方面是因為至強已經(jīng)在AI加速方面取得了不錯的成績,此外新任CEO Pat Gelsinger也需要盡可能減少低利潤產(chǎn)品帶來的成本壓力。當(dāng)然,目前關(guān)于Goya項目的消息還太少,尚未公開的大客戶部署以及可能公布的下一代芯片方案都有可能幫助Goya迅速成為人們的關(guān)注焦點。
優(yōu)勢:英特爾擁有全面的產(chǎn)品組合,只要能夠克服域特定架構(gòu)帶來的固有軟件開發(fā)挑戰(zhàn),奪取市場份額將只是時間問題。總之,英特爾研究院在AI方面擁有相當(dāng)強勁的潛在優(yōu)勢。
劣勢:英特爾必須解決生產(chǎn)問題。Habana Gaudi的上市速度太慢,給競爭對手下留下了跟進甚至超越英特爾的機會。另外,我們還沒有聽說有任何大型客戶使用Habana Goya處理推理類工作負載。