此外,TPU也不向企業或政府的數據中心出售。但谷歌對此表示滿意,因為它將TPU和TensorFlow視為其全面的AI領導力戰略。針對硬件的軟件優化,可以構建強大而耐用的平臺。
作者將會分三部分進行介紹,本文是第一部分。
雖然TPU會對谷歌的人工智能的發展產生影響,但除了內部的,對外的服務(這是一個相當大的市場)是故意限制的。TPU只能用于培訓和運行Google TensorFlow框架,無法使用它來訓練或運行使用Apache MxNet或PyTorch構建的AI,PyTorch框架的重要推動者是Facebook 和微軟。TPU也不能用于非AI HPC應用,這一領域GPU占據絕對主導地位。
谷歌是最早推出專用芯片(ASIC)的公司之一,然而谷歌可能是NVIDIA最大的客戶之一。谷歌的“Tensor Processing Units”(TPU)芯片已經更新至第三代,可以加速云端的深度學習訓練,最近還可以加速推理處理。據悉,用于訓練和處理DNN的Google TPU的性能相當穩定,單芯片每秒性能可達45 TOPS。相比之下,NVIDIA的Volta性能最高可達125 TOPS。第一批TPU只供內部使用,現在谷歌將它們作為服務提供給Google Compute Cloud的客戶。
CES 2019上,免備案主機,英特爾透露正在與Facebook密切合作準備推出Nervana神經網絡處理器(NNP-I),因為許多人猜測Facebook正在開發自己AI加速器。與此同時,英特爾副總裁兼AI產品總經理Naveen Rao在Twitter上分享,NNP-I是采用英特爾10nm的SoC,服務器租用 免備案服務器,并采用IceLake x86內核。
毫無疑問,NVIDIA以其強大的可擴展架構為動力打造出受歡迎的產品。NVIDIA現在擁有一個強大且持續更新的軟件,高校、初創公司和合作伙伴使其成為由其新創建的生態的主導者。有些人會認為這個生態系統是堅固的護城河,但暴風云正在出現。潛在的威脅來自英特爾,谷歌,AMD以及數十家美國和中國的初創公司。
NVIDIA的領先優勢
AMD
賽靈思
在最新報告季度,NVIDIA數據中心收入同比增長58%至7.92億美元,占公司總收入的近25%。過去的四個季度總營收達到28.6億美元。如果能夠保持這種增長趨勢,2019年數據中心營收或達到約45億美元。
目前為止,在我看來,大部分競爭者都“火力不足”。因為我非常有信心除了谷歌,其它挑戰者都沒有搶奪了NVIDIA的市場份額。讓我們來看看目前的競爭格局,2019年將會變得非常有趣。
過去三年,AMD一直在努力讓AI的軟件正常運轉。當我2015年在那里工作時,如果沒有啟動Windows,你甚至無法在Linux服務器上運行GPU。從那時起,AMD進行了很多工作,ROCm軟件和編譯器簡化了CUDA的遷移,并且在其芯片上加速數學庫MlOpen(不要與OpenML混淆)。然而,目前AMD的GPU仍然至少落后NVIDIA V100產品一代,而V100推出已經接近兩年了。