谷歌好像找到另一種辦理這個問題的要領。所回收的方案不是像CPU和GPU這樣的通用芯片,也不是FPGA等可編程芯片,而是專用芯片,如專用加快器。
摩爾定律的放緩大概會發生重要影響,尤其是對英特爾來說。其在手機規模已經失手,PC銷量在不絕下滑,可是迄今為止,這些大部門已經從處事器規模得到拯救,因為在該規模它還處于把持職位。
后者已擔當到了來自英偉達的GPU的進攻,這些GPU執行了一些任務,尤其是并行處理懲罰了與人工智能相關的大數據任務。
英偉達在數據中心行業的成長可圈可點,去年的增長率高達126%.
英特爾正在舉辦還擊。如今數據中心的芯片優先回收新的處理懲罰器平臺(節點),而且它已經收購了Altera,可以提供FPGA技能以加快云計較。賽靈思是這條蹊徑的另一個玩家。
FPGA是摩爾定律放緩沖擊通用CPU的一個手段,因為它是“現場可編程”,也就是可以在出產后按照用戶需求從頭設置。
英特爾FPGA可以或許用于加快大型數據系統的機能。英特爾FPGA通過提供定制化高帶寬、低延遲毗連到網絡和存儲系統,實現高速數據處理懲罰。別的,英特爾FPGA提供壓縮、數據過濾和算法加快。通過帶有OpenCL的英特爾FPGA SDK,你可覺得計較和存儲系統快速研發加快方案。帶有OpenCL的英特爾FPGA SDK可以或許讓軟件開拓者很容易通過FPGA舉辦設計,它答允工程師操作高級語言舉辦快速開拓。
谷歌好像找到另一種辦理這個問題的要領。所回收的方案不是像CPU和GPU這樣的通用芯片,也不是FPGA等可編程芯片,而是專用芯片,如專用加快器。
Google正在做這件事,先容(見文件)Tensor處理懲罰單位(TPU):
“谷歌的TPU在呆板進修測試中高出英特爾的Xeon和英偉達的GPU一個數量級。TPU和基準測試表白,它的速度比貿易芯片快了15倍,機能晉升30倍。”
令人印象深刻的是,所利用的基準并不是最前沿的(本文認為,2015年的測試,英特爾已經提供了14納米CPU,而Nvidia擁有新的16納米GPU),因為測試是在2015年舉辦的,可是再一次,TPU自己也不是出格尖端的(在頻率和處理懲罰器節點方面):
“40-W TPU是運行在700 MHz的28 nm芯片,旨在加快Google的TensorFlow算法。 其主要邏輯單位包括65,536個8位乘法累加單位和24 MB緩存,提供每秒92個tera操縱。”
把產物遷移到更小的節點上會提高機能,尚有其它能力:
“假如我們較量更新的芯片,顯示,我們可以通過利用K80的GDDR5內存將28nm、0.7GHZ、40W的TPU機能晉升三倍。(本錢增加10W)”
假如不這樣的話,跟著TPU的成熟,它的機能大概會高出競爭敵手擴大自身優勢:
“該TPU的數量級機能優勢很少,這大概導致它會成為某些特定規模架構的原型。我估量許多會構建擔任者,它們的程度會提高許多。谷歌暗示,關于短至15個月的設計周期表阻止了TPU中的很多節能成果。
TPU已經應用于谷歌的數據中心,可是公司沒有提供任何干于遍及應用的信息,也沒有說進級方法以及是否會將TPU賣給第三方。“
這對英特爾有明明的告誡,對英偉達屬于小幅度的:
TPU項目從2013年跟著從FPGA嘗試開始。“當我們看到FPGA的機能無法和GPU對比的時候,我們丟棄了它,而且運行速度加速TPU功耗會比GPU更低。”陳訴指出。
總結:
不久前,英特爾還著迷于快速增長的處事器市場的把持職位。可是跟著摩爾定律的放緩,尤其是不管是存儲、簡樸應用照舊巨大AI開始向云端轉移,英特爾的GPU無法有效地做這些事情,而且尋找有效的辦理方案。
早期的替代者是英偉達的GPU可能Altera和賽靈思的FPGA.它們對英特爾沒有造成威脅,因為處事器仍然在跑CPU,險些全部來自英特爾,可是縱然這樣,一些來自AMD、IBM和ARM基本設計的新興競爭呈現了。
可是GPU和FPGA的處理懲罰本領越來越強,英特爾來自數據中心的增長收益開始變少。如今在巨大加快器好像呈現了一種新的模塊,如谷歌的TPU.這會造成多大的威脅?
對付初學者,你必需認識到就像GPU和FPGA一樣,TPU無法在處事器中代替CPU.它通過有效地執行一些任務就可以提供附加的處理懲罰本領。可能,有人會死或它大概會威脅到GPU和FPGA,可是好像他們按照用戶的需求有各自的優勢。可是,像GPU和GPGA,TPU會從英特爾占主導職位的CPU轉移處理懲罰本領。
因此,對英特爾來說,最好的方案是它的利用仍然范圍于谷歌云自身。今朝還沒有跡象表白谷歌是否打算將TPU給第三方。它大概應用TPU去增強自身的云應用的機能優勢,directadmin安裝 directadmin漢化,可能限制其對第三方供給商的依賴。可是高級芯片業務受益于龐大的經濟局限,所以我們認為谷歌不太大概將其作為專有辦理方案。