出于滿意游戲玩家需求的圖形處理懲罰單位(GPU)技能在企業數據中心中擁有了一個天然優勢。451 Research的闡明師Jason Stamper暗示,他們的并行架構使它們很是適合一些可以受益于GPU加快計較的傳統事情負載。
“由于GPU具有數千個內核,并為在大屏幕上處理懲罰圖形的分秒舉動而設計,假如將其指向行和列數據,那么在舉辦闡明處理懲罰方面的速度就會很是快,”Stamper說。
當CPU時速每兩年翻一番時,對GPU加快計較本領的速度險些沒什么要求。但跟著時速的提高,華沙機房主機 荷蘭主機,具有高計較需求的用戶開始摸索用GPU作為替代,他說。GPU的時速比CPU慢,但他們可以同時處理懲罰數千個線程。早期回收者包羅科學計較和現實世界建模應用措施,它們必需同時處理懲罰多個變量的影響。
數據中心GPU計較部分主管Roy Kim說,“你本日看到的天氣預報,就是在超等計較機的后端計較處理懲罰數以千計的并行因素來計較的模子”。
固然超等計較機架構師和科學研究者是第一個利用GPU舉辦通用處理懲罰的,可是企業收集和闡明的數據量高出了每年CPU的改造。
CPU的SQL續訂
作為哈佛大學的一名研究生,Todd Mostak為他的論文收集了數億條推文,通過Twitter的鏡頭來查抄。Mostak的方針是闡明推文和建設地理空間可視化,但他利用通例的基于CPU的系統碰著了貧苦。
“我發明這些進程中的一些任務需要一夜的時間,”Mostak說,“但當我早上醒來,我意識到我做錯了,不得不開始舉辦闡明。”
沮喪之處在于無法會見可以或許處理懲罰負載的大型處事器集群,因此Mostak建設了本身的數據庫系統,由現成的游戲GPU提供支持。
Mostak此刻是MapD Technologies的首席執行官,MapD Technologies是一家數據庫軟件平臺公司,基于其研究生階段的原型構建了一個兼容SQL的數據庫軟件平臺。Mostak說,對比于游戲,GPU很是適合加快處理懲罰SQL查詢這類相對平凡的任務。
“SQL是一種薈萃語言,你對薈萃中的每一行都應用溝通的操縱,”他說,“這個薈萃大概是幾十億行,GPU根基上可以并行化,你可以將每一行數據分派給一個焦點。”
雖然,GPU并不是所有事情負載的救星。應用措施必需重構或專門編寫后才氣在GPU上運行。一些歷程顯然是并行的,并從GPU中獲益最大。其他歷程是高度持續的,且在CPU上運行得最好。
“那么你會在之間的某個處所碰著更為遍及的問題,”Mostak說,“他們的并行化并不是微不敷道的,不外假如你以正確的方法構建代碼,仍然可以從GPU中得到龐大的長處。”
MapD和其他方利用的這種要領稱為GPU加快計較。它的目標是將CPU和GPU之間的事情分隔。縱然大大都應用措施的代碼需要舉辦順序處理懲罰,有時也大概會將該代碼的某些計較麋集型歷程卸載到GPU上。
跟著企業收集的數據量的增加,從數據中得到代價的業務需求也在增加。這就是為什么GPU加快的數據庫開始升溫,451的Stamper說,“在這個規模我們看到了很是強勁的增長”。
譬喻,Nike利用支持GPU的處事器和MapD的數據庫軟件來闡明汗青銷售數據并預測特定地域的需求。另一個MapD客戶Verizon利用GPU驅動的系統,闡明來自跟蹤手機處事器的日志。
MapD在這個新興市場上并不是孤軍奮戰。SQream Technologies也為GPU加快闡明提供了一種要領。
“這不只是關乎海量的數據,也關乎全新的貿易需求,”SQream首席執行官Ami Gal說,“Uber是一家粉碎出租車行業的數據公司,而Airbnb是一家粉碎租賃系統的數據公司。”
很多主要的云提供商此刻提供GPU加快計較的實例,這可以低落公司實驗闡明或可視化項目標本錢。然而,一些因素大概會減緩GPU供電闡明的增長,Stamper說。由于系統像企業數據庫平臺一樣復雜、巨大和昂貴,因此需要革新。大大都提供GPU加快數據庫系統的公司都是沒有傳統數據庫巨頭那樣響亮的名號、銷售氣力或支持基本架構的小型初創公司。
“盡量企業會因沒有到達其想要的速度而頗感沮喪中的沮喪,但好的一面是IT部分不需要花太多的錢在新技能上,也不消增加巨大性,”Stamper說。
縱然如此,對付那些但愿快速闡明大型數據集的公司,原始機能增益也不行忽視。GPU加快的數據庫系統可以或許替代整個處事器群集的一些事情負載,他說。
更智慧的要領
單個GPU比基于CPU的處事器集群能更快地處理懲罰同時線程,這一本領使GPU成為另一種范例新興事情負載的抱負選擇。
“在已往幾年里,我們看到了人工智能和呆板進修的大爆炸,這恰是抱負的并行工量,”Nvidia的Kim說。
人工智能有幾種要領,可是由于用于通用計較的GPU的呈現,獲得快速成長的是深度進修。