機(jī)器學(xué)習(xí)有著很高的處理需求,而其通信成本意味著人們最終需要它在邊緣的地方(智能手機(jī))發(fā)揮作用。
如今,人們正在進(jìn)入由人工智能(AI)驅(qū)動(dòng)的新一輪技術(shù)創(chuàng)新時(shí)代,機(jī)器學(xué)習(xí)處于技術(shù)最前沿。即使在今天,機(jī)器學(xué)習(xí)也是任何設(shè)備體驗(yàn)的重要技術(shù),為各種任務(wù)、功能、應(yīng)用程序提供支持。從設(shè)備上的安全性(如面部解鎖、面部識(shí)別和指紋識(shí)別),到智能手機(jī)攝像頭和音頻功能(允許用戶通過(guò)諸如Socratic、Snapchat、FaceApp、Shazam等應(yīng)用程序獲得更智能和有趣的體驗(yàn)),經(jīng)常使用各種基于機(jī)器學(xué)習(xí)的功能由消費(fèi)者提供。
但是,對(duì)于創(chuàng)建大量數(shù)據(jù)的基于機(jī)器學(xué)習(xí)的任務(wù),這些任務(wù)通常會(huì)轉(zhuǎn)移到云端進(jìn)行處理,然后再通過(guò)操作發(fā)送回設(shè)備。例如,國(guó)內(nèi)服務(wù)器,Socratic和Shazam都在云中使用機(jī)器學(xué)習(xí)處理,而不是在設(shè)備上。這就帶來(lái)了一個(gè)問(wèn)題:在設(shè)備上進(jìn)行機(jī)器學(xué)習(xí)處理會(huì)不會(huì)更簡(jiǎn)單、更快捷?
能夠在設(shè)備或邊緣上執(zhí)行基于機(jī)器學(xué)習(xí)的任務(wù),而不是將其發(fā)送到云端進(jìn)行處理,許多人將其描述為“機(jī)器學(xué)習(xí)演進(jìn)的下一個(gè)階段”。有許多重要的限制,功耗、成本、延遲、隱私等限制因素使得在云端和設(shè)備之間來(lái)回傳輸?shù)臋C(jī)器學(xué)習(xí)數(shù)據(jù)不切實(shí)際。幾年前,機(jī)器學(xué)習(xí)在邊緣領(lǐng)域似乎是一個(gè)“白日夢(mèng)”,而設(shè)備的技術(shù)創(chuàng)新使它們能夠處理計(jì)算密集型任務(wù)。
云計(jì)算的約束
云端的機(jī)器學(xué)習(xí)處理的所有約束都是相互關(guān)聯(lián)的。
首先,處理云端的機(jī)器學(xué)習(xí)任務(wù)所需的大量數(shù)據(jù)的功率和成本是巨大的,更不用說(shuō)通過(guò)不斷增長(zhǎng)的帶寬需求產(chǎn)生的大量流量。早在2017年,就有人指出,如果每個(gè)人每天使用他們的Android語(yǔ)音助手三分鐘,那么谷歌公司必須將其擁有的數(shù)據(jù)中心數(shù)量翻一番。
而在2019年,云主機(jī),谷歌公司可能解決了這一特殊挑戰(zhàn)——事實(shí)上,在最近的會(huì)議中,谷歌公司表示可以讓500GB語(yǔ)音輔助模式縮小到0.5GB,因此它可以在移動(dòng)設(shè)備上完全運(yùn)行。然而,它確實(shí)說(shuō)明了云端的機(jī)器學(xué)習(xí)可以處理巨大基礎(chǔ)設(shè)施和經(jīng)濟(jì)需求。邊緣的機(jī)器學(xué)習(xí)可以通過(guò)減少對(duì)基于云計(jì)算的機(jī)器學(xué)習(xí)所需的云計(jì)算服務(wù)和支持基礎(chǔ)設(shè)施的依賴來(lái)減輕這些負(fù)擔(dān)。
用于云端的機(jī)器學(xué)習(xí)處理的巨大經(jīng)濟(jì)成本可能最好通過(guò)開發(fā)人員的經(jīng)驗(yàn)來(lái)說(shuō)明。每臺(tái)設(shè)備在服務(wù)器上進(jìn)行一秒鐘的計(jì)算大約需要0.00003美元。這顯然是一個(gè)非常小的成本,但是當(dāng)考慮到開發(fā)商的目標(biāo)是盡可能多的受眾時(shí),其成本很快就會(huì)開始上升。例如,對(duì)于一百萬(wàn)臺(tái)設(shè)備,服務(wù)器上一秒鐘的計(jì)算成本是28美元,即每分鐘1680美元。對(duì)于以1億用戶為目標(biāo)的極其成功應(yīng)用程序,開發(fā)商將支付每分鐘160萬(wàn)美元的費(fèi)用!
最重要的是,將云計(jì)算用于基于機(jī)器學(xué)習(xí)的任務(wù)根本不可行。即使距離很近,也需要大量的電力才能將數(shù)據(jù)發(fā)送到云端。在設(shè)備上,基于機(jī)器學(xué)習(xí)的處理所需的功率量要小得多。
在設(shè)備和云端之間來(lái)回發(fā)送數(shù)據(jù)將會(huì)產(chǎn)生明顯的滯后或延遲,大多數(shù)基于機(jī)器學(xué)習(xí)的應(yīng)用程序,特別是那些對(duì)時(shí)間要求嚴(yán)格的應(yīng)用程序來(lái)說(shuō)都是不能容忍的。改善延遲開啟了基于機(jī)器學(xué)習(xí)的應(yīng)用程序可以完成的新功能。例如,如果由于發(fā)送、處理、接收增強(qiáng)視頻所花費(fèi)的時(shí)間而在云端完成機(jī)器學(xué)習(xí)處理,那么Snapchat AR體驗(yàn)是不可能的。
通過(guò)逐步查看流程,可以很好地說(shuō)明用于云端的機(jī)器學(xué)習(xí)處理的延遲問(wèn)題。在當(dāng)前的4G網(wǎng)絡(luò)上以一種方式(從設(shè)備到云端)啟動(dòng)數(shù)據(jù)流提供50ms的理論延遲,這大約是4個(gè)視頻幀的延遲。然后,為了處理云端的機(jī)器學(xué)習(xí)數(shù)據(jù),一個(gè)視頻幀可能延遲16ms。最后,從云端回流到設(shè)備是50ms的延遲。因此,整個(gè)過(guò)程大約有10個(gè)視頻幀的延遲,使得其延遲遠(yuǎn)遠(yuǎn)高于提供即時(shí)響應(yīng)設(shè)備上的機(jī)器學(xué)習(xí)。5G技術(shù)確實(shí)有可能將此設(shè)備更改為邊緣處理,因?yàn)槠洳渴鹬挥?ms的延遲,但5G技術(shù)的廣泛應(yīng)用仍需要一段時(shí)間。
最后,云計(jì)算與設(shè)備之間的持續(xù)交互創(chuàng)建了一個(gè)更容易受到隱私威脅的場(chǎng)景。用戶可以更容易地在他們的設(shè)備上處理他們的個(gè)人數(shù)據(jù),而不是將其發(fā)送到云端。如果為機(jī)器學(xué)習(xí)任務(wù)生成的數(shù)據(jù)經(jīng)過(guò)數(shù)百英里到達(dá)云端,然后返回到設(shè)備并做出決定,那么很有可能受到影響?;旧希乐构粲脩綦[私的最佳方法是確保敏感數(shù)據(jù)不會(huì)離開設(shè)備。
開發(fā)人員希望機(jī)器學(xué)習(xí)處于邊緣
開發(fā)人員的需求最適合邊緣的機(jī)器學(xué)習(xí)處理。機(jī)器學(xué)習(xí)正在改變開發(fā)人員編寫算法的方式。在以往,針對(duì)特定用例需要人工編寫代碼,這非常耗時(shí),并且使用機(jī)器學(xué)習(xí)有時(shí)容易出錯(cuò),開發(fā)人員不再需要編寫代碼。相反,他們創(chuàng)建了一個(gè)模型,并用數(shù)據(jù)集對(duì)其進(jìn)行訓(xùn)練,與人工編寫代碼相比,這種方法更加強(qiáng)大。