作為亞馬遜公司旗下云計(jì)算服務(wù)平臺(tái),AWS也已經(jīng)推出上線14年,我們很難用一句話說清AWS能夠在云計(jì)算領(lǐng)域持續(xù)增長和創(chuàng)新的秘訣。近來,機(jī)器學(xué)習(xí)成為AWS內(nèi)部一項(xiàng)極其重要的業(yè)務(wù),我們或許能夠從中總結(jié)出AWS在云計(jì)算上一些打法。
在AWS披露的一項(xiàng)數(shù)據(jù)中,自 2016年推出3項(xiàng)機(jī)器學(xué)習(xí)服務(wù)以來的5年間,AWS已經(jīng)累計(jì)推出776+的機(jī)器學(xué)習(xí)服務(wù)和功能。按照2019年的數(shù)據(jù),新推出248項(xiàng)機(jī)器學(xué)習(xí)服務(wù)和功能后,機(jī)器學(xué)習(xí)在當(dāng)年新推出服務(wù)和功能的總量(2345項(xiàng))中的比例超過10%。
在機(jī)器學(xué)習(xí)上提供的服務(wù)越來越深入
當(dāng)中國云服務(wù)商紛紛進(jìn)軍產(chǎn)業(yè)界,并逐步確定差異化發(fā)展方向的時(shí)候,遠(yuǎn)在美國的全球云計(jì)算巨頭AWS卻在瘋狂為它的機(jī)器學(xué)習(xí)服務(wù)背書。
在不久前的“亞馬遜re:Invent 2020大會(huì)”上,AWS CEO Andy Jassy 在主題演講中調(diào)侃道:“2019年,我用75分鐘來講機(jī)器學(xué)習(xí),但2020年我想換種方式。”而接下來,無論是他自己的闡述還是客戶證言,在他長達(dá)3小時(shí)的演講中,“機(jī)器學(xué)習(xí)”被提及的次數(shù)超過75次。
云計(jì)算的發(fā)展,為機(jī)器學(xué)習(xí)提供了蓬勃發(fā)展的土壤。亞馬遜副總裁兼CTO Werner Vogels 博士在“2021將改變世界的八大技術(shù)趨勢(shì)”的預(yù)測(cè)中提到,機(jī)器學(xué)習(xí)在2020年已經(jīng)成為主流,未來三年內(nèi)世界產(chǎn)生的數(shù)據(jù)比過去30年還要多,而與機(jī)器學(xué)習(xí)模型相結(jié)合,使用數(shù)據(jù)攝取和聚合工具,成為各行各業(yè)處理信息的唯一實(shí)際方法。
認(rèn)準(zhǔn)了機(jī)器學(xué)習(xí)的方向之后,AWS已經(jīng)對(duì)機(jī)器學(xué)習(xí)的未來做出了趨勢(shì)性判斷,在機(jī)器學(xué)習(xí)上所提供的服務(wù)越來越深入。
從2016年-2020年的五年間,AWS在機(jī)器學(xué)習(xí)上推出的服務(wù)數(shù)量增長最快的是2017-2018年,這期間,機(jī)器學(xué)習(xí)服務(wù)從2017年的60項(xiàng),增加155項(xiàng)至215項(xiàng),此后AWS的機(jī)器學(xué)習(xí)服務(wù)每年以“200+”的增量發(fā)展。
截止目前,AWS的機(jī)器學(xué)習(xí)服務(wù)已經(jīng)形成了“上-中-下”三個(gè)層次的服務(wù)框架:
AWS機(jī)器學(xué)習(xí)服務(wù)框架圖
第一層,AI 服務(wù),這類服務(wù)包含了視覺、音頻-文字互轉(zhuǎn)、聊天機(jī)器人等即拿即用的服務(wù);
第二層,Amazon SageMaker服務(wù),這類服務(wù)可以幫助使用者自動(dòng)標(biāo)記數(shù)據(jù),并提供了SageMaker studio集成開發(fā)環(huán)境,是一個(gè)全托管的機(jī)器學(xué)習(xí)平臺(tái);
第三層,機(jī)器學(xué)習(xí)框架和基礎(chǔ)設(shè)施,這類服務(wù)包含了可供使用者選擇的多種機(jī)器學(xué)習(xí)框架,以及包含算力芯片、服務(wù)器等的基礎(chǔ)設(shè)施。
“我們的機(jī)器學(xué)習(xí)解決方案,能夠快速進(jìn)行數(shù)據(jù)的模擬,挖掘數(shù)據(jù)價(jià)值。改變數(shù)據(jù)管理體系,可以把計(jì)算和分析融入所有的業(yè)務(wù)當(dāng)中。”Andy Jassy 在演講中說。
這正是AWS的高明之處,它將機(jī)器學(xué)習(xí)抽象為了一項(xiàng)通用服務(wù),是數(shù)據(jù)湖、數(shù)據(jù)倉庫、數(shù)據(jù)智能這些當(dāng)下熱門服務(wù)的必備工具。不強(qiáng)調(diào)行業(yè)屬性、不強(qiáng)調(diào)使用場(chǎng)景,只強(qiáng)調(diào)“機(jī)器學(xué)習(xí)”作為一項(xiàng)服務(wù)對(duì)IT和業(yè)務(wù)效率的提升。至于用到哪兒、用到什么行業(yè)什么場(chǎng)景,客戶說了算。
同時(shí),機(jī)器學(xué)習(xí)也可以是更加普惠和易用的。在Andy Jassy的觀念中,機(jī)器學(xué)習(xí)不應(yīng)該是只被機(jī)器學(xué)習(xí)方面的專業(yè)人士來訓(xùn)練、調(diào)優(yōu)、建構(gòu)和部署,而應(yīng)該是“Expand machine learning to more builders(讓機(jī)器學(xué)習(xí)為更多構(gòu)建者服務(wù))”,這些“builders”包含了不是很懂機(jī)器學(xué)習(xí)的數(shù)據(jù)分析師、IT業(yè)務(wù)人員等。
事實(shí)也證明,AWS推出的機(jī)器學(xué)習(xí)服務(wù)中的SageMaker也已經(jīng)成為AWS歷史上增長最快的服務(wù)。目前,全球已經(jīng)有超過10萬的客戶在使用AWS的機(jī)器學(xué)習(xí)和人工智能服務(wù)。
不同客戶需求,促成AWS不斷創(chuàng)新
不要嘗試從AWS的口中獲得更詳細(xì)的關(guān)于產(chǎn)品創(chuàng)新的方案,在鈦媒體APP對(duì)AWS不同人員的多次采訪中,“如何保持創(chuàng)新”這個(gè)問題的答案永遠(yuǎn)是“以客戶為中心”。實(shí)際上,不同客戶所產(chǎn)生的對(duì)機(jī)器學(xué)習(xí)的需求,也確實(shí)促成了AWS在機(jī)器學(xué)習(xí)領(lǐng)域的不斷創(chuàng)新。
AWS大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡舉了一個(gè)SageMaker的例子:“客戶說你們?nèi)ツ臧l(fā)布的這些東西都挺好的,但是確實(shí)是在機(jī)器學(xué)習(xí)當(dāng)中有一塊硬骨頭還是沒啃,就是怎么快速地把原始數(shù)據(jù)轉(zhuǎn)化成模型所需要的核心特征,把這個(gè)步驟加快。”
在這樣的一些需求下,AWS推出了機(jī)器學(xué)習(xí)服務(wù)AWS Data Wrangler,該工具是機(jī)器學(xué)習(xí)的特征工廠。這里的“特征(function)”是機(jī)器學(xué)習(xí)中的術(shù)語,機(jī)器學(xué)習(xí)建模需要進(jìn)行函數(shù)運(yùn)算,數(shù)據(jù)“特征”輸入函數(shù)后,就可以輸出“標(biāo)簽(label)”。機(jī)器學(xué)習(xí)工具會(huì)根據(jù)標(biāo)簽來識(shí)別數(shù)據(jù)是貓、是狗還是其他。在原來的機(jī)器學(xué)習(xí)工具中,客戶需要自己將不同的數(shù)據(jù)源打通,抓取數(shù)據(jù)然后格式化,把數(shù)據(jù)特征跑出才能進(jìn)入后續(xù)流程。