作為亞馬遜公司旗下云計算服務平臺,AWS也已經推出上線14年,我們很難用一句話說清AWS能夠在云計算領域持續增長和創新的秘訣。近來,機器學習成為AWS內部一項極其重要的業務,我們或許能夠從中總結出AWS在云計算上一些打法。
在AWS披露的一項數據中,自 2016年推出3項機器學習服務以來的5年間,AWS已經累計推出776+的機器學習服務和功能。按照2019年的數據,新推出248項機器學習服務和功能后,機器學習在當年新推出服務和功能的總量(2345項)中的比例超過10%。
在機器學習上提供的服務越來越深入
當中國云服務商紛紛進軍產業界,并逐步確定差異化發展方向的時候,遠在美國的全球云計算巨頭AWS卻在瘋狂為它的機器學習服務背書。
在不久前的“亞馬遜re:Invent 2020大會”上,AWS CEO Andy Jassy 在主題演講中調侃道:“2019年,我用75分鐘來講機器學習,但2020年我想換種方式。”而接下來,無論是他自己的闡述還是客戶證言,在他長達3小時的演講中,“機器學習”被提及的次數超過75次。
云計算的發展,為機器學習提供了蓬勃發展的土壤。亞馬遜副總裁兼CTO Werner Vogels 博士在“2021將改變世界的八大技術趨勢”的預測中提到,機器學習在2020年已經成為主流,未來三年內世界產生的數據比過去30年還要多,而與機器學習模型相結合,使用數據攝取和聚合工具,成為各行各業處理信息的唯一實際方法。
認準了機器學習的方向之后,AWS已經對機器學習的未來做出了趨勢性判斷,在機器學習上所提供的服務越來越深入。
從2016年-2020年的五年間,AWS在機器學習上推出的服務數量增長最快的是2017-2018年,這期間,機器學習服務從2017年的60項,增加155項至215項,此后AWS的機器學習服務每年以“200+”的增量發展。
截止目前,AWS的機器學習服務已經形成了“上-中-下”三個層次的服務框架:
AWS機器學習服務框架圖
第一層,AI 服務,這類服務包含了視覺、音頻-文字互轉、聊天機器人等即拿即用的服務;
第二層,Amazon SageMaker服務,這類服務可以幫助使用者自動標記數據,并提供了SageMaker studio集成開發環境,是一個全托管的機器學習平臺;
第三層,機器學習框架和基礎設施,這類服務包含了可供使用者選擇的多種機器學習框架,以及包含算力芯片、服務器等的基礎設施。
“我們的機器學習解決方案,能夠快速進行數據的模擬,挖掘數據價值。改變數據管理體系,可以把計算和分析融入所有的業務當中。”Andy Jassy 在演講中說。
這正是AWS的高明之處,它將機器學習抽象為了一項通用服務,是數據湖、數據倉庫、數據智能這些當下熱門服務的必備工具。不強調行業屬性、不強調使用場景,只強調“機器學習”作為一項服務對IT和業務效率的提升。至于用到哪兒、用到什么行業什么場景,客戶說了算。
同時,機器學習也可以是更加普惠和易用的。在Andy Jassy的觀念中,機器學習不應該是只被機器學習方面的專業人士來訓練、調優、建構和部署,而應該是“Expand machine learning to more builders(讓機器學習為更多構建者服務)”,這些“builders”包含了不是很懂機器學習的數據分析師、IT業務人員等。
事實也證明,AWS推出的機器學習服務中的SageMaker也已經成為AWS歷史上增長最快的服務。目前,全球已經有超過10萬的客戶在使用AWS的機器學習和人工智能服務。
不同客戶需求,促成AWS不斷創新
不要嘗試從AWS的口中獲得更詳細的關于產品創新的方案,在鈦媒體APP對AWS不同人員的多次采訪中,“如何保持創新”這個問題的答案永遠是“以客戶為中心”。實際上,不同客戶所產生的對機器學習的需求,也確實促成了AWS在機器學習領域的不斷創新。
AWS大中華區云服務產品管理總經理顧凡舉了一個SageMaker的例子:“客戶說你們去年發布的這些東西都挺好的,但是確實是在機器學習當中有一塊硬骨頭還是沒啃,就是怎么快速地把原始數據轉化成模型所需要的核心特征,把這個步驟加快。”
在這樣的一些需求下,AWS推出了機器學習服務AWS Data Wrangler,該工具是機器學習的特征工廠。這里的“特征(function)”是機器學習中的術語,機器學習建模需要進行函數運算,數據“特征”輸入函數后,就可以輸出“標簽(label)”。機器學習工具會根據標簽來識別數據是貓、是狗還是其他。在原來的機器學習工具中,客戶需要自己將不同的數據源打通,抓取數據然后格式化,把數據特征跑出才能進入后續流程。