作為亞馬遜旗下的云計算服務平臺,AWS 如今已邁入第 11 個年頭,成為年化收入 140 億美元,卻仍然保有 43% 年增長的龐然大物。
在亞馬遜 AWS 全球副總裁、大中華區執行董事容永康看來,AWS 取得今天的成績是一個水到渠成的過程。當其他企業還在討論亞馬遜提出的新概念的可行性時,公司就已積累了大量內部測試經驗,當一項技術達到一定的成熟度,AWS 則順理成章地將相關資源開放給客戶。
從一個眾人眼中的公有云平臺,到被公認為企業轉型與創新所需的技術平臺,亞馬遜的技術儲備,就是 AWS 提供云服務的底氣。與谷歌、微軟以軟件即服務(SaaS)起家,逐漸下移到平臺即服務(PaaS)和基礎設施即服務(IaaS)的路線不同,亞馬遜一開始就提供基礎設施,在此基礎上,為滿足不同開發者的需求,進一步提供平臺與軟件。如今,AWS 提供超過 90 個大類的服務,擁有數百萬月活躍用戶,涵蓋了不同的企業類型與企業規模。
7 月 27 日,2017 AWS 技術峰會北京站在國家會議中心舉行,會上,容永康與亞馬遜首席技術執行官 Werner Vogels 對 AWS 的業務進行了梳理,眾多 AWS 的客戶和合作伙伴也分享了他們使用 AWS 云服務的經驗。人工智能作為一個對云計算有巨大需求的領域,作為 AWS 眼中未來十年的大趨勢之一和近期投入大量資源的方向,也引發了廣泛的關注和討論。AWS 為人工智能領域提供了哪些產品?其優勢體現在哪些方面?機器之能在采訪了相關負責人及行業用戶之后結合演講內容進行了以下梳理。
應用云計算的人工智能相關公司可以從「開發者」和「應用者」的角度簡單分為兩類。開發者以人工智能模型本身作為產品,以算法為核心建立新的行業秩序、劃定新的分配原則,創造或顛覆一種商業模式。他們對云的需求是數據存儲、計算能力基礎設施以及機器學習框架平臺。此類業務中最典型的莫過于自動駕駛。
應用者則利用人工智能的技術加強自己原有的產品與服務,這類企業的工程師未必有人工智能核心算法的開發能力,因此以 SaaS 的形式提供通用的,可以進行有針對性微調的人工智能接口更符合他們的需求。這類公司可以通過調用相應 API 與自身的產品或服務配合。智能家居、智能農業公司都是常見的應用者。
AWS 為兩種類型的公司都提供了豐富的產品線。
致力于自動駕駛領域的圖森未來是開發者中的 AWS「重度用戶」,其 COO 郝佳男在媒體溝通會上提供了近十種圖森未來使用 AWS 的典型場景。他表示,AWS 吸引他的地方在于,當他按照需求構建架構時,可以像拼圖一樣從 AWS 的產品列表中找到合適的產品。
Vogel 也在演講中表示,規模龐大、來源復雜的數據是人工智能領域面對的首要挑戰,首先要對數據進行管理和處理,然后是使用 GPU 進行訓練,最后在邊緣設備上運行模型做出預測。
對于圖森來說,車就是「邊緣設備」,而為了讓車運行,主要的工作其實都在車外的云端完成。研發車背后的系統需要大規模的基礎架構平臺支持,這就是圖森未來與 AWS 結合之處。
首先是數據,郝佳男介紹,需要解決的問題涉及數據的上傳、存儲、標注、抓取等多方面。用于數據收集的車輛上搭載大量傳感器,每輛車每小時產生的原始數據就有 TB 級別。如何讓不同來源的數據從車上流暢地流向云端并不是一件容易的事情。而數據上傳之后,還需要上千人對數據進行標注,之后才能訓練監督學習類型的人工智能算法。標注完成,在使用數據時,并非每次都抓取所有的數據,比如訓練雨天的算法,就需要對雨天的數據進行查詢和操作。
為了解決這些復雜的問題,圖森未來使用了多種 AWS 產品,將數據從本地傳到云端,穩定的鏈路需要 Direct Connet,傳輸大量數據需要 Snowball。數據和大部分產品在 S3 上,數據到達 S3 就會觸發 Lambda 做預處理,Glacier 提供數據備份,RDS 提供元數據檢索。
在架構和算法層面,以可擴展性聞名的 MXNet 是 AWS 的官方深度學習平臺,使用者可以通過 MXNet 的 AMI 快速構建 MXNet 環境。一個典型的訓練,可能需要 8 個 GPU 花費數小時才能完成,EC2 提供的彈性計算資源則從基礎架構層面解決了資源調度的問題。
作為一家自動駕駛公司,郝佳男認為,他們應該把更多精力和成本投入在自動駕駛上,AWS 則以低運營成本、高可用性,滿足了人工智能開發者在研發過程中對基礎架構的需求,使他們的研發得以順利進行,減少車輛在路測時的問題。