美國當地時間8月31日,由 Apache Spark 初始成員創立的大數據初創公司 Databricks 宣布獲得 16 億美元 H 輪融資,服務器租用,新一輪融資由摩根士丹利的 Counterpoint Global 領投,Counterpoint Global 還引入了其他新投資者,包括 Baillie Gifford、ClearBridge Investments 和加州大學的 UC Investments。此外,包括BlackRock(貝萊德)、Andreessen Horowitz、Tiger Global Management、T. Rowe Price Associates 和 Fidelity Investments 在內的現有投資者也參與了本輪融資。
本輪融資過后,Databricks的估值已經飆升至380億美元。也就是說,距離上一輪10億美元的G輪融資才7個月時間,其估值就已經增加了100億美元。
Databricks聯合創始人兼首席執行官 Ali Ghodsi 表示,這筆資金將主要用于加速Data Lakehouse(湖倉一體)的產品創新和市場開拓。
為了支持 lakehouse 技術的發展,Databricks 還宣布任命前 Salesforce 高管 Andy Kofoid 為全球運營總裁,相信在 Kofoid 的帶領下,Databricks Lakehouse平臺將可以積極進入新市場、支持和發展其合作伙伴生態系統以及構建廣泛的行業解決方案目錄。
此外,新聞稿還提到,受開源、上云和機器學習應用不斷興起的趨勢所推動,Databricks還打算進一步投資人工智能方向的創新,保留所有主要公共云的選擇和靈活性,并將 lakehouse 發展成傳統數據倉庫的替代品。
搶灘 lakehouse 市場
Ali Ghodsi 認為資本能幫助 Databricks 進一步獲得市場領先地位。
自80年代以來,大公司已在數據倉庫中存儲了大量結構化數據。近些年,像Snowflake 和 Databricks 等公司則為非結構化數據提供了類似的解決方案,稱為數據湖。
在 Ghodsi 看來,將結構化和非結構化數據結合到一個地方,讓客戶能夠在不移動底層數據的情況下執行數據科學和商業智能工作,是大數據發展的一個關鍵變化。
“‘lakehouse’是一個新賽道,我們認為這個賽道中會有很多供應商,所以說這是一場地盤爭奪戰。我們希望快速構建并完成 lakehouse 賽道的布局。” 在接受媒體采訪時,Ghodsi 強調,Databricks 正與資本充足的競爭對手抗衡,這些對手還不是一些小型初創公司,而是各種大型、成熟的供應商,包括 Snowflake、亞馬遜、谷歌以及其他希望從 Databricks 所看到的賽道中分一杯羹的公司,他希望新融資帶來的資金能夠讓 Databricks 更好地與對手們抗衡。
Databricks 于 2013 年在舊金山成立,是大型數據分析工具的最大供應商之一,其創始團隊也是 Apache Spark 的創始成員。
除了業界熟知的 Spark,Databricks 還有不少產品,包括開發和維護 AI 生命周期管理平臺 MLflow、數據分析工具 Koalas 和 Delta Lake。Delta Lake 為Apache Spark 和其他大數據引擎提供可伸縮的 ACID 事務,讓用戶可以基于 HDFS 和云存儲構建可靠的數據湖。
2020 年 6 月,Databricks 還推出了用于實現高性能查詢的 Delta Engine 原生執行引擎;同年 11 月,Databricks 推出了 Databricks SQL,它允許客戶直接在數據湖上運行商業智能和分析報告。
目前,Databricks 已經與亞馬遜、Google、微軟以及阿里巴巴等全球領先的公共云服務提供商建立了合作關系,合計已為全球19個國家/地區的5000多個客戶提供服務。
未透露上市時間
Ghodsi 在媒體采訪中表示,新冠肺炎疫情加速了 Databricks 在三個關鍵領域的發展勢頭:云、開源和機器學習。最近,Databricks 與多家醫療保健組織和政府機構合作,通過分析大量數據、預測結果以改善其運營。“現在,這些公司渴望將他們的數據和數據管道流程更快地遷移到云,我們看到了這些原本采用傳統本地供應商的傳統企業的機會。”他補充道。
目前 Databricks 的年度經常性收入(ARR)為 6 億美元,高于 2020 財年末錄得的 4.25 億美元,預計到 2022 年公司員工人數將從 2300 人增加到 3000 多人。
以新估值計算,Databricks 的價值是當前其 ARR 的 63 倍,所以 Databricks 并不便宜,但以它目前的增長速度來看,未來的收入也應該可以達到相應的規模。
Ghodsi 這次并未對媒體透露 Databricks 的上市時間安排,但 Ghodsi 在今年夏天接受 The Register 采訪時曾表示,Databricks 的目標是今年“準備 IPO”。
那為什么 Databricks 還不上市呢?
或許是因為 Ghodsi 發現 Databricks 在創投市場中也可以獲得無限的資本。因為太過于受歡迎,Databricks 在最新一輪融資中“不得不”多融1 億美元,而該輪融資原本設定的募資額為15億美元,這些錢也讓 Databricks 能夠對一些較小的公司展開并購,以填補產品路線圖中的空白或不足。Ghodsi 亦曾在接受 VentureBeat 的采訪時表示,國內服務器租用服務器托管,未來融資資金將用于推動并購戰略,重點是機器學習和數據初創公司,以及擴大與云公司的合作伙伴關系。