美國當(dāng)?shù)貢r(shí)間8月31日,由 Apache Spark 初始成員創(chuàng)立的大數(shù)據(jù)初創(chuàng)公司 Databricks 宣布獲得 16 億美元 H 輪融資,服務(wù)器租用,新一輪融資由摩根士丹利的 Counterpoint Global 領(lǐng)投,Counterpoint Global 還引入了其他新投資者,包括 Baillie Gifford、ClearBridge Investments 和加州大學(xué)的 UC Investments。此外,包括BlackRock(貝萊德)、Andreessen Horowitz、Tiger Global Management、T. Rowe Price Associates 和 Fidelity Investments 在內(nèi)的現(xiàn)有投資者也參與了本輪融資。
本輪融資過后,Databricks的估值已經(jīng)飆升至380億美元。也就是說,距離上一輪10億美元的G輪融資才7個(gè)月時(shí)間,其估值就已經(jīng)增加了100億美元。
Databricks聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Ali Ghodsi 表示,這筆資金將主要用于加速Data Lakehouse(湖倉一體)的產(chǎn)品創(chuàng)新和市場開拓。
為了支持 lakehouse 技術(shù)的發(fā)展,Databricks 還宣布任命前 Salesforce 高管 Andy Kofoid 為全球運(yùn)營總裁,相信在 Kofoid 的帶領(lǐng)下,Databricks Lakehouse平臺將可以積極進(jìn)入新市場、支持和發(fā)展其合作伙伴生態(tài)系統(tǒng)以及構(gòu)建廣泛的行業(yè)解決方案目錄。
此外,新聞稿還提到,受開源、上云和機(jī)器學(xué)習(xí)應(yīng)用不斷興起的趨勢所推動(dòng),Databricks還打算進(jìn)一步投資人工智能方向的創(chuàng)新,保留所有主要公共云的選擇和靈活性,并將 lakehouse 發(fā)展成傳統(tǒng)數(shù)據(jù)倉庫的替代品。
搶灘 lakehouse 市場
Ali Ghodsi 認(rèn)為資本能幫助 Databricks 進(jìn)一步獲得市場領(lǐng)先地位。
自80年代以來,大公司已在數(shù)據(jù)倉庫中存儲(chǔ)了大量結(jié)構(gòu)化數(shù)據(jù)。近些年,像Snowflake 和 Databricks 等公司則為非結(jié)構(gòu)化數(shù)據(jù)提供了類似的解決方案,稱為數(shù)據(jù)湖。
在 Ghodsi 看來,將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)結(jié)合到一個(gè)地方,讓客戶能夠在不移動(dòng)底層數(shù)據(jù)的情況下執(zhí)行數(shù)據(jù)科學(xué)和商業(yè)智能工作,是大數(shù)據(jù)發(fā)展的一個(gè)關(guān)鍵變化。
“‘lakehouse’是一個(gè)新賽道,我們認(rèn)為這個(gè)賽道中會(huì)有很多供應(yīng)商,所以說這是一場地盤爭奪戰(zhàn)。我們希望快速構(gòu)建并完成 lakehouse 賽道的布局。” 在接受媒體采訪時(shí),Ghodsi 強(qiáng)調(diào),Databricks 正與資本充足的競爭對手抗衡,這些對手還不是一些小型初創(chuàng)公司,而是各種大型、成熟的供應(yīng)商,包括 Snowflake、亞馬遜、谷歌以及其他希望從 Databricks 所看到的賽道中分一杯羹的公司,他希望新融資帶來的資金能夠讓 Databricks 更好地與對手們抗衡。
Databricks 于 2013 年在舊金山成立,是大型數(shù)據(jù)分析工具的最大供應(yīng)商之一,其創(chuàng)始團(tuán)隊(duì)也是 Apache Spark 的創(chuàng)始成員。
除了業(yè)界熟知的 Spark,Databricks 還有不少產(chǎn)品,包括開發(fā)和維護(hù) AI 生命周期管理平臺 MLflow、數(shù)據(jù)分析工具 Koalas 和 Delta Lake。Delta Lake 為Apache Spark 和其他大數(shù)據(jù)引擎提供可伸縮的 ACID 事務(wù),讓用戶可以基于 HDFS 和云存儲(chǔ)構(gòu)建可靠的數(shù)據(jù)湖。
2020 年 6 月,Databricks 還推出了用于實(shí)現(xiàn)高性能查詢的 Delta Engine 原生執(zhí)行引擎;同年 11 月,Databricks 推出了 Databricks SQL,它允許客戶直接在數(shù)據(jù)湖上運(yùn)行商業(yè)智能和分析報(bào)告。
目前,Databricks 已經(jīng)與亞馬遜、Google、微軟以及阿里巴巴等全球領(lǐng)先的公共云服務(wù)提供商建立了合作關(guān)系,合計(jì)已為全球19個(gè)國家/地區(qū)的5000多個(gè)客戶提供服務(wù)。
未透露上市時(shí)間
Ghodsi 在媒體采訪中表示,新冠肺炎疫情加速了 Databricks 在三個(gè)關(guān)鍵領(lǐng)域的發(fā)展勢頭:云、開源和機(jī)器學(xué)習(xí)。最近,Databricks 與多家醫(yī)療保健組織和政府機(jī)構(gòu)合作,通過分析大量數(shù)據(jù)、預(yù)測結(jié)果以改善其運(yùn)營。“現(xiàn)在,這些公司渴望將他們的數(shù)據(jù)和數(shù)據(jù)管道流程更快地遷移到云,我們看到了這些原本采用傳統(tǒng)本地供應(yīng)商的傳統(tǒng)企業(yè)的機(jī)會(huì)。”他補(bǔ)充道。
目前 Databricks 的年度經(jīng)常性收入(ARR)為 6 億美元,高于 2020 財(cái)年末錄得的 4.25 億美元,預(yù)計(jì)到 2022 年公司員工人數(shù)將從 2300 人增加到 3000 多人。
以新估值計(jì)算,Databricks 的價(jià)值是當(dāng)前其 ARR 的 63 倍,所以 Databricks 并不便宜,但以它目前的增長速度來看,未來的收入也應(yīng)該可以達(dá)到相應(yīng)的規(guī)模。
Ghodsi 這次并未對媒體透露 Databricks 的上市時(shí)間安排,但 Ghodsi 在今年夏天接受 The Register 采訪時(shí)曾表示,Databricks 的目標(biāo)是今年“準(zhǔn)備 IPO”。
那為什么 Databricks 還不上市呢?
或許是因?yàn)?Ghodsi 發(fā)現(xiàn) Databricks 在創(chuàng)投市場中也可以獲得無限的資本。因?yàn)樘^于受歡迎,Databricks 在最新一輪融資中“不得不”多融1 億美元,而該輪融資原本設(shè)定的募資額為15億美元,這些錢也讓 Databricks 能夠?qū)σ恍┹^小的公司展開并購,以填補(bǔ)產(chǎn)品路線圖中的空白或不足。Ghodsi 亦曾在接受 VentureBeat 的采訪時(shí)表示,國內(nèi)服務(wù)器租用服務(wù)器托管,未來融資資金將用于推動(dòng)并購戰(zhàn)略,重點(diǎn)是機(jī)器學(xué)習(xí)和數(shù)據(jù)初創(chuàng)公司,以及擴(kuò)大與云公司的合作伙伴關(guān)系。