大眾創業時代,人們常談“自研”。但在國內存儲行業,將“自研”付諸實踐,堅持10年的企業卻沒幾家。
但即使用10年時間,自研出代表行業先進水平的產品,生存和發展的壓力仍在每名研發、產品、運營人員的肩頭。
這或許印證了中國存儲人、中國IT人的使命——抓住海量數據爆發的時代機遇,成就一款眾人皆知的經典產品。
下面講述的,是中國最早自研分布式存儲產品——中科曙光“ParaStor”的10年往事。愿這些過往能給同為追求極致的IT人些許幫助和啟示。
圖說:10周年慶典現場,曙光員工正給ParaStor慶生
存儲“十字路口”
ParaStor的10年,始于2009年夏天。
站在中科院計算所大樓,眺望施工不斷的中關村,已過而立之年的苗艷超,下定決心離開工作多年的計算所去企業。
要去的企業名叫“曙光”,他要負責一款從無到有的存儲產品開發。
當時,鮮有人談大數據、人工智能,少數國際廠商開始講“分布式存儲”。站在存儲發展的十字路口,各大廠商開始了對未來的爭奪。
2009年,Cisco宣布進入服務器和存儲市場,與此同時EMC參與NetApp競購,并與Cisco、VMware兩家廠商結成VCE聯盟。Oracle收購SUN公司,具備了存儲軟硬件一體的產品格局……
2009年“選擇”擺在了曙光人面前。
隨著曙光服務器進入更多行業和領域,突破存儲瓶頸成為當時要務。但此時,曙光還未有自研的,滿足高并發IO需求的商業化存儲產品。
而苗艷超所在計算所智能中心,便一直研發有高并發IO特點的“集群文件系統”,但這些研究成果只停留在課題中,未形成商業化產品。
不到五人的研發團隊
到曙光后,苗艷超的第一個難題便是“曙光存儲的技術路線要怎么走?”
“Parastor立項就面臨技術路線選擇問題,一個是以磁盤陣列作為基礎部件;另一種是以x86架構的高性能服務器為底層硬件,數據冗余機制由上層文件系統負責提供的分布式存儲系統。”苗艷超回憶。
此時,為減少對大廠存儲技術依賴,以及跟上“大數據”時代技術趨勢,結合曙光自有的產品生態和優勢,苗艷超和同事選擇了更具前瞻性和挑戰的分布式存儲系統研發路線。
但此時加上苗艷超,初期的ParaStor研發團隊只有不到5人,相比同類廠商動輒上百人的研發隊伍,連零頭都不到。
圖說:曙光存儲產品事業部總工程師 苗艷超
為加快研發進度,當時每人都領了不同產品領域去研究,經常半夜誰有想法就爬起來發郵件,一起討論可行性。
最終不到一年,ParaStor1.0便問世了。如今看來ParaStor1.0很原始,僅支持副本冗余,沒有糾刪碼等如今“分布式”存儲系統必備的技術,但它為ParaStor的發展明確了方向。
2010年,ParaStor從1.0升級到1.5,這是ParaStor第一個商業化軟件版本。為建口碑,當時團隊內部定了一個目標,有BUG必須24小時內解決。很多BUG都是當天發現,研發團隊通宵修改,第二天客戶上班,BUG已解。
最終,初出茅廬的ParaStor以高性能和良好的擴展性獲得首批客戶的認可,該版本也為國內首臺性能超千萬億次的計算系統“曙光星云”,構建了當時國內最大的單一存儲系統(16PB)。
此次成功部署,使得“曙光能做分布式存儲產品”的理念深入公司內外,從此ParaStor步入了高速市場化發展軌道。
戰書
“三年后,曙光存儲要占領國內10%的市場份額,進入存儲主流市場”2012年7月,時任曙光存儲產品總監惠潤海,面對發布會現場記者立下戰書。
圖說:曙光存儲產品事業部總經理惠潤海
而打贏這場仗的排頭兵便是ParaStor。
惠潤海立下戰書后不到半小時,現場就有媒體提問“在國際廠商搶先進入市場的背景下,曙光靠什么獲得主流客戶的認可?”
對此,惠潤海表示,曙光的立身之本有兩點:一是要靠自主研發,掌握核心技術,應對海量數據增長所帶來的一系列挑戰;二是在行業深耕細作,通過對行業應用的快速適配和深入優化,打造差異化優勢,實現重點市場的逐個突破。
相比于2009年,此時已進入“大數據元年”,中國互聯網產業在起飛。當時IDC研究報告顯示,大數據技術和服務市場至2017年的增長率可達27%,增速是整個信息和通訊技術市場的6倍。
但就在惠潤海立戰書的幾天前,連媒體也沒幾人知道ParaStor。不知道ParaStor的,還有將成為ParaStor研發工程師的郭洋。