自誕生以來,分布式存儲就被視為存儲的未來,被萬眾期待。然而分布式存儲起步于寒門,最早應用于互聯網日志、企業備份歸檔、開發測試等場景,云主機租用,追求極致成本,性能和可靠性卻不敢恭維。但它還算爭氣,憑借多年的打怪練級,越來越多地開始承載自動駕駛研發、超高清編輯、運營商5G網絡云等企業的關鍵業務,走上變成高富帥、贏取白富美的道路。
正所謂人紅是非多,存儲領域也是一樣,坊間一直流傳著關于分布式存儲的各種流言蜚語。好事的筆者今天就來探尋一番,揭開謊言背后的真相。
目測分布式存儲領域有兩個派系,一派是SDS(軟件定義存儲),一派是軟硬一體。前者以vSAN、Ceph為代表,以軟件廠商為主在推廣。分布式存儲軟件+通用服務器組合,打著重定義存儲市場的旗幟,頗有“有王侯將相寧有種乎”的氣勢;另一派是老牌存儲玩家的產品,他們以軟硬一體為主,如Isilon、HCP等。
楚河漢界已然形成,未來誰主沉浮?
誰主沉浮很難判斷,不過我們不妨從產業動態窺見一斑。雖然用過的客戶都詬病分布式存儲軟件+服務器的方式存在各種兼容性、可靠性、可維護性的問題,但筆者認為SDS這種模式會長期存在,尤其是在傳統的低端領域,如備份歸檔、開發測試環境。而越往高端走,軟硬一體越是占據主流。業界主流廠商也在持續推出軟硬一體的產品:
•國外,DELL&EMC的PowerScale(Isilon)、DDN的EXAScaler等產品;
•國內XSKY、浪潮等Ceph系開源廠商也推出了軟硬件一體產品如XScaler Express。尤其有趣的是XSKY,這可是國內Ceph系軟件定義存儲的旗幟啊,你品,你細品。
另一方面,筆者也注意到近些年運營商開展了大規模的分布式存儲集采,有文件的有塊的。以中國移動2019~2020年分布式塊存儲集采為例,3個標段中2個為軟硬一體采購,占比超過了90%;電信集團2020年集采也放棄了分布式存儲純軟件采購,首次全面轉向軟硬一體。從這個角度看,用戶在嘗試了多種采購模式之后,也開始逐步轉變到軟硬一體的道路上來,尤其是大型用戶。
#真相#:分布式存儲誕生初期主要是純軟形態,近十年來,隨著分布式存儲逐步進入企業市場,軟硬一體的形成已經成為主流。
謊言二:分布式存儲就是低價值存儲
如文章開頭講到的,分布式存儲早期主要用于互聯網日志、企業備份歸檔、開發測試等場景,這些場景無疑是低價值場景,成本是第一訴求甚至唯一訴求。
然此一時彼一時,士別三日也當刮目相看。
首先是分布式存儲產品能力已今非昔比,逐漸具備了承載企業高價值業務的關鍵能力,例如毫秒級時延、TB/s級帶寬、雙活/3DC業務級容災、端到端DIF等,無論是結構化數據還是非結構化數據的承載,功能完備性的最大短板早已補齊。
其次,分布式存儲已走入眾多高價值關鍵業務,如運營商BOM業務、金融渠道類業務以及超算、油藏探測HPC等高價值業務,通過大規模應用實踐來檢驗成色。(小道消息,某些高價值場景全閃出貨價達到1000美金/TB以上啦)
看完當下還要看看未來,筆者認為未來高價值的非結構化數據場景,分布式存儲的版圖還會持續擴展。如自動駕駛訓練、4K/8K超高清、5G日志留存等場景,對多協議訪問、極致帶寬、擴展性訴求強烈,分布式存儲已然成為這些未來業務的首選架構。
#真相#:分布式存儲早期主要用在備份歸檔等低價值、強成本訴求的場景,如今隨著企業級能力的提升,分布式存儲也逐步成為企業生產系統的承載平臺,尤其是面向海量非結構數據場景,全面支撐文件資源池和HPC等高價值場景。
謊言三:開源架構是分布式存儲的未來
筆者對開源從來是持開放、支持的態度,正是因為開源的存在,IT產業才能有今天的繽紛色彩;也正是因為開源,存儲這個高大上的產品,才走進了更多的尋常百姓家。
但如果說存儲的未來在開源,我不敢茍同。
開源分布式存儲軟件的出現,一定程度上降低了存儲的門檻,云服務器租用,小公司可快速包裝出存儲產品,帶動服務器銷售。但產品同質化問題是所有開源不得不面臨的問題,由于架構限制,很難在不動架構的情況下,真正做出差異化競爭力。互聯網類公司、部分科研機構,以及有技術情結和充足資金投入的客戶可能選擇開源,而對于金融、電信運營商、大企業商用HPC、政府等對可靠性、性能、安全合規有要求的企業,開源從來不是第一選擇,因為數據太重要了。(聽說,國內某知名銀行曾經投入500人基于開源軟件搭建分布式存儲,投入巨大且無法達銀行業務對性能、可靠性、易運維訴求,最終于2年后放棄。)