數據,被譽為新時代的石油。幾乎任何一個企業的IT管理者,都會在演講、采訪或其他形式的交流分享中強調數據的重要性。獲取洞察、行為預測、市場分析、業務轉型升級……數據能夠為企業帶來巨大的商業價值。
但與此同時,數據量的激增,也讓數據存儲及管理成為了更為棘手的問題。傳統存儲系統已經難以滿足大規模IT應用對數據存儲的要求,采用分布式的系統架構,利用多臺存儲服務器同時對數據進行存儲的分布式存儲系統應運而生。憑借更高可靠性、可用性、可擴展性和存取效率的優勢,它逐漸成為大規模數據存儲的主要方式。
在2019中國系統架構師大會即將召開之際,筆者有幸就這一話題采訪到了螞蟻金服高級技術專家趙裕眾(花名陳群)。2010年,陳群于中國科學技術大學獲得計算機博士學位,同年加入螞蟻金服從事分布式事務框架的研發,2013年加入 OceanBase 團隊,目前在 OceanBase 團隊負責存儲相關的開發工作。在SACC2019期間,陳群將進行《OceanBase 存儲系統的架構演進歷程及工程實踐》主題演講。
未來,分布式存儲將替代傳統存儲
經過幾年的發展,分布式數據存儲技術進步迅速,已經在許多業務場景中表現出了巨大的生產使用價值。有觀點認為,分布式的數據存儲方式未來將完全取代傳統存儲。這種說法也許有些激進,但陳群認為,分布式存儲代替傳統存儲會是一個趨勢。他表示,隨著5G、物聯網(IoT)等技術和其應用場景的鋪開,國內服務器,未來數據量會越來越大。這會為分布式存儲帶來機遇,同時也會有新的挑戰。
數據石油的井噴,是帶來更多挑戰的主要原因。對于分布式存儲的未來發展挑戰,陳群表示:“隨著未來數據量的增大,對分布式存儲的高性能低成本會有更高的要求,集群的規模可能會變得更大,更大規模集群下的線性擴展仍然會是個挑戰。此外隨著業務場景的增多,一些業務對數據一致性及高可用也會有更高的要求。”
那么企業IT部門在搭建分布式存儲系統時,需要重點關注的設計與建設要點有哪些呢?
首先是數據的安全性,或一致性。設備故障、自然災害、人為失誤包括惡意入侵等因素都可能為系統帶來災害,導致數據丟失。IT部門在建設分布式存儲系統時,需要考慮在一臺機器宕機、一個機房甚至一個城市遇到災難的情況下,如何保證數據不會丟失?
然后是擴展性。基于業務的規劃與發展態勢,在數據量達到一定程度時,往往需要對系統進行擴展。一般的分布式存儲系統都可以輕松擴展到幾十臺服務器,但在更大規模之下,如果需要擴展到成百上千臺,系統需要能夠具備相應的擴展能力。
此外要保證高可用。業務難以忍受長時間的宕機,恢復時間越長往往意味著損失越大。IT部門應考慮當系統出現故障時,如何在最短的時間內將其恢復,將損失最小化。
最后是性能成本和易用性。出于整體系統建設規劃的考慮,這兩點也十分重要。“其實這兩點都對應著成本,一個是機器成本,一個是人力成本。” 陳群說。
金融級分布式關系數據庫——OceanBase
熟悉中國互聯網的人,一定知道阿里巴巴的“去IOE”之旅——即擺脫過去IT系統中對IBM小型機、Oracle數據庫以及EMC存儲的過度依賴;而熟悉“去IOE”的,一定也知道阿里巴巴和螞蟻金服完全自主研發的分布式關系數據庫——OceanBase。
2013年7月,淘寶廣告系統使用的Oracle數據庫下線,也是整個淘寶最后一個Oracle數據庫。2014年,OceanBase替換了支付寶交易系統中的Oracle數據庫。2015年: OceanBase成功上線網商銀行,成為全球首個應用在金融核心業務系統的分布式關系數據庫。2016年,OceanBase替換了支付寶最核心的賬務系統中的Oracle數據庫。2017年: 支付寶首次把賬務庫在內的所有核心數據鏈路搬到OceanBase上,并在雙十一種創造了4200萬次/秒數據庫處理峰值的全新紀錄。
作為阿里去IOE戰略中的重要組成部分,OceanBase自然代表著業界的最高水平。據陳群介紹,OceanBase的分布式架構使得它能夠承載阿里巴巴和螞蟻金服的海量數據,2018年雙11當天淘寶2135億元交易的背后就有OceanBase數據庫的支撐。
同時它的高可用強一致也確保了支付寶不會再有光纖被挖斷導致停服務的事情發生。2018年云棲大會上,螞蟻金服副CTO胡喜(花名:阿璽)當場演示了剪斷光纖,云主機租用,在OceanBase數據庫及上層中間件的支撐下,30秒內服務就得到了恢復,同時數據也沒有一行出現丟失。
據陳群介紹,OceanBase的核心優勢包括以下五點: