當前,數據驅動型業務戰略與信息產品的潛力比以往任何時候都要大。對于多數企業機構而言,數據分析與管理已成為它們業務戰略的重要驅動力。數據分析與管理領導者正在通過挖掘數據價值來驅動數字化轉型、創造盈利機會、改善客戶體驗和重塑行業格局。
隨著云、本地、邊緣間的界限逐漸消失,數據管理的未來可以用四個關鍵詞來描述。
四大關鍵字
首先是分布式(Distributed),未來的數據管理將是分布式的,因為數據管理須隨數據所在的位置而進行。 其次是無服務器(Serverless),此概念較特殊、并不是指未來的數據管理不再需要服務器,而是指未來將沒有一個明確的集中式服務器。 再者是協調(Orchestrated),今天的數據會產生在不同的地方和設備上,所以須把它們協調管理。 最后就是元數據(Metadata),無論數據分散在何處,元數據均能把它們協調在一起,因此元數據是未來數據管理中非常重要的一個元素。
三大維度
總體而言,數據管理的未來發展趨勢可從三個維度來看——架構的改變、技術的轉變以及組織的衍化。
1架構的改變(Architecture Shifts)
Gartner于2018年針對數據和分析的采用趨勢進行了一項調查(多選題)。結果顯示企業機構目前使用最普遍的信息基礎架構技術為“基于云平臺的數據存儲”(63%)。
一些傳統技術,例如數據倉庫(Data Warehouse)和數據庫管理系統(DBMS)仍然占著相當大的比重。這些傳統技術在未來并不會消失。
舉例而言,“數據倉庫”是一個非常廣泛的案例,未來數據的研究和分析都將需要用到該技術——主要配合在特定案例和場合中使用。
此外,未來還將有諸如“數據目錄”(Data Catalogs)這樣的技術被廣泛使用。
“數據目錄”是元數據的重要基礎,以往“數據目錄”主要用于幫助企業機構了解數據的定義和來源,但現在的趨勢是“數據目錄”可以幫助企業機構了解數據的特性、使用者以及使用場景。
因此,在數據管理的未來趨勢中,“數據目錄”將具有舉足輕重的地位。
此外,數據湖(Date Lake)已從此前放置在內部數據中心中轉變為目前可放在云端上,這是一個非常大的變化,未來諸如此類比較高端的技術均可以移至云平臺之上。
1)重“關聯”、輕“采集”
從上述調查背景可以看出,未來的數據管理和集成將會變得更加“關聯”(Connect),更少“采集”(Collect)。
當前,在數據管理上,企業機構通常重“采集”、輕“關聯”,此情形在中國尤為嚴重——即企業機構在采集和存儲數據后,并不能立即挖掘其中的價值,失去其時效性。
原因在于,從數據被“采集”到應用其價值,這中間有相當長的流程(如上左圖所示),包括描述、整理、集成、分享、治理和實施。這一長串流程對企業機構內部IT技術具有相當大的考驗。
隨著機器學習技術的引入和元數據的應用,目前數據管理和集成已開始呈現出一種新趨勢,即更加注重數據的“關聯”(如上右圖所示),也就是指無論數據是在本地、云端、某個設備感應器上或任何地方,我們都可以在數據保留在原地的情況下,將它們關聯起來,而無須采集到特定地方。
在未來增強式的數據管理的環境中,自動發掘數據、透過機器自動意識識別數據中的價值、認定有價值的數據、分析數據、自動采用適合數據的安全措施、分享數據、優化數據,最終實現在最短時間內將精準的數據發送給對的人,對于企業機構至關重要。
2)“移動性數據”成為主要案例
數據管理與集成方面的另一個趨勢是“移動性數據”(Data in Motion)。
以往,諸如交易產生后,企業機構便把數據存儲進數據庫或數據中心內,后續任務即制作報表等工作,美國站群服務器,這類的數據被稱為“靜態型”。