向混合式開發環境招手問好。 去年預測云的廣泛應用將使對象存儲得到加強和適當的管理,而新的標準將要求數據管理與云、位置和平臺無關。到2019年,您將看到越來越多的企業已經習慣了云計算,他們正在構建一個混合的、異構的數據資產,其中包括多用途的大數據、關系數據和非關系型(NoSQL)數據,這些數據存儲在本地和云中。
如今人工智能和機器學習將對企業進行更深入的挖掘。 在2018年,我們看到沒有采用大數據的勞動密集型人工流程開始消失。自動化、人工智能和機器學習不僅在速度上得到了證實,而且在準確性上也得到了證明,現在正被越來越多的業務功能所應用。
動態利用將使HA和DR在更多應用程序中更具成本效益 , 進一步推動向云的遷移 。云幾乎可以將無限的資源遍布全球,是交付高負荷運行時間的理想平臺。但是,對于許多應用程序來說,提供大部分時間處于空閑狀態的備用資源的成本太高了。部署在多個區域和地區的云資源越來越復雜,所有這些資源都通過高質量的互聯網絡連接,現在只在需要時動態分配備用資源,這將大大降低提供高可用性和災難恢復保護的成本。
可解釋性將成為人工智能的關鍵要求 。隨著越來越多的企業(和政府)使用人工智能和機器學習算法,將更加注重透明度和可解釋性。比如為什么抵押貸款被拒絕?銀行能否證明沒有任何非法統計數據(如種族、性別等),被用于決策或培訓決策模型? 找到合適的數據集并記錄它們的特征和質量,是實現這種透明性和可解釋性的第一步。如果我們不知道數據從何而來,也不知道數據意味著什么,我們就無法解釋這個模型,也無法確保它是正確合法的。
新的數據湖將以一種更嚴謹的方式推出,具有清晰的初始用例、使用和管理策略。隨著越來越多的組織開始采用跨多個系統的虛擬數據湖,我們還將看到越來越多的數據湖被構建或遷移到云上,以充分利用托管的基礎設施、彈性存儲和各種計算能力,使數據湖生態系統將不斷豐富和完善起來。
據相關大數據專家預測,2019年很可能成為數據湖重新產生興趣的一年,私有云也可能卷土重來。其他與大數據相關的預測有,hybrid混合式并行處理方式將成為通用環境,大數據被整合成“小數據”,透明化將成為人工智能的關鍵要求。
數據湖將產生巨大回報 。雖然傳統上關注創建和補充數據湖的機制,但經常是創建數據沼澤,2019年將重新關注數據湖的應用。這與我們在數據倉庫方面的經驗非常相似,最初的數據倉庫生成常常被誤導,但是它們教會了我們創造價值和實現廣泛應用的真正需求。我相信2019年將從關注數據湖的機制, 轉向如何使湖泊中的數據具有可查找性、可用性、可規模化和自動化的管理方式。