企業致力于收集和存儲大量數據,但通常只分析其中的一小部分。他們發現數據是新的貨幣,因為數據中隱藏著很多價值。他們正在利用數據科學和大數據分析工具從其“數據寶庫”中提取價值。這有助于他們進行數字化轉型。一些組織在這方面取得了巨大的成功,并不斷創新、獲得市場份額、增加價值(例如Amazon、谷歌、Facebook等公司),而其他公司也在努力效仿。
麥肯錫全球研究院于2011年5月發表了一篇開創性論文,名為“大數據:創新,競爭和生產力的下一個前沿”,使得大數據和分析開始引起人們的關注。根據谷歌公司的趨勢分析(它提高了人們對關鍵詞的搜索興趣),大數據和分析熱潮在2016年6月達到了頂峰。而云計算一直持續受到人們的高度關注,因為越來越多的企業繼續實施云計算技術,以提高業務靈活性、運營彈性、改進性能,以及更高的效率。
數字化轉型需要在組織層面上發揮作用,并將成為一種永久的運營方式。
人們可能會想知道,在大數據和分析達到發展頂峰之后將會變成什么樣子。只要所公布的客戶調查、供應商利益、分析師報告、收入來源等資料具有價值,那么企業都將采用大數據和分析來獲取。調研機構Gartner公司2016年進行的一項調查報告表明,在過去五年中,企業對大數據和分析的投資一直在不斷增長,但對其未來投資的興趣似乎有所下降。這可能是由于這些投資獲得實際收益的一種停頓。而Gartner公司的另一份調查報告顯示,只有大約12%的大數據項目取得了可衡量的成果。然而,社交媒體、物聯網(IoT)、智能手機、移動設備、游戲裝備、可穿戴設備、傳感器、無人機、遠程監控器、精密醫療、精準農業、智能城市、智能建筑、自動駕駛汽車、遠程控制車輛等技術將產生大量需要收集、匯總和分析的數據,以做出有用且有價值的決策。
而使用傳統方法和系統來人工分析數據是不可能的。來自大數據和分析的潛在價值每年達到數十億美元。這被認為是一個保守的估計。因為麥肯錫公司2011年進行的調查報告僅僅占據了大數據潛在價值的一小部分。只有基于位置的數據的采用率和價值捕獲率高達50%-60%,其次是美國零售業,達到30%-40%,制造業占20%-30%,美國醫療保健行業為10%-20%,歐盟公共部門為10%-20%.因此,大數據和分析的興趣和投資在幾乎所有行業都會增加,云主機租用,以捕捉大數據中隱藏的價值。預計在未來幾年中企業對云計算的大數據會持續產生興趣。
數據安全
隨著越來越多的數據被收集、匯總、分析,并用于做出影響人們生活的決策,數據安全性成為人們最為關切的問題。數據治理需要處理從不同來源收集的數據高峰以及管理這些數據元素所涉及的風險的中心階段。美國聯邦、州、市和地方政府機構以及其他非營利性公共服務組織需要符合嚴格的保密性、完整性和可用性(CIA)規則,并且還要提供良好的治理、滿足合規要求和管理風險(GCR)。
人們一個常見的誤解是,組織需要從不同來源收集的大量結構化和非結構化數據,包括外部來源(需要驗證和風險評估)來開始分析。企業不需要大量數據來啟動分析項目。可以從已有的“黃金標準數據”開始,并考慮單獨使用這些數據或將其與其他內部數據集結合使用,以解決業務問題作為向決策者購買的概念證明的可能性。企業可以嘗試和分析以前沒有查看的不同變量,以確定相關性、因果關系和預測因素,謹慎發現,并避免重合。這是行業領域知識和專業知識發揮作用的地方。利用可用且經濟實惠的計算能力、存儲和網絡容量,企業可以輕松地分析更多數據,以查看隱藏在數據中的模式和概率。基于業務需求,分析可用于描述性、診斷性、預測性、規定性的目的。物聯網、傳感器、操作技術、設備維護、精密醫療、電網、航運、物流、執法和精準農業正在越來越多地利用上述不同類型的分析來處理一個或多個業務問題,或根據需要來提供解決方案。
大數據的需求
大數據對不同的人意味著不同的事物。不同的IT分析師、商業領袖、顧問、學術研究人員、標準組織已經根據他們的觀點定義了大數據,其中包括數量、速度、品種、準確性、復雜性等因素。雖然在大數據方面沒有明確的共識,他們現有的能力在人員、過程和技術方面的處理能力太大了。就大數據和分析而言,人員是最難的部分。存在組織慣性、缺乏決策者的支持,以及難以找到正確理解分析的數據和業務領域的數據科學家等問題。同樣,大數據分析師也很缺乏。世界各地的許多高校或認證機構都在提供數據科學和分析方面的新課程,以滿足日益增長的需求。