在大數據時代,我想沒有人會不知道數據的重要性,對付企業來說,數據可以輔佐決定者越發相識市場,幫助擬定成長方案。不外,大數據的技能與貿易模式還處于摸索階段,企業若是不得其法的話很大概會帶來負結果。
數據大概存在毛病
統計學家NateSilver暗示:沒有毫無毛病的數據,毛病是數據的自然狀態。企業中的絕大大都數據都是存儲在數據庫中的布局化數據,這些數據凡是是在原始數據階段被收集,然后從非布局化名目轉換為布局數據存儲起來,數據的布局凡是是由應用措施(包羅數據庫)或技能人員的小我私家習慣來確定的。
譬喻,在基于勾當的本錢計較闡明中,假如應用只能捕捉開始和竣事時間,不能捕捉勾當的全進程,那么對付勾當的闡明險些是不行能實現的。因此,數據的上下文預先確定或失真就意味著捕捉和存儲的原始數據不只是恍惚的,并且尚有大概是有毛病的。
數據打點昂貴且耗時
固然企業一直想要通過有質量的數據來獲取洞察,可是數據質量的獲取和打點是十分昂貴的,數據的建設、存儲、處理懲罰、共享、聚合、清理、復制等操縱都是需要時間和款子的。按照MITHowardRubin博士的研究:金融處事部分的92%的業務本錢是與數據有關的。
縱然數據質量獲得了改進,整個數據的生命周期中也照舊需要打點的,因為數據質量會以每年7%的速率下降。數據打點是一場馬拉松,而不是沖刺,所以假如企業需要高質量的數據,那么數據打點打算應該被晉升到企業級一連改造打算的層面。
數據大概會約束創新
數據只是在展現已往的工作,可是并不能改變將來。《GettingChangeRight》的作者SethKahan曾說過:只依據數據來做抉擇就像是只操作后視鏡來駕駛汽車。假如企業在堅苦時期,想要操作已往的抉擇來掙脫逆境,那么只能是越來越倒退,已往只能暗示你去過哪些處所,并不能為你的將來指路。
數據永遠不會是及時的
此刻許多公司都在談論數據及時闡明,可是其實數據永遠都不行能是及時的,數據及時闡明自己就是個偽命題,因為數據在提倡和捕捉之間老是有時間滯后的,在plant/SCADA/PoS系統中這種時間滯后大概是幾微秒,可是IT/OLTP系統數據庫中的數據的名目化、清理、驗證、籌謀和提交大概需要幾個月。別的,在對BI/OLAP數據集執行闡明操縱之前,需要從差異的系統歸并并聚合數據,所以時間延遲會進一步耽誤。
聚合數據闡明與流數據闡明固然截然差異,可是在這兩種環境下,數據的提倡和闡明之間都存在時間滯后,聚合數據的時間滯后的單元大概是天、周或月,荷蘭服務器 英國主機租用,而流媒體數據的時間滯后的單元大概是分鐘可能小時。所以縱然企業設法做到了及時獲取數據,可是通過數據舉辦的趨勢、類型和預測闡明也照舊需要時間的,有意義的數據闡明永遠不會是及時的。
數據對付企業來說當然有代價,可是假如盲目投入時間和精神建樹數據驅動型企業有大概會徒勞無功,因此,企業應該有個久遠的籌劃,對維持數據打點有本身的打算,對數據闡明有客觀的領略。