大數據,數據科學,以及分析的發展與演變在今年的Strata數據會議上得到全面展示,其中包含了一個重要的信息:人們需要獲取大數據的價值。
正如在一個數字表演節目中,人們選定的數字是83,認為這會難倒魔術師,魔術師在一個4×4矩陣填寫了16個數字,在組合之后,每行和每列之和都是83,并且數字在各行各列中沒有重復。魔術師說,“看一下這個結果。如果將每一行的所有數字相加,則它們的總和為83,每列中的數字總和也是83.事實上,每一個組合加起來都是你選的數字。”
太神奇了,對吧?這就像人們在獲得到大量數據的時候的感受——就像魔術一樣!
日前在紐約舉行的Strata數據會議的展位上,Diwo公司提供了一個新的認知決策平臺。并采用了這種有趣的方式來介紹他們新的解決方案,也許在無意中會有助于大數據市場的發展。
雖然人們一直在談論大數據,數據科學和分析已經有了相當長一段時間,但在今年Strata數據會議的活動中,全面展現了市場的演變。可以看出在主題演講和展覽層面所貫穿的幾個交織的主題總結出的一個信息:現在是發揮大數據價值的時候了。
這些主題都涉及了一個廣泛的觀念,在現實生活中大規模應用大數據,科學的數據和分析,現在是超越探索階段的時候了。而這樣規模的數據力量能夠改變業務模式和客戶體驗,或許讓人們對這一切感覺有點像魔術。
使大數據更加真實
大數據在大多數情況下一直是技術上關注的領域。雖然商業影響總是很明確,馬來西亞主機 日本服務器,但市場的焦點主要在于實驗,以及找出如何解決大規模數據集所面臨的技術問題的辦法。
當然,大數據的成功應用產生了巨大的業務成果,但市場的主要驅動力是技術開發,而不是業務應用。然而在2017年將有一個明顯的變化。
首先,隨著行業的不斷發展,大數據的社會影響以及數據科學家和從業者必須發揮的重要作用將會顯著增加。
“數據毀滅武器:大數據如何加劇不平等并威脅民主”一文的作者,數學家Cathy O'Neil警告說:“我們還沒有制定數據科學方面的標準。而糟糕的算法可能危及人們的生命…… 這對于人工智能來說也是不公平的,它使現狀和所有隱含的偏差實現自動化。這一點需要得到承認,特別是當我們將注意力集中在那些影響人們生活的事情時。”
聯合國兒童基金會創新辦公室首席科學家Manuel García-Herranz和美國國會圖書館創新者Jer Thorp也對數據對世界的正面和潛在的負面影響表示了類似的看法。
Garcia-Herranz分享了聯合國兒童基金會如何整合數據科學和實時系統來發現的見解,同時仍然可以利用這些系統采取有意義的行動并“為人類應用數據”。
另一方面,Thorp警告說,人們所期望的客觀性可能阻止他們了解數據的實際功能和影響。他的建議很簡單,但卻是深刻的:“不要坐談,而是需要實踐。”
與此同時,大數據和人工智能(AI)的交叉點也在加強了企業處理大數據主動性的緊迫性。雖然大數據作為人工智能動力的本質已經使二者共生,但人工智能作為企業高管面臨的頭號問題,這正在使企業規模的大數據在戰略上占有一席之地。
實時處理大數據
將重點轉移到組織如何在現實世界中應用大數據也帶來了第二個重要趨勢:實時應用數據和分析的轉變。
越來越多的人認識到事后分析并不是唯一的大數據用例,東莞電信服務器 河南電信服務器,實際上這并不是最好的用例。許多組織現在意識到,通過在交易時應用最終的分析和見解,他們可以利用大數據的最大價值。
有了這個用例,組織不僅可以使用回顧性數據進行分析和規劃,而且可以使用它來塑造客戶體驗,更好地進行決策,并在消極結果發生之前降低風險。在交易點使用數據可以采取多種形式,應該是任何現代大數據戰略的基本要素。
幾家科技公司已經引入了工具和策略來幫助組織實時地整合他們從大數據計劃中獲得的見解和分析。這些包括(按字母順序):
· Cambridge Semantics:一種基于語義關系數據模型的端到端的探索性分析解決方案,通過根據業務環境構建數據,實現實時分析,并縮短上市時間。
· MapR:融合數據平臺,提供所謂的“數據結構”,將傳統數據湖與流數據集成在一個單獨的,位置無關的和場景感知的平臺中。
· Splice Machine:一種應用程序開發平臺,它創建一個新的“預測應用程序”,將事務處理和分析處理合并,并將分析導出的洞察數據注入到應用程序工作流程中。
· Striim:實時數據集成和流分析平臺,可在攝入時分析數據,以便通過實時洞察來支持決策。
· VoltDB:一個運行數據平臺,可提供毫秒響應時間的實時事件處理和分析。
雖然這些技術提供商正在采用不同的方法實時應用大數據,但每個技術提供商都向企業組織提供一個相同的信息:現在是使用大數據的最佳時機。
使大數據工作