當忘記成為例外,被機器忘記也是一種幸福。發明很多技術,核心目的就是記住,因為人的記性太差。你忘了黑客沒有忘記,數據很久遠,一上永流傳。以前發表文章需要交版面稅,今天刪貼子試一試,遺忘權成為新問題。以前只關注如何記住問題,現在關注如何永久性地消滅數據是工程師新的發展機會。
硬件。以前通用硬件非常廣泛,越通用價格越低,缺點是越通用的性能越差。硬件性能上不去只好優化硬件,而不再是通用的硬件。面向數據的軟硬件結合是重要的發展方向。
這些事件意味著什么?短期看,說明一些大數據應用真正落地。如果大數據在用戶畫像及營銷沒有落地,這些事情不會發生。這也反向證明大數據真的已經成功應用,所以才能出現問題。幾年前搞云計算時說可靠性不行,我說恰恰說明是人們開始廣泛使用云計算,要不然不會關心這些問題。中期看,保護個人隱私必然是未來3年或更長時間內的重中之重,全行業必須團結起來,為保護用戶隱私制定規則,這也需要恰當地技術手段提供支持。長期看,最近一系列事件的爆發是不是意味著已經使用20多年的互聯網免費模式宣告終結??峙逻@是更大的議題,免費模式都是以用戶數據換取用戶服務的便利性。
從算法看,算法的透明度會成為需要關心的議題。隨著數據越來越多,數據越來越開放,要打破算法黑箱,解決算法的歧視問題、算法殺熟問題和算法疫情。如果算法一樣,尤其金融市場會引發算法共振或算法疫情問題。開放算法是必須要考慮的議題,剛剛討論過網絡中立問題,算法該不該中立?算法該不該透明?算法該不該監管?我想需要。
從資產看,過去幾年知道數據是資產,市場教育已完成。但如何把數據變成資產還在迷茫中,前幾年想是否通過財務手段把數據變為資產,現在看是不夠的,需要更多的技術支撐。未來3年要學習如何把數據變成資產,不僅通過資本與管理的手段,還需要新的技術,需要創新算法、創新技術、創新模式。
當大數據遇到區塊鏈,兩者都是用來處理數據,一個是希望擴展數據的內心,結構化擴展到更多的數據結構。數據以前做信息,現在做價值,海量數據提高計算性能。區塊鏈說針對關鍵數據,主要核心目的是為了防篡改,也有計算模式。把一件事分給多個人做,區塊鏈希望多個人重復做一件事情,有利于防篡改。一個用服務器積存,一個是用P2P網絡,一個數據是信息,一個數據是價值。大數據處理需要給做大數據的人發工資,因為激勵是外部的。區塊鏈發幣的時候可以內置,而不是通過外部的數據。大數據宣傳的口號是相信數據,區塊鏈的口號是相信數學。