從蘋果派銷量下降說起
美國人最愛的餡餅是什么?
毋庸置疑是蘋果派。
我們是怎么知道的?通過數據。
當你看到超市的銷售數據,會發現超市銷售的30厘米冷凍餡餅中,蘋果派勝出,這是毫無懸念的。絕大多數的銷售份額就是來自蘋果派。但是之后,超市開始銷售比較小的11厘米的餡餅。
突然間,蘋果派的銷量下降到了第4或第5名。這是為什么?發生什么了?
好的,不妨想象一下:
當你準備買一個30厘米的餡餅時,全家都不得不同意選擇蘋果派餡餅,雖然蘋果派并不是每個人首選。但當你給自己選一個11厘米餡餅時,directadmin安裝,你可以買你最愛吃的口味。你會選你的首選項。
有了更多數據,你可以知道些事情,這些事情在你只有少量數據時你是無法知道的。這里關鍵的是更多的數據,不單單讓我們知道更多,知道更多我們正在關注的同樣事物;更多的數據使我們能了解新的事情,讓我們更好地了解,讓我們有不同的視角。
在這個例子里,更多的數據讓我們知道:美國人最喜歡的餡餅,不是蘋果派。
無處不在的大數據
你肯定聽過大數據這個詞。事實上,你可能對這個詞已經有些煩了。確實,大數據受到了空前的宣傳炒作,這很不應該。因為大數據是一個非常重要的工具,社會將由此而不斷進步。
過去我們習慣于處理小數據,思考這些小數據的意義,并以此來了解世界。現在我們有很多很多的數據,數據量前所未有的巨大。 當我們掌握海量數據時,我們可以做一些事,一些在只有較少數據時不可能辦到的事。
大數據很重要,它也是一個新興事物。想象一下,大數據能夠幫助我們應對世界性難題。比如應對食物短缺、醫療短缺、能源短缺、電力短缺等問題的唯一辦法是有效利用大數據。
為了回答這個問題,讓我們看一下信息在以前是什么樣的。
1908年在克里特島上,考古學家發現了一個粘土做的盤子。這是個公元前2000年的盤子距今約有4000年的歷史。盤子上有銘文,但是我們不知道它們是什么意思,這完全是個謎團。
但這就是4000年前信息的樣子,這就是當時社會存儲和傳遞信息的方式。現代社會也沒有什么很大的進步,我們還是把數據存儲在磁盤中,但我們可以存儲更多的信息,遠遠超過以前的信息容量。
這些信息搜索和復制起來更簡單,分享和處理起來也更便捷。我們也可以重新利用這些數據,一些我們在當初收集時從來沒有料想過的用途。
從這個方面來說, 數據已經從儲存狀態到了流動狀態,從靜態的統計性的數據,變成動態的數據流,這就是信息的流動性。
克里特島發現的粘土盤有4000年的歷史,非常笨重,但它不能記錄太多的信息,并且它所記錄的信息是不能更改的。
與此相反,愛德華·斯諾登從美國國家安全局所獲得的文件,可以放在一個僅有指甲大小的存儲盤里,并且可以以光速進行數據共享。
今天我們有這么多數據的一個原因是, 我們一直在收集信息,就像我們一直在做的一樣。另一個原因是我們記錄了許多蘊含豐富信息的事物,但是從沒把信息轉換成數據形式,現在我們正在把信息轉變成數據。
數據處理定位問題
舉個例子——定位問題。
比如說馬丁·路德(德國宗教改革家)。在16世紀,如果我們想知道馬丁·路德在哪里。我們必須一直跟著他,或許用羽毛筆和墨水,把這些情況記錄下來。
那現今是什么樣的情形呢?
在某些地方,可能在電信運營商的數據庫里有個電子數據表或者至少一個數據目錄,記錄著所有關于你,任何時候在什么地點的信息。
如果你有個手機,這個手機有GPS ,或者即使沒有GPS它還是可以記錄你的信息。從這方面來說,位置信息被數據化了。
從姿勢傳感器到疲勞駕駛預警
再舉個例子,關于姿勢。
你們現在坐著的姿勢都不一樣,這是一個關于腿長,以及你的背部和背部輪廓的函數。如果我現在放一些傳感器在你的椅子里,我可以算出你的獨一無二的參數。
那我們能用它來干什么呢?