"數(shù)據(jù)"在今天從來沒有如此被廣泛關(guān)注,以往我們毫不在意地填寫手機號碼等信息,如今卻變得謹慎起來,原因是怕自己的隱私泄露,一個手機號碼可以關(guān)聯(lián)到自己諸多的數(shù)據(jù)。但現(xiàn)實當中,一方面大眾對數(shù)據(jù)被過度使用而煩惱,但另一方面我們可能陷入了"算法崇拜"之中,而算法就是以數(shù)據(jù)為基礎(chǔ)的技術(shù)原理。
比如我們一早起來會打開墨跡天氣,看看今天的天氣怎么樣,APP會提醒穿什么衣服?要不要帶傘?出門的時候,會打開百度或者高德地圖,看看上班路上堵不堵?今天是否限行?等等,這些行為已經(jīng)成為了一種生活的習慣。
從技術(shù)的角度來講,上述行為實際是APP內(nèi)核的算法導致的,是一種輕度的"算法依賴",對大眾而言,并沒有算法的概念,頂多是"APP依賴"或者"數(shù)字化生活的依賴",但如果過度地依賴算法為我們的生活、工作做決策時,你可能就陷入了"算法崇拜",從心理上可以理解為"技術(shù)迷信"的非理性行為,而后果則是被算法左右你的內(nèi)心而迷失方向。
01、大數(shù)據(jù)與算法
要防止陷入"算法崇拜",還需從源頭上了解算法的前世今生,而算法是和數(shù)據(jù)緊密聯(lián)系,算法源于大量數(shù)據(jù)的產(chǎn)生和沉淀,為了讓數(shù)據(jù)具備可追溯和可歸納,同時讓數(shù)據(jù)具備商業(yè)化價值,各種各樣的算法產(chǎn)生了。
舉個例子,墨跡天氣APP是較早的提供天氣實時服務(wù)的手機應(yīng)用,它的技術(shù)原理是通過對接公共開放的天氣數(shù)據(jù)接口(技術(shù)上叫API接口),獲得海量的、實時的天氣數(shù)據(jù),獲得的原始數(shù)據(jù)只是各種有關(guān)天氣的參數(shù),普通人根本看不懂,怎么讓大眾都能直觀的看明白呢?
于是產(chǎn)品經(jīng)理設(shè)計出APP呈現(xiàn)出來的視覺效果和產(chǎn)品的實現(xiàn)邏輯,而JAVA工程師開發(fā)出整個APP的系統(tǒng)后臺供數(shù)據(jù)導入,關(guān)鍵的原始天氣數(shù)據(jù)則由算法工程師根據(jù)產(chǎn)品模型進行邏輯演算,最終呈現(xiàn)出來就是我們看到的APP界面。
再深入理解一下這個案例,比如我們看到墨跡天氣APP今天顯示溫度是20度,下雨,于是算法工程師會把類似溫度、下雨量等數(shù)據(jù)綜合分析,然后再提取與這個溫度適配的穿衣出行的常規(guī)數(shù)據(jù),比如天氣是下雨的20度,會提醒你穿秋衣并且?guī)悖幌掠甑?0度,則會提醒你穿秋衣和利于出行游玩。
更厲害的算法還會進行深度計算,除了利于出行游玩,還會推薦周邊哪些地方適合游玩等信息,這就需要APP除了對接天氣數(shù)據(jù),還需要對接生活、出行和旅游景點等數(shù)據(jù)。
通過上述案例,我們看到一款優(yōu)質(zhì)APP算法的復雜性,也正是因為算法的復雜程度,包括獲取各種數(shù)據(jù)的渠道和難度不一,結(jié)果是建立了一定的技術(shù)壁壘,同時,技術(shù)其實都是通用的,關(guān)鍵是數(shù)據(jù)壁壘讓競爭對手無法超越,從而產(chǎn)生了"信任壟斷"效應(yīng),由此逐步在用戶心目中建立了信任感而引發(fā)"算法崇拜",這點我們在下節(jié)詳述。
對于技術(shù),我們一貫的觀點是技術(shù)的就是人文的,技術(shù)終歸是為人性服務(wù),大數(shù)據(jù)和算法也不例外,脫離了人性的技術(shù),也就無所謂應(yīng)用和商業(yè)價值。
既然算法是源于數(shù)據(jù),我們先看一下數(shù)據(jù)到底是什么?根據(jù)科技作家,原阿里副總裁涂子沛老師在《大數(shù)據(jù)》中非技術(shù)語言的描述:
數(shù)據(jù)分為兩種,一種是小數(shù)據(jù),就是像氣溫、面積、大小等源于測量的數(shù)據(jù),或者一般性統(tǒng)計,如人口多少、土地面積多少這些常規(guī)的數(shù)據(jù);另一種就是大數(shù)據(jù),源于記錄的行為,也就是基于有信息背景的數(shù)據(jù),有規(guī)律可循、有行為痕跡可循。過往的大數(shù)據(jù)通過各種行為的記錄,今天則是產(chǎn)生于無處不在的傳感器和微處理器。
海量的數(shù)據(jù)無論是小數(shù)據(jù)還是大數(shù)據(jù),首先是一個沉淀的過程,當我們需要數(shù)據(jù)時,美國服務(wù)器,會從一個個數(shù)據(jù)倉庫中提取數(shù)據(jù)進行數(shù)據(jù)清洗,這個過程把不需要的數(shù)據(jù)過濾掉,留下對自己有價值的數(shù)據(jù),最后進行數(shù)據(jù)分析和演算,而分析和演算就是通過算法來實現(xiàn)。
目前,我們通過算法主要演繹四種數(shù)據(jù),分別是:
行為數(shù)據(jù): 也就是我們生活和工作的各種行為產(chǎn)生的數(shù)據(jù)。如餐廳消費、坐地鐵打車等;
狀態(tài)數(shù)據(jù): 即某個事物或生物的固有狀態(tài)數(shù)據(jù)。如臺風參數(shù)、森林綠化指標、人體狀態(tài)等;
社交數(shù)據(jù): 我們通過微博、微信、抖音等社交媒體產(chǎn)生的登陸、時間、評論、分享等行為數(shù)據(jù);
工業(yè)數(shù)據(jù): 生產(chǎn)、設(shè)計和制造過程中產(chǎn)生的數(shù)據(jù),這是工業(yè)智能化的基礎(chǔ)。
而算法就是基本基于以上四種數(shù)據(jù)進行各種分析、演繹和模型輸出,最終呈現(xiàn)出我們看到的各種應(yīng)用,包括人工智能和物聯(lián)網(wǎng)的發(fā)展,也是基于算法來實現(xiàn)。比如搜索引擎的推薦算法、地圖應(yīng)用的導航算法、外賣APP的排名算法、音樂APP的偏好算法等等。