很多時候我們不會去閱讀服務協議,卻習慣于簽署、通過它們。但現在,這越來越成為一個民生問題了。像 UPS 和亞馬遜這樣的物流公司,能通過他們先進的監控網絡,對員工進行微觀管理。而國際零售商和快餐連鎖店,則可以利用復雜的數據反饋效率算法生成雇員的時間表。孟山都的“智能農場”技術從大批獨立的農民那里提取出有價值的內部數據,而優步司機甚至可以通過建立規模空前的細節數據庫,來幫助開發他們的自動駕駛替代品。
長期以來,資本家一直從他們的工人那里收集有利可圖的數據而不付任何報酬,但直到最近,網絡智能技術的發展——興趣網絡——將數據監控延伸到工作場所之外,讓我們的個人生活成為了無酬勞的價值創造領域。數字零售商根據我們的個人情況提供針對性的推薦;流媒體揣摩我們的品味以預測我們將欣賞什么內容;而健身應用追蹤我們的卡路里攝入和行走步數以讓我們做出“更健康的決定”。很快,虛擬現實的頭戴設備甚至可以追蹤細微的眼球運動和無意識的視網膜活動。
這些技術通常將我們的個人信息反饋給私人公司,在那里,我們的購物偏好、興趣和身體機能數據,都有可能為它們巨大的利潤。如果沒有我們的個人數據輸入,大數據是不可能存在的,而數據分析市場更不會在沒有大規模合作的情況下發展為 1300 億美元的產業。被動數據收集越來越多地將我們的閑暇時間轉化為工作時間。
當 1996 年谷歌開始實施網頁排名算法時,拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)無意中開啟了從源頭改變信息傳輸渠道的方式。斯坦福的博士學生最終開發出了一種算法,將他們搜索引擎外包給他們的客戶,即享受免費服務的用戶,從而通過鏈接密度和用戶參與程度的統計數據,來對網頁網址不斷擴充的緩存內容進行排序。用戶只要對網頁進行搜索就能完善算法,因此也吸引了更多的消費者來改進產品,從而為搜索引擎提供更大的鍛煉平臺。
這是新古典主義經濟學家“良性循環”的一個理想模式,這個過程是消費者驅動大數據的第一個明確案例。它是創新的,因為它將創造有用數據的過程,從大規模的制造轉變成了大規模的消費,最終使得搜索引擎的競爭對手,例如 AltaVista、HotbotheWebCrawler,歐洲主要代理 德國服務器,以及擁擠的門戶網站如 MSN、AOL 和 Lycos 變為它身后默默無聞的隱藏勞動力。
很少有人知道,在 2001 年年末,谷歌正靜悄悄地考慮對這個“良性循環”進行調整,以測試一個投票系統,從而允許用戶公開透明地影響搜索排名的結果。SiteLab 的聯合創始人 Dana Todd 將更具有參與性的途徑稱為“用戶意識”,但這個公開透明的特性從未引發市場熱潮。正如谷歌發現的那樣,最佳的海量數據采集方式——是隱蔽且間接的。
例如問卷調查或客戶服務調查這樣積極的、直截了當的信息交換,揭示了勞動力如何參與反饋一個神奇的算法。但谷歌沒有選用積極邀約,反而加強了被動數據收集,華沙機房主機 荷蘭主機,并通過物理空間(谷歌地圖)、可預期的未來(谷歌日歷)和可量化的每日網絡使用情況(谷歌 Chrome 瀏覽器)來擴大收集范圍。這些累積的數據,都在隱私頁面所提及。
很快,這些隱藏的交易不僅僅是谷歌的核心,也成為了亞馬遜的商業模式。早在 2003 年,在與谷歌相似的時間,這家互聯網零售巨頭也開始利用客戶的個人數據盈利,亞馬遜用大量的個人購物歷史對算法進行調整,建立商品間的相似指數和消費者分析工具。利用元數據構建復雜的推薦系統,該公司很快就成為了有目的投放在線廣告的先驅。表面上,亞馬遜將零售店員的幫助工作自動化了,但實際上,公司只是將店員的工作放在了消費者自己身上,在消費行為中完成工作。
乍一看,這個模型完美契合了影評人 Annette Michelson 在 1979 年所說的金句,在電視廣告的時代,“你就是最終交付給廣告客戶的產品。”但互聯網的數據經濟將此變得更為復雜:谷歌和亞馬遜開始已經開始接受消費者數據,正如其他早期的互聯網巨頭利用他們的人氣努力賺錢一樣。當時,廣告商對網絡并沒有興趣,因為它沒有電視的受眾,而且利潤回報率很低。現在,谷歌和亞馬遜通過凝聚全球市場的勞動力來回避這個問題。谷歌依靠用戶輸入來創建主導產品,而亞馬遜卻把客戶轉變為一個龐大的個性化銷售團隊。他們都利用自己的權限,把用戶數據轉化成了有價值的商品。