日前,《華爾街日報》的一篇華為和騰訊正因用戶數據、產生沖突的文章在業內流傳,并經國內部分媒體的發酵,演繹出了諸多不同的版本。
其實通過此次《華爾街日報》的報道,我們更關心的是AI時代下,相關企業到底該不該搜集和利用用戶的數據信息以及為何要搜集和利用用戶的數據信息。
我們這里需要強調的是,為了更好提升用戶的體驗和提供更多、更好的服務,用戶數據的搜集、利用與侵犯用戶數據隱私完全是兩個不同的概念。
熟悉AI的業內人士知道,在當下,如果把AI看成一個嗷嗷待哺、擁有無限潛力的嬰兒,某一領域專業海量的深度數據就是喂養這個天才的“奶粉”。奶粉的數量決定了嬰兒是否能長大,而“奶粉”的質量則決定了嬰兒后續的智力發育水平。正是基于此,在進入AI時代,數據搜集及基于數據的分析已經是業內大佬的共識。
眾所周知,亞馬遜的大數據分析系統在電商行業獨領風騷,其會追蹤用戶在電商網站和APP上的一切行為,盡可能多地收集數據。只要看一下亞馬遜的“賬戶”部分,就會發現其強大的賬戶管理,這也是為收集用戶數據服務的。主頁上有不同的部分,例如“愿望清單”、“為你推薦”、“瀏覽歷史”、“與你瀏覽過的相關商品”、“購買此商品的用戶也買了”,亞馬遜保持對用戶行為的追蹤,為用戶提供卓越的個性化購物體驗。而作為亞馬遜最大對手的沃爾瑪,其也通過店內的Wi-Fi搜集了將近1.45億美國客戶(相當于美國成年人的60%)的詳盡數據,包括他們購買的物品、住的地方,以及喜歡的產品等。與此同時,其還通過分析用戶在Walmart.com的點擊行為,消費者在店內和線上購買的物品以及推特上的趨勢,判斷當地的活動和天氣變化將如何影響用戶的購買模式等。根據大數據分析出的結果,臺灣主機 臺灣伺服器,沃爾瑪可以靈活調控倉庫中的貨物存儲,動態調整價格,以短信和直郵的形式對用戶進行精準營銷,同時實現自身銷售利潤的最大化。
再如傳統IT企業的IBM,其知名AI系統沃森,從2015 年 4 月進入醫療領域至今,為了讓沃森商業化,IBM先后花了40 多億收購其他公司,而并購的目的是這些公司擁有大量的醫療數據資源,比如記帳記錄,患者病史,X 射線和 M.R.I 圖片等。與沃森類似,谷歌著名的AI系統DeepMind目前也已經進入醫療行業。去年11月,公司獲得了首個付費項目,與NHS公立醫院皇家自由倫敦醫院(Royal Free London)簽下五年的合同,為其處理170萬份病歷。此外,DeepMind還獲得了訪問其它倫敦醫院兩個數據庫的權限,即DeepMind利用AI軟件分析了約100萬份視網膜掃描報告成功找到了退行性眼疾的早期征兆,或通過頭頸部癌癥圖像讓AI軟件學會區分健康和癌組織之間的不同。
從上述沃森、DeepMind的商業化看,均需要首先獲取現實世界的大數據,即使擁有大量數據的可供挖掘的谷歌,運用AI及機器學習技術改進醫院、電網及工廠等系統時,獲取其詳細的數據也非常重要。
最后是目前業內熱炒和效仿的亞馬遜智能音箱Echo和其對手Google Home,在某種意義上,購買 Echo 或 Google Home 表示消費者已經接受了購買互聯網設備的事實:通過內建的麥克風,這些設備的工作方式就是 24 小時不停地監聽周遭環境,以便及時對用戶的呼叫做出反應;同時相應公司會收集用戶數據進行分析以不斷提高自己的服務質量。
由上述我們不難看到,無論是傳統企業還是全球的科技大佬,在AI時代來臨之際,都在千方百計獲得用戶的數據或者信息(搜集和利用用戶的信息是充分發揮AI不可或缺的重要一環,否則AI將成為無水之源,無本之木),更好地服務于用戶。
當然,我們在此并非否認數據安全和用戶數據隱私的重要,只是不能因噎廢食,即為了所謂安全和隱私而忽視,甚至放棄獲取數據,而是如何在獲取數據的同時,利用協議、技術等手段告知和保證用戶的數據和隱私安全,盡量做到獲取和利用數據與安全的平衡。而提到平衡,我們不得不提及蘋果。
業內知道,蘋果在AI 領域的研究進程要晚于競爭對手,根本原因就是他們不想像谷歌和Facebook 那樣“侵犯”用戶的個人數據。為此,新加坡電信服務器 馬來西亞服務器,蘋果擁有大型的隱私保護項目。該項目使用了在學術領域被稱為差分隱私的概念,并且將這個概念用在了iPhone 上的AI 程序上。差分隱私的工作方式是在好數據中插入噪音或是壞數據,一次來混淆那些試圖侵犯個人隱私的人。例如,為了讓蘋果的軟件將所有含有狗的照片放在同一個相冊里,它需要收集大量狗的圖片。蘋果會收集這些圖片,但是在收集之前,他們會對數據進行加密,然而將這些數據和其他一些無關的數據放在一起,這樣一來,如果有人試圖恢復原始數據,他們也無法得知哪些數據來自哪些用戶。這個技術被認為是最好的隱私保護技術,其防護程度要高于現有的其他數據保護方式。