據外媒報道,人工智能(AI)系統“MogIA”預測唐納德·特朗普(Donald Trump)將贏得本年的美國總統大選。這不禁讓我們想到這樣一個問題:1948年《芝加哥逐日論壇報》的“杜威戰勝杜魯門”這一錯誤報道的數字版本正在上演。
1948年,其時美國的三大民調機構Gallup、Roper和Crossley一致預測,共和黨候選人杜威(Dewey)將以5~6個百分點的優勢戰勝民主黨候選人杜魯門(Truman)。功效,心急的《芝加哥逐日論壇報》在計票功效發布之前就頒發了“杜威擊敗杜魯門”的頭條動靜。而最終的功效是,杜魯門反而以5%的票數優勢勝出。
原因安在呢?主要因為這三大民調機構的觀測工具并不是美國選民的代表。為什么這么說呢,主要有兩方面的原因。首先,部門投票數據是通過電話收集的,而1948年電話更大概被富饒的共和黨人擁有,而不是民主黨人。
其次,也大概是最重要的,民意觀測人員在收集數據時,是隨意選擇觀測工具的,只要它們切合投票資格。因此,民意觀測人員很大概出于某種原因而觀測了更多的共和黨人士,而不是民主黨。
既然1948年的投票數據存有成見,那么MogIA所利用的預測數據大概同樣如此。MogIA由康健打點公司Genic.AI首創人桑吉夫·賴(Sanjiv Rai)開拓,那么桑吉夫·賴是通過何種方法收集數據并提供應MogIA的呢?
MogIA的預測基于來自美國社交網絡平臺的2000萬個數據點,別離來自Twitter、谷歌、Facebook和YouTube等。這些數據主要捕獲了社交網站用戶與每位候選人的互動環境。桑吉夫·賴稱,基于已往幾屆的總統大選功效,擁有更高互動級此外候選人最終贏得了大選。與希拉里對比,特朗普用于更高的互動度,九江服務器 東莞服務器,因此MogIA預測特朗普贏得大選。
假如社交媒體互動的數據也像1948年那樣存在成見,那就意味著《芝加哥逐日論壇報》的“杜威戰勝杜魯門”這一錯誤報道的數字版本即將上演。
通過社交媒體接頭總統候選人也并不是什么新鮮事物,可是,本年社交媒體在總統大選中所飾演的腳色與往年有著明明的區別。譬喻,特朗普在Twitter上發性情已經成為了熱門話題。別的他還頒發了其他一些吸引眼球的話題,這意味著有些特朗普的互動數據并不適適用來預測大選功效。
別的,皮尤研究中心(Pew Research Center)數據顯示,Twitter用戶多為非農村、非西班牙裔黑人,年數在29歲或更低。 而這并不是特朗普的支持者,后者多為50歲或更高年數的白人。假如大量的特朗普支持者之前并不利用Twitter,只是在近期才開始通過Twitter來支持特朗普,那么特朗普的Twitter數據就大概存在成見。
要評估MogIA預測的精確性,我們還要相識其一些個問題。譬喻,哪些社交平臺提供了數據用于闡明?互動數據是如何權衡的?發一條關于特朗普的動靜、轉發這條動靜,以及為這條動靜點贊,其功效是一樣的嗎?
別的,MogIA開拓者桑吉夫·賴在接管采訪時稱,MogIA在處理懲罰社交媒體數據時,無法識別用戶的感情。這意味著MogIA只是簡樸地計較候選人被提及的次數作為互動索引,而沒有思量到社交媒體用戶對候選人的立場畢竟是努力的,照舊消極的。
最終,假如MogIA預測錯誤,那么大概對未來繼承開拓預測性AI大有輔佐。假如希拉里勝出,我們可以成立一個某型,操作同樣的數據來預測她勝出。然后對這兩個某型舉辦比擬,看看新模子的架構、算法和數據評估是奈何的。發明個中的差異將有助于敦促AI的成長。