據(jù)外媒報(bào)道,人工智能(AI)系統(tǒng)“MogIA”預(yù)測唐納德·特朗普(Donald Trump)將贏得本年的美國總統(tǒng)大選。這不禁讓我們想到這樣一個(gè)問題:1948年《芝加哥逐日論壇報(bào)》的“杜威戰(zhàn)勝杜魯門”這一錯(cuò)誤報(bào)道的數(shù)字版本正在上演。
1948年,其時(shí)美國的三大民調(diào)機(jī)構(gòu)Gallup、Roper和Crossley一致預(yù)測,共和黨候選人杜威(Dewey)將以5~6個(gè)百分點(diǎn)的優(yōu)勢戰(zhàn)勝民主黨候選人杜魯門(Truman)。功效,心急的《芝加哥逐日論壇報(bào)》在計(jì)票功效發(fā)布之前就頒發(fā)了“杜威擊敗杜魯門”的頭條動(dòng)靜。而最終的功效是,杜魯門反而以5%的票數(shù)優(yōu)勢勝出。
原因安在呢?主要因?yàn)檫@三大民調(diào)機(jī)構(gòu)的觀測工具并不是美國選民的代表。為什么這么說呢,主要有兩方面的原因。首先,部門投票數(shù)據(jù)是通過電話收集的,而1948年電話更大概被富饒的共和黨人擁有,而不是民主黨人。
其次,也大概是最重要的,民意觀測人員在收集數(shù)據(jù)時(shí),是隨意選擇觀測工具的,只要它們切合投票資格。因此,民意觀測人員很大概出于某種原因而觀測了更多的共和黨人士,而不是民主黨。
既然1948年的投票數(shù)據(jù)存有成見,那么MogIA所利用的預(yù)測數(shù)據(jù)大概同樣如此。MogIA由康健打點(diǎn)公司Genic.AI首創(chuàng)人桑吉夫·賴(Sanjiv Rai)開拓,那么桑吉夫·賴是通過何種方法收集數(shù)據(jù)并提供應(yīng)MogIA的呢?
MogIA的預(yù)測基于來自美國社交網(wǎng)絡(luò)平臺(tái)的2000萬個(gè)數(shù)據(jù)點(diǎn),別離來自Twitter、谷歌、Facebook和YouTube等。這些數(shù)據(jù)主要捕獲了社交網(wǎng)站用戶與每位候選人的互動(dòng)環(huán)境。桑吉夫·賴稱,基于已往幾屆的總統(tǒng)大選功效,擁有更高互動(dòng)級(jí)此外候選人最終贏得了大選。與希拉里對(duì)比,特朗普用于更高的互動(dòng)度,九江服務(wù)器 東莞服務(wù)器,因此MogIA預(yù)測特朗普贏得大選。
假如社交媒體互動(dòng)的數(shù)據(jù)也像1948年那樣存在成見,那就意味著《芝加哥逐日論壇報(bào)》的“杜威戰(zhàn)勝杜魯門”這一錯(cuò)誤報(bào)道的數(shù)字版本即將上演。
通過社交媒體接頭總統(tǒng)候選人也并不是什么新鮮事物,可是,本年社交媒體在總統(tǒng)大選中所飾演的腳色與往年有著明明的區(qū)別。譬喻,特朗普在Twitter上發(fā)性情已經(jīng)成為了熱門話題。別的他還頒發(fā)了其他一些吸引眼球的話題,這意味著有些特朗普的互動(dòng)數(shù)據(jù)并不適適用來預(yù)測大選功效。
別的,皮尤研究中心(Pew Research Center)數(shù)據(jù)顯示,Twitter用戶多為非農(nóng)村、非西班牙裔黑人,年數(shù)在29歲或更低。 而這并不是特朗普的支持者,后者多為50歲或更高年數(shù)的白人。假如大量的特朗普支持者之前并不利用Twitter,只是在近期才開始通過Twitter來支持特朗普,那么特朗普的Twitter數(shù)據(jù)就大概存在成見。
要評(píng)估MogIA預(yù)測的精確性,我們還要相識(shí)其一些個(gè)問題。譬喻,哪些社交平臺(tái)提供了數(shù)據(jù)用于闡明?互動(dòng)數(shù)據(jù)是如何權(quán)衡的?發(fā)一條關(guān)于特朗普的動(dòng)靜、轉(zhuǎn)發(fā)這條動(dòng)靜,以及為這條動(dòng)靜點(diǎn)贊,其功效是一樣的嗎?
別的,MogIA開拓者桑吉夫·賴在接管采訪時(shí)稱,MogIA在處理懲罰社交媒體數(shù)據(jù)時(shí),無法識(shí)別用戶的感情。這意味著MogIA只是簡樸地計(jì)較候選人被提及的次數(shù)作為互動(dòng)索引,而沒有思量到社交媒體用戶對(duì)候選人的立場畢竟是努力的,照舊消極的。
最終,假如MogIA預(yù)測錯(cuò)誤,那么大概對(duì)未來繼承開拓預(yù)測性AI大有輔佐。假如希拉里勝出,我們可以成立一個(gè)某型,操作同樣的數(shù)據(jù)來預(yù)測她勝出。然后對(duì)這兩個(gè)某型舉辦比擬,看看新模子的架構(gòu)、算法和數(shù)據(jù)評(píng)估是奈何的。發(fā)明個(gè)中的差異將有助于敦促AI的成長。