在計(jì)算社會(huì)科學(xué)的發(fā)展進(jìn)程中,多種形態(tài)的大數(shù)據(jù)類型不斷涌現(xiàn),比如書籍文本大數(shù)據(jù)Google Books、網(wǎng)絡(luò)百科大數(shù)據(jù)Wikipedia等。在眾多的大數(shù)據(jù)類型當(dāng)中,以Twitter、Facebook以及在線新聞?shì)浨樾畔R聚成的輿情大數(shù)據(jù),構(gòu)成計(jì)算社會(huì)科學(xué)的重要觀測(cè)對(duì)象。本文試圖就輿情大數(shù)據(jù)的主要特征及其在社會(huì)科學(xué)領(lǐng)域的應(yīng)用場(chǎng)景做簡要分析。
輿情大數(shù)據(jù)第一個(gè)重要特征是其話語屬性。文本的內(nèi)容表達(dá)了各種各樣的觀點(diǎn)、態(tài)度和立場(chǎng),這些歸結(jié)到一點(diǎn),實(shí)際上就是話語,即各種各樣的社會(huì)主體,香港免備案主機(jī),基于其立場(chǎng),表達(dá)各種各樣的意見和看法。因此,話語分析應(yīng)該是輿情大數(shù)據(jù)分析的第一層重要含義,借助于輿情大數(shù)據(jù)的高維屬性,對(duì)文本進(jìn)行話語分析,呈現(xiàn)話語背后的立場(chǎng)與觀點(diǎn)、不同話語主體之間的交鋒與博弈、不同話語的聲量大小與社會(huì)影響等等。
在中國崛起的時(shí)代,可以分析西方政治話語與中國話語之間的博弈,還可以分析西方話語的建構(gòu)邏輯,以及如何尋找西方話語的破解之道。對(duì)于中國話語,我們則可以分析中國話語的國際影響力,以及如何進(jìn)一步講好中國故事、建構(gòu)中國話語。
話語分析的方法多種多樣。從簡單的主題分析、語義分析到詞叢與搭配分析等,借助于這些技術(shù),我們可以對(duì)文本表達(dá)做一些初步的分析;而借助于向量空間模型,比如說借助于詞向量模型,可以對(duì)話語中的關(guān)鍵特征所嵌入的語境深入挖掘;借助于句向量空間模型,則可以對(duì)話語的類型進(jìn)行分類,呈現(xiàn)話語的結(jié)構(gòu)。
輿情大數(shù)據(jù)的第二個(gè)重要特征是其情感屬性。輿情者,情緒也。輿情信息中,總是會(huì)充斥著豐富的情感表達(dá),這是由輿情信息的屬性所決定的。一方面,就新聞?shì)浨槎裕浨樾枰c受眾 “同呼吸、共命運(yùn)”。輿情數(shù)據(jù)的一個(gè)重要特征就是共情,只有這樣,輿情信息所表達(dá)的喜怒哀樂,才能與大眾的喜怒哀樂保持共振,輿情才能夠影響社會(huì),才能夠吸引觀眾。因此,在線新聞?shì)浨樾畔⒌囊粋€(gè)重要特征就是其情感屬性。另一方面,就社交媒體信息而言,社交媒體的主體部分是大眾直接在社交媒體上表達(dá)所思所想、生存狀態(tài)與生存方式,在這些自我表達(dá)中,也往往是有感而發(fā),分享的是或喜悅、或憂傷、或震驚、或憤怒的情感。
正是因?yàn)闊o論是新聞媒體信息,還是社交媒體信息,都富含情緒表達(dá),因此對(duì)輿情大數(shù)據(jù)進(jìn)行情感計(jì)算,就成為一項(xiàng)非常重要的任務(wù)。這些年來,自然語言處理領(lǐng)域的情感計(jì)算技術(shù)飛速發(fā)展。從最初借助于LIWC、WordNet等情感詞庫開展情感詞頻統(tǒng)計(jì),到現(xiàn)在基于機(jī)器學(xué)習(xí)和BERT模型等開展情感的精細(xì)描述,多種多樣的情感分析技術(shù)在飛速發(fā)展。就情感計(jì)算的內(nèi)容而言,從最初計(jì)算正向和負(fù)向情感這樣的初級(jí)分類,到現(xiàn)在可以計(jì)算喜、怒、哀、樂、愛、懼、憎等基本情緒。隨著情感計(jì)算技術(shù)的進(jìn)一步發(fā)展,未來進(jìn)一步計(jì)算更加具體的情緒,比如羨慕、嫉妒、恨等都是大有可為的。正如李飛飛所言,人工智能的發(fā)展,在經(jīng)歷了“視覺計(jì)算”之后,下一個(gè)發(fā)展的重點(diǎn)就是情感計(jì)算。對(duì)海量的非結(jié)構(gòu)化文本信息和圖像進(jìn)行情感計(jì)算,正是自然語言處理領(lǐng)域飛速發(fā)展的重要方向,而這為與情感計(jì)算相關(guān)的科學(xué)研究提供了堅(jiān)實(shí)的技術(shù)支撐。
輿情大數(shù)據(jù)第三個(gè)重要特征是其傳播屬性。輿情大數(shù)據(jù)的受眾和生產(chǎn)主體都是大眾,信息、話語或者情緒的傳播,構(gòu)成輿情的一個(gè)重要景觀,而某種話語或者觀點(diǎn)在網(wǎng)絡(luò)空間或者社交媒體空間能否傳播開來,很大程度上取決于其傳播屬性。社交媒體平臺(tái)上涉及非常豐富的傳播現(xiàn)象,傳播的要素不僅僅包括話語,還包括情緒的傳播與擴(kuò)散,比如疫情期間的恐慌情緒傳播。縱觀這些形形色色的傳播現(xiàn)象,我們可以發(fā)現(xiàn),絕大多數(shù)傳播信息最終是在浩瀚的信息海洋中歸于寂滅,但也有一些有傳播生命力的傳播要素最終擴(kuò)散開來,形成滔天巨浪。這里的關(guān)鍵問題在于,決定一些傳播要素的傳播力、傳播景觀的因素究竟是什么?比如說民粹主義思潮,為什么這些話語一時(shí)席卷全球的網(wǎng)絡(luò)空間,構(gòu)成了改寫歷史的重大社會(huì)思潮?再比如,有哪些力量在操縱著網(wǎng)絡(luò)空間的信息傳播?資本、政府、社會(huì)組織等利益主體在其中扮演著怎樣的角色?
分析輿情傳播特征的方法也多種多樣。既可以從經(jīng)典傳播學(xué)的5W模型出發(fā),描述信息傳播過程與傳播效果,也可以從網(wǎng)絡(luò)分析和復(fù)雜網(wǎng)絡(luò)分析的方法出發(fā),分析社會(huì)網(wǎng)絡(luò)和社會(huì)結(jié)構(gòu)如何塑造信息傳播的景觀。