中國IDC圈3月31日報道,兩年多前,英國人維克托·邁爾·舍恩伯格所著《大數據時代:糊口、事情與思維的大厘革》出書了中譯本,從此,“大數據”便好像溘然滲透進國人糊口的方方面面。面對新技能攻擊而亟待全面轉型的傳媒業好像發明白“救命稻草”,各類新銳或貌似新銳的新聞報道,動輒頂著“大數據”的名號問世。好像大數據的觀念和應用,天生就是新聞業的專寵。其實,每每當真閱讀過這部著作的人都知道,至少舍恩伯格原著中所謂的大數據以及總結的相關思維特點,來自于以計較機技能為支撐的IT財富及其運用;而基于海量數據的匯集和闡明技能,最直接的應用首先在于糊口、貿易、金融等更為遍及的規模。雖然,以信息技能為焦點的新技能具有相連互通的特點,今世新聞業完全可以、也該當進修和警惕大數據的要領和思維。可是這種進修和警惕必需契合新聞流傳的屬性和成果,尤其必需團結我國新聞業所處的根基國情和成長階段,以腳踏實地的評估與決議為基本,才氣真正覺得他山之石。然而兩年后的本日,海內新聞業界對付“大數據”的盲目崇敬不減,不少認識、領略和操縱的誤區依然存在。一些研究學者固然號令對此保持鑒戒,但較為全面和深入的接頭并不多見,在此有須要提出探討。
什么是“大數據新聞”
當下海內的傳媒業,大凡重要的主題報道,種種媒體平臺時常可見多樣的新聞報道樣式,譬喻數據解讀、圖表闡明、視頻與文字的混搭等等。突出者如本年的兩會報道,新聞業界樂觀地認為,一大亮點就是對付大數據的充實運用。而在這幾年的行業論文中,不罕用以證明大數據的應用實例,也多是這類形式的新聞報道。該當說,新聞形式的多樣成長,融合媒體的迅速崛起,雖然是新聞界的利好動靜。可是篤志細究,我們必需認可,,上述這些當下常見的樣式,可以稱之為數據新聞、準確新聞、圖表新聞甚或多媒體新聞,但卻難以歸為“大數據新聞”。尤其該當辯明的是,一般意義上的“數據新聞”,與“大數據新聞”完全是兩個觀念,不行夾雜,更不能等同。最基礎的原因在于,所謂“數據新聞”變革的只是泛起形式,內核依然是傳統的新聞理念和操縱手法。
在舍恩伯格的原著中,他對大數據的特征歸納綜合為:非抽樣而是全體、非準確而是恍惚、非因果而是相關。后兩條固然有助于啟迪思維,但至少在觀念內在上,與新聞向來崇尚真實、準確、注重因果干系等本質特征和成果效用有所牴牾,其在新聞業的應用代價另有待摸索與驗證。因此當下新聞業對付大數據的應用,凡是會合于第一條。不外對付新聞而言,什么樣的數據樣本可稱之為“全”,什么樣的新聞屬于大數據新聞?這是首先必需明了的。譬喻新華網多媒體產物中心2014年10月28日建造的一篇“數據新聞”,名為《拔河角逐中如何戰勝敵手》,共由六個頁面構成。第一主頁題為“發源中國盛行世界”,以世界輿圖為底,插入一些加指示圖標的數聽說明,譬喻:“國際拔河角逐發源于英國,1900年至1920年期間被列為奧運會正式角逐項目。”“日本萬人拔河大賽,用繩200米,1.7萬人參賽,沖破吉尼斯世界記載。”顯然,這種“抽樣”式的數據泛起,內核仍是傳統新聞理念和操縱要領,所以定名為“數據新聞”是得當的,但讀者不行誤覺得這就是大數據新聞。至于其自第二頁主題“拔河角逐挑選隊員的原則”起,以下“拔河角逐方式”“拔河角逐能力”“拔河應留意的安詳問題”“拔河角逐后的身體規復”共五個主題頁中,每個頁面只有配以漫畫的文字論述,完全沒有任何數據展示,則連“數據新聞”都不是。
依照舍恩伯格的界說,“大數據新聞”該當浮現的“非抽樣而是全體”,不只是基于有關新聞事件的“全樣本”(即窮盡所有相關數據)所引導出的全方位和全角度,更是一種思維模式,即用全面的目光來對待事實,用整體的樣原來闡明接洽。他在書中所羅列的沃爾瑪超市中啤酒與尿布的現象、亞馬遜向讀者推薦書籍的模式,就都是大數據思維的典范。至于其在新聞規模的應用,人大傳授彭蘭曾提出,“大數據新聞”不可是數據泛起,而是信息圖表驅動下的新聞發明和深化②。換言之,大數據新聞應該是用全方位的數據去驅動新聞線索的挖掘和新聞事實的揭破。從這個意義上說,大數據新聞是一個很苛刻的尺度,需要有全新的思維方法,也要有強大的硬件支撐。