作為一個數據科學家,我認為:第一,政府和企業只要扎扎實實打好基礎,就能從大數據技術上獲益。第二,大數據技術目前是一個正在從應用中逐漸走向成熟的技術,挑戰仍然很多。
大數據是很多工作的基本“標配”
什么是大數據?什么是數據?什么是資料?資料就是生產過程、管理過程,乃至經濟、社會、生活過程的記憶。那些記憶可能表現在一個文件、一段演講、一段文字等等。資料放在計算機上就叫數據。真正的大數據是指大而復雜的資料集,這些復雜性包括了海量性、時變性、異構性、分布性等,是我們從互聯網的數據能夠觀察到的特征。只要數據量超過臨界量,就叫大數據,反之則不叫大數據。因而講大數據涉及兩個概念:第一,大和小是相對概念;第二,相對的特定問題而言,不同的決策問題要求的數據不一樣。
有人認為現在是大數據時代,大數據可以解釋任何事情,其實是不正確的。當然,不重視大數據同樣不正確。現在都說大數據是基本的生產資料,大數據是基本的生產力,因而才說大數據是經濟社會的基本生產資源。大數據離不開互聯網,近幾年互聯網的發展走向是從復雜的信息傳遞到消費互聯,再到生產互聯,也就是物聯網,再到智慧互聯。在這個走向中信息技術向互聯網產生以后,要與其他任何領域深度整合,這就是今天談論信息工業化、談論大數據的主要原因。
目前新技術很多,真正產生效益和作用的是所有技術的綜合運用。所有技術是互補的,都是從不同的層面講問題。互聯網和云計算是基礎設施,物聯網講的是交互方式,人工智能講的是應用模式。大數據講的是信息技術,是人和人、人和機器、機器和機器交互的內容特征。大數據是最底層的信息技術,是基本標配。
大數據可以帶來超凡價值
對于大數據如何去運用,我想說五句話。
第一,明確目標是前提。這是推出大數據產業最重要的一步。只有真正解決每個地區、每個政府、每個企業不同的問題,大數據才有用。
第二,擁有數據是基礎。大數據產業就是以現代技術設施為基礎,以數據為生產要素,以數據的價值挖掘為創新活動的產業叫大數據產業。因此,沒有數據就談不上大數據產業。
第三,計算平臺是支撐。換句話說,沒有一定的計算架構和計算平臺,計算不了。它是支撐作用,但做企業的人不必過分強化,也不必過分低估。
第四,分析技術是核心。這是當今較少提到的一個主題。我非常擔心在整個大數據的鏈條中,有些鏈條做得過分粗壯,有的鏈條過分纖弱,也就是產業鏈布局不均衡。如果過分膨脹,將會產生新的產能過剩。
第五,產生效益是根本。數據是基礎,平臺是支撐,技術是核心,盈利是王道。
為什么大數據可以帶來超凡價值?有三條原理:第一,量變到質變的原理。大數據之所以有用,是因為數據積攢到了可以質變,通過數據就可以知道背后的故事。第二,分析出價值原理。如果存儲不分析,無疑是只買米不做飯,產生不了實際效益。所以,要分析,要挖掘。第三,跨界關聯原理。
這個過程中有很多觀念要改變:第一,數據是資產;第二,用戶是資源;第三,服務即感知。大數據突飛猛進地發展,能夠解決相當多的問題,但千萬不要以為大數據技術已經成熟了。挑戰仍然存在,華沙機房主機 荷蘭主機,主要是分析基礎被破壞,directadmin安裝 directadmin漢化,計算技術待革新,真偽判定需要重建,對新技術的盲目所引起的盲從。總體來說,雖然挑戰很多,但是仍需集中力量攻克,大數據的發展才能有大的突破。