2012年“大數據”的成長如火如荼,然而本文的作者,數據闡明公司SiSense副總裁Bruno Aziza卻認為并不是每小我私家 都需要大數據。
“大數據”無處不在。從社交媒體初創公司到紐約的中央公園,每個公司好像都在陳設大數據闡明.
著名數據闡明公司Gartner的數據好像也在證明這一點:最近的一份陳訴顯示,大數據將發動2012年全球280億美元的IT支出,到2016年這個數字將高出2300億美元。2300億美元險些是葡萄牙全年的海內出產總值。
可是,你需要花大價格來陳設大數據技能辦理方案。大大都公司都沒有這么多IT預算,也請不起數據科學家可能數據闡明團隊。
假如那些提供大數據處事的公司想為各類局限的企業提供處事,那么有幾個問題必需認識到并加以辦理。
大數據太貴了!
您大概傳聞過那些利用大數據的光輝案例:Facebook天天要存儲約莫100TB的用戶數據;NASA天天要處理懲罰約24TB的數據。這些數字確實令人印象深刻。
那么處理懲罰這些數據所需的本錢是幾多呢?憑據亞馬遜Redshift的訂價,NASA需要為45天數據存儲處事付出高出100萬美元。
按照最近的一項觀測,大大都企業的CIO稱他們的預算付出不起大數據陳設的本錢。數據存儲和處理懲罰的本錢實在太高,我們需要尋求其他的辦理方案,讓局限較小的公司不被“大數據”拒之門外。
大數據的要害不是“大”
今朝全球最大的科技公司都需要和PB級局限的數據打交道。然而,SAP的研究表白,95%的企業凡是只需要利用0.5TB到40TB的數據。
Facebook和NASA的例子是個破例,而不是常態。事實是,處理懲罰數據并不是大公司的專利。假如你研究一下美國公司的局限,你會發明有高出50000家公司只有20至500名員工,個中大部門都有辦理數據問題的需求。所以大數據市場最大的需求并不是來自那些《財產》50強的大企業,而是來自《財產》500000強。為什么我們只存眷那些少數的破例,而忽視了那些大大都有數據處理懲罰需求,但既不是《財產》50強也沒有PB級局限數據的公司?
有時候我在想,假如我們改變了大數據的界說會產生什么?通凡人們用3V(velocity,volume,variety)來描寫大數據,,我們不妨換一個說法:“大數據是一種主觀狀態,它描寫的是一個公司的基本架構無法滿意其數據處理懲罰需求時的景象。”
這個界說大概沒有那么鮮明,但它必定會更靠近本日的現實。