如果IT 顧問告訴您備份數(shù)據(jù)是您的技術(shù)團(tuán)隊(duì)做好的最重要的事情之一,您可能會(huì)點(diǎn)頭表示同意。但是,如果他們建議您的臟數(shù)據(jù)在使用之前需要清理呢?像“臟”這樣一個(gè)簡單的形容詞可能會(huì)讓你停下來,還有一些關(guān)于“數(shù)據(jù)”的其他術(shù)語你可能也不認(rèn)識(shí)。
數(shù)據(jù)是信息時(shí)代的命脈。它被觀察、收集、組織和分析,它允許企業(yè)競(jìng)爭利潤和繁榮。它有多種形式,每一種都是獨(dú)一無二的,而且通常通過添加一個(gè)簡單的描述性詞來生動(dòng)地命名。因此,我們認(rèn)為一個(gè)簡短的詞匯表是為了幫助您了解一些新的數(shù)據(jù)流行語以及它們可能如何影響您的業(yè)務(wù)。
不同類型的數(shù)據(jù)及其含義
小數(shù)據(jù)
如果“大數(shù)據(jù)”是關(guān)于強(qiáng)大的機(jī)器、龐大的數(shù)據(jù)庫和復(fù)雜的分析,那么它的小兄弟“小數(shù)據(jù)”是關(guān)于人的。小數(shù)據(jù)采用按比例縮小的數(shù)據(jù)挖掘方法,依賴于社交媒體之類的東西來獲取重要信息。存檔也更簡單,因?yàn)椴恍枰獜?fù)雜的中央數(shù)據(jù)倉庫。
慢數(shù)據(jù)
“慢數(shù)據(jù)”的概念似乎有點(diǎn)違反直覺,因?yàn)樘幚?1 和 0 意味著事情發(fā)生得很快。然而,有些信息實(shí)際上獲取得更慢。以極地冰蓋為例,那里的東西確實(shí)以冰川的速度移動(dòng)。由于此類數(shù)據(jù)不需要頻繁分析,因此適合在安全數(shù)據(jù)湖中以本機(jī)格式備份。
快速數(shù)據(jù)
我們猜你知道接下來會(huì)出現(xiàn)這個(gè)流行詞,而且它可能正是你認(rèn)為的那樣。“快速數(shù)據(jù)”是指快速發(fā)生的數(shù)據(jù)事件——例如每秒數(shù)千次——例如金融代碼或電子傳感器。能夠立即采取行動(dòng)至關(guān)重要,因此必須立即將其存放在穩(wěn)定、易于訪問的位置。
暗數(shù)據(jù)
簡而言之,“暗數(shù)據(jù)”只不過是沒有被使用的日常運(yùn)營數(shù)據(jù)。它通常指的是客戶通話記錄、競(jìng)爭對(duì)手的價(jià)格波動(dòng)或網(wǎng)站訪問者趨勢(shì)等形式的未經(jīng)分析的信息。它還可以包括不再可訪問的數(shù)據(jù),例如當(dāng)存儲(chǔ)設(shè)備過時(shí)時(shí)。您的企業(yè)可以使用旨在整理數(shù)據(jù)的軟件將這些冗余、過時(shí)或隱藏的數(shù)據(jù)暴露出來。
臟數(shù)據(jù)
說到整理,我們終于有了“臟數(shù)據(jù)”。雖然不像骯臟的舞蹈或骯臟的馬提尼酒那樣具有挑釁性,但它確實(shí)有引起焦慮的傾向。但它實(shí)際上對(duì)你的數(shù)據(jù)倉庫沒有害處;它只是指在“清理”之前的數(shù)據(jù)集,例如包含重復(fù)、拼寫錯(cuò)誤或格式錯(cuò)誤的潛在客戶列表。關(guān)鍵是確保在將其投入生產(chǎn)之前對(duì)其進(jìn)行整理。