暗數(shù)據(jù)是企業(yè)在日常運(yùn)營中收集、存儲和處理的資料,但通常不會用于可能有益的目的。暗數(shù)據(jù)有多種方法影響企業(yè)分析和使用數(shù)據(jù)的方式。
1.暗數(shù)據(jù)有助于進(jìn)一步研究當(dāng)前的歷史數(shù)據(jù)
例如,美國和其他一些國家公共資助研究的一部分收集的數(shù)據(jù)必須保存在公共數(shù)據(jù)庫中。然而,一項(xiàng)研究調(diào)查了在20世紀(jì)70年代和80年代收集的關(guān)于浮游動物的材料是如何在該技術(shù)不可用于公布該數(shù)據(jù)的時(shí)候存在的。
科學(xué)家們知道,這種黑暗的數(shù)據(jù)可以提供有關(guān)海洋自過去幾代由于氣候變化而發(fā)生變化的寶貴信息。因此,有一個(gè)現(xiàn)代化的努力來挖掘那些黑暗的數(shù)據(jù),并用它來激勵(lì)正在進(jìn)行的研究。
2.它使企業(yè)思考暗數(shù)據(jù)如何適應(yīng)GDPR法規(guī)
2018年5月,“通用數(shù)據(jù)保護(hù)條例”(GDPR)將生效,并對所有存儲和收集歐盟公民數(shù)據(jù)的企業(yè)產(chǎn)生影響。
其中最有趣的組成部分是消費(fèi)者可以行使所謂的被遺忘權(quán),并要求企業(yè)在特定情況下刪除其數(shù)據(jù)。但是,如果企業(yè)繼續(xù)忽略暗數(shù)據(jù),那么履行這些要求可能會變得耗時(shí)且成本高昂。
IBM公司在2016年收集的統(tǒng)計(jì)數(shù)據(jù)發(fā)現(xiàn),所有數(shù)據(jù)中有80%是暗數(shù)據(jù),上非結(jié)構(gòu)化的變體。毫不奇怪,分析人士指出,在GDPR法規(guī)下,如果在違規(guī)期間暗數(shù)據(jù)泄露,除了客戶要求刪除他們暗數(shù)據(jù)之外,沒有關(guān)注暗數(shù)據(jù)的企業(yè)可能面臨GDPR罰款的風(fēng)險(xiǎn)。這將遇到明顯的挑戰(zhàn)。
3.它為創(chuàng)新技術(shù)創(chuàng)造更多的用途
數(shù)據(jù)虛擬化是連接企業(yè)所有數(shù)據(jù)源并將其呈現(xiàn)在統(tǒng)一儀表板中的流程,可讓人們實(shí)時(shí)或盡可能接近地查看編譯的材料。它還為數(shù)據(jù)處理帶來了靈活性,并且一些產(chǎn)品廠商認(rèn)為他們的數(shù)據(jù)虛擬化解決方案可以為暗數(shù)據(jù)帶來可見性。
人工智能(AI)可以促進(jìn)幫助企業(yè)開始構(gòu)建暗數(shù)據(jù)結(jié)構(gòu)化和可用性,這是另一項(xiàng)技術(shù)進(jìn)步。當(dāng)企業(yè)依靠人工智能來揭示暗數(shù)據(jù)時(shí),相關(guān)算法和自然語言處理可能使得這項(xiàng)任務(wù)比沒有這種技術(shù)的工作人員更容易實(shí)現(xiàn)。
4.它有助于企業(yè)更多地了解人
Deloitte發(fā)布的名為“暗數(shù)據(jù)分析:照亮非結(jié)構(gòu)化數(shù)據(jù)隱藏在2017年技術(shù)趨勢中的機(jī)會”的報(bào)告討論了一些醫(yī)療設(shè)施如何使用暗數(shù)據(jù)采取更全面的病人護(hù)理方法。
例如,在咨詢期間,醫(yī)生可以采取手寫筆記并錄音,并在電子郵件或基于云計(jì)算的應(yīng)用程序中做筆記。收集所有信息并使其可用,可以改善治療和見解,減少不正確的診斷或干預(yù)措施以及更合適的選擇。
醫(yī)療保健領(lǐng)域的人們也希望暗數(shù)據(jù)能夠分析人口群體。以前未使用的數(shù)據(jù)可能會預(yù)測未來的需求和疾病趨勢,最終可能影響個(gè)人與醫(yī)療專業(yè)人員的交互,并幫助當(dāng)?shù)匦l(wèi)生部門了解其員工最有可能遇到的情況。
德勤公司報(bào)告重點(diǎn)關(guān)注正在調(diào)查暗數(shù)據(jù)如何幫助他們更多了解客戶需求的零售商。獲得許可后,一家名為StitchFix的在線服裝訂購公司進(jìn)行了一項(xiàng)客戶調(diào)查,以獲取關(guān)于服飾偏好的詳細(xì)信息,但隨后查看受訪者的社交媒體Feed和Pinterest董事會以挖掘更多數(shù)據(jù)。
大多數(shù)企業(yè)已經(jīng)意識到他們擁有可訪問的內(nèi)容,可幫助他們了解客戶。通過擴(kuò)大他們的方法并查看暗數(shù)據(jù),他們可以開發(fā)一個(gè)完整的受眾圖片并學(xué)習(xí)那些本來不為人知的東西。例如,directadmin安裝,暗數(shù)據(jù)可以通過強(qiáng)調(diào)未在結(jié)構(gòu)化數(shù)據(jù)中捕獲的模式來提供強(qiáng)烈地表明產(chǎn)品概念不適合市場需求的內(nèi)容。
5.如果遺留非結(jié)構(gòu)化數(shù)據(jù),它會增加數(shù)據(jù)安全風(fēng)險(xiǎn)
企業(yè)可能不知道暗數(shù)據(jù)的價(jià)值至關(guān)重要,但這并不意味著黑客并不關(guān)注。網(wǎng)絡(luò)犯罪專家表示,黑客攻擊策略發(fā)生了變化,導(dǎo)致網(wǎng)絡(luò)犯罪分子比以往任何時(shí)候都更加明確地查找到非結(jié)構(gòu)化數(shù)據(jù)。
還有其他與非結(jié)構(gòu)化數(shù)據(jù)相關(guān)的安全風(fēng)險(xiǎn),歐洲服務(wù)器租用 云服務(wù)器,例如無法知道它包含什么以及組織中的哪些員工應(yīng)該訪問它。如果出現(xiàn)意外的情況,這兩個(gè)問題都可能使企業(yè)承擔(dān)責(zé)任。
此外,企業(yè)持有的數(shù)據(jù)可能包括其提供的法庭傳票提供的敏感細(xì)節(jié),但如果將需求數(shù)據(jù)歸類為暗數(shù)據(jù),并不總是很容易找到。例如,一家公司花費(fèi)了600萬美元搜索法院案件所需的暗數(shù)據(jù),說明如何優(yōu)先考慮以實(shí)際方式對暗數(shù)據(jù)進(jìn)行分類的方式有多重要。
通過制定調(diào)查暗數(shù)據(jù)的計(jì)劃,而不是像不存在那樣行事,企業(yè)可以采取主動而的策略。否則,他們可能錯(cuò)過機(jī)會,并且遇到不必要的復(fù)雜情況。