隨著信息技術的高速發展,各用戶單位業務系統經過多年沉淀,積累了大量個人隱私數據和企業信息。海量數據除了內部流轉,還需要進行外部“共享”,這亦是國家大數據發展戰略規劃的需求和前提。如何保證數據在產生、交換、共享等場景下的安全可用?這讓數據脫敏安全技術成為熱門。
《網絡安全法》的正式實施,數據脫敏被納入法規遵從的需求。《網絡安全法》要求:數據流動過程中應重視保護個人隱私、社保信息、資產信息、醫療信息等敏感信息的安全。為滿足這一要求,數據共享時需要使用數據脫敏技術。特別是當數據應用于開發、測試、培訓等環境時,安全風險較大,使用真實數據將臨嚴重數據泄露的風險。
數據脫敏又稱數據去隱私化或數據變形,是在給定的規則、策略下對敏感數據進行變換、修改的技術機制,能夠在很大程度上解決敏感數據在不可控環境中使用的問題。國內銀行、通信運營商等是最早開始使用數據脫敏工具的單位,多以靜態脫敏為主。
市面上有諸多靜態脫敏產品,如何做挑選?本文將從這些脫敏產品的技術路線進行分析,從使用效果出發,淺析各種技術在脫敏過程中使用效果上存在的差異,呈現產品真正能實現的功能和價值。希望能為廣大用戶在數據脫敏產品的選型上提供參考。
數據脫敏第一步,需要獲得數據庫中的數據。如何獲得數據主要有以下幾種方式:
1. 代理軟件
使用代理軟件,部署在數據庫上從數據庫讀取數據。這種方式的脫敏產品對用戶方來說是侵入式的,只有極少數產品才這樣使用。市面上數據備份廠商的數據脫敏產品會采用這種方式,因為利用備份軟件客戶端作為數據脫敏的數據采集工具使用,速度較快。
2. 數據庫開發接口
這種針對不同的數據庫開發接口方式的有點在于數據采集速度較快,市面上大部分脫敏產品采用此種方式。這種采集方式的缺點也很明顯,數據庫類型太多,脫敏產品支持的數據庫類型與版本都會受限制。如果用戶將來升級了數據庫版本,國外域名 免費域名,除非脫敏廠商也花精力開發升級版本,否則采購的脫敏產品可能無法繼續支持。
3. ETL技術
這種采集技術的優勢是兼容性大,ETL工具兼容的數據庫類型是最全面的。當然這個方式也有弱點,由于不是專門針對特定數據庫類型開發,在沒有強大的ETL技術積累的情況下,采集數據的速度一般。從國外脫敏廠商來看,具備有一定ETL技術積累優勢大多采用此種技術,如:Informatica 。而國內脫敏廠商中,大多數廠商主業并不是大數據處理,沒有ETL工具的技術能力而很少采用。
二、數據落地與否
數據落地是指數據脫敏過程中,數據需要保存到脫敏系統后再進行脫敏。數據落地的好處是,獲得了需要脫敏的全部數據后再脫敏,對數據關系、業務關聯方面容易處理與實現。但問題是,數據落地需要脫敏系統也具有數據源同樣大小的存儲空間,對脫敏系統的存儲要求較高,同時進行多業務數據源脫敏的情況下,還需要對接存儲系統,不僅硬件成本高,還存在安全困擾。
數據脫敏從信息安全的職責分離的要求下出發,脫敏系統的管理者為安全管理員,將DBA接觸敏感數據場景剝離出來,同時安全管理員不具有DBA權限也無法查看全部的敏感數據。但在數據落地的情況下,安全管理員可以從數據脫敏系統內獲得全部敏感數據,這就違背了職責分離的初衷。
市面上大部分產品不會采用此種數據落地方式脫敏,新加坡云主機 香港云主機,只有少數由于沒有ETL技術,也沒有針對不同數據庫開發接口,擁有備份技術積累的脫敏廠商會使用這種脫敏方式。
三、脫敏算法的復雜程度