數據規范是指對企業核心數據進行有關存在性、完整性、質量及歸檔的測量標準,為評估企業數據質量,并且為手動錄入、設計數據加載程序、更新信息以及開發應用軟件提供的約束性規則,數據規范一般包括數據標準、數據模型、業務規則、元數據、主數據和參考數據。
企業只有建立了完整的大數據治理體系,保證數據的質量,才能夠真正有效地挖掘企業內部的數據價值,對外提高競爭力。
大數據治理,即基于大數據的數據治理。大數據,一般指符合4V特征的數據,包括社交數據、機器數據等,大數據對傳統數據治理工作帶來很多的擴展,在政策/流程上,大數據治理應覆蓋大數據的獲取、處理、存儲、安全等環節,需要為大數據設置數據管理專員制度;需考慮大數據與主數據管理能力的集成,需要對大數據做定義,統一主數據標準;在數據生命周期管理各階段,如數據存儲、保留、歸檔、處置時,要考慮大數據保存時間與存儲空間的平衡,大數據量大,因此應識別對業務有關鍵影響的數據元素,檢查和保證數據質量。此外,在隱私方面,應考慮社交數據的隱私保護需求,制定相應政策,還要將大數據治理與企業內外部風險管控需求建立聯系。
圖1 DAMA數據管理職能框架
首先,高質量數據是企業業務創新、管理決策的基礎。隨著互聯網企業對其他各行業的沖擊,加劇了市場的競爭,許多企業面臨收入增速放緩、利潤空間逐步縮小的局面,過去單純的外延式增長已經難以為繼。因此,必須向外延與內涵相結合的增長方式轉變,未來效益的提升很大程度上要依靠企業的內部挖潛實現,這從客觀上對企業的創新能力提出了更高的要求,而提升企業內部數據管理的精細化水平,是企業開展業務創新和管理決策的重要基礎,能夠為企業創造巨大效益。
數據治理軟件:工欲善其事,必先利其器