在座的喬書記、代會長以及各位同仁,大家上午好,很高興參加今天的數據資產管理大會,美國站群服務器 亞洲服務器,我主要做信息化,做過電子政務、電子商務,也做過工業互聯網,我前些年也研究了關于主數據管理的問題,我2009年開始研究主數據,隨著大數據的日益普及,我一直在思考一個問題,小數據是什么?所以我對這個問題研究了很長的時間,也收集了當前關于小數據的一些認識,但是我覺得都不是太滿意,因為到現在為止沒有一篇專門的文章討論什么叫小數據。人們在談論小數據的時候只在大數據的話語體系里面提到說應該有一個小數據的說法,但是至于怎么認識、怎么樣界定,特別是在小數據跟大數據的關系以及這個小數據到底應該怎么樣對我們的大數據產業發展以及管理制度建設方面帶來哪些影響,一直沒有一個合適的文章或研究成果。所以我專門就拿這個題目放在我的電腦桌面,這篇文章我放了三年,在今年下半年終于把它寫完了,今天借助隆重的會議現場向大家匯報一下我對這個問題的一些思考。
主數據這幾年是一個概念,主數據也有國際標準ISO8000,DAMA國際在走出去的建設推廣方面做了很多的理論,也出版了DAMA國際的主數據是一個重要的內容。我原來在2009年的時候做國家標準化,當時特別關注到我們認識基礎信息資源主數據是我們認識的一個基本的工具,這里面我對主數據做了一個研究。
12月13日,2018數據資產管理大會在北京國家會議中心舉行。本次大會由中國信息通信研究院、中國通信標準化協會(CCSA)主辦,CCSA TC601大數據技術標準推進委員會承辦,中國IDC圈協辦。
為了貫徹“行動綱要”,國家也出臺了很多的政策措施,地方也成立了相應的大數據的管理機構,最近這幾年來國家圍繞促進大數據發展所制定的一些重大的政策文件,從這些文件里面來看,大數據已經提到了國家發展的戰略層面了,但是我們對于這些文件里面我們找不到小數據,盡管一些文章或者一些報道、一些專家的說法里面會經常提到小數據,但是在我們的文章、文件里面一直沒有一個合適的界定,所以我覺得討論小數據其實是很有重要的意義的,特別是小數據跟我們原來的信息資源管理或者信息資源開發利用這些概念和政策有什么關系,因為大數據好像是一個突然來到的概念,而且大家好像覺得大數據是萬能的,可以解決一切數據處理的問題。小數據又到底起什么作用呢?所以這應該是我們討論這個問題的關鍵出發點。
我們來看一下要認識小數據必須解決幾個問題,一個是現在大家的說法我做了一些收集,有三種典型觀點,一個是小數據指零星的弱信號,第二是小數據是指結構化的采樣數據,從采樣來看一般是抽取1-2%或者5%的小樣數據來做整理和評判,另外還有一種小數據是指數據容量比較小的那些數據。但是我覺得這些說法對于我們認識大數據仍然不足以作為一個理論化的概念或者體系去構建,我覺得要討論小數據必須明確三個前提:一是人們采集、加工海量數據的時候,通常都是具有某種特定目的的;二是要體現某種價值,數據本身必須能夠表述一個完整的信息;三是完整的信息應該包含明確的主體、客體和行為。這是我們構建小數據的時候首先必須具備的一個基本的前提。
國務院發展研究中心李廣乾
主數據對于其他數據的關系,我做了一個劃分,業務數據就是我們去辦業務的時候所留下的數據的信息記錄都算業務數據,這就包括主數據和交易數據,交易數據是每次去做什么事情的時候的一種特定的法定的依據產生的過程的一種記錄,這是我對這些數據之間的關系的認識。
在大數據中小數據是非常重要的一個內容,要正確地認識大數據就必須把小數據認識清楚,只有認識清楚了小數據,我們對于大數據才能有一個科學、合理的、正確的認識,所以小數據對于我們認識大數據是一個基礎性的工作。今后對于我國來說,為了促進大數據產業發展,應該充分地借鑒應用小數據的一種基本的理論框架,深化我們對于大數據產業的管理或者說應用。