數字技術是行業、機構發展的戰略制高點。達沃斯發布報告顯示,全球企業在數字化轉型中投入超萬億美元,僅1%達到或超過預期。醫療行業的數字化程度更是遠遠落后于其他行業,埃森哲(Accenture)認為其尚不足交通等行業的20%。
“這并不是說醫療行業沒有數據沉淀,虛擬主機,恰恰相反,醫療大數據量增長已達到了PB級,但可用性不夠。”宣武醫院信息中心主任梁志剛表示,缺乏大數據質量校驗和建設規范,使臨床面臨“無數據”可用的尷尬。
每個人一生會產生無限量的醫療健康數據,全球醫療數據量預計到2020年將達到2.314PB,但數據的可用性不高,現階段數據合格率能達到50%-60%的醫療機構在極少數。
“各行各業都在大談大數據,‘繁榮’的背后容易輕視追溯大數據的本源,尤其是忽略大數據為誰服務。”梁志剛指出,我們需要的不是“死的”數據,而是要挖掘它的利用價值。單純的數據匯集或是盲目的數據收集,不足以支撐大數據在決策支持、科研管理等方面的應用。
他認為,真正的大數據應具備三個特質:足夠大的量級、多樣性、有意義。但現階段收集的醫療大數據,多為過程數據,屬于離散的、不連貫的文本描述性數據,存在非結構化程度高,無法直接用于計算機分析和應用;數據錄入也不規范、不完整,有的數據甚至是沒有實際意義的,數據質量有缺陷。
“缺乏統一的標準規范、嚴格的校驗機制與平臺,沒有好的數據治理觀念,再多的數據也難以起到反哺臨床的作用。”他認為,只有做到數據的標準化、統一化和智能化,才能推動數據的臨床價值“變現”。
資本行業一直在描繪醫療大數據應用的藍圖;86%二級及以上醫療機構建立了規范化的電子病歷系統;作為政策引導方,國家業已出臺了數十條 “綱要”或“意見”,建立了醫療大數據初步利好的環境。
但具體如何落實到服務醫生、服務患者層面?梁志剛認為,目前尚沒有真正成功的大數據應用落地,其最大的壁壘在于缺乏標準和規范。
他介紹,政府層面雖搭建了大數據框架體系,如,居民健康檔案、數據中心建設等,也發布了電子病歷書寫規范,對醫療文書、出院小結等作出了明確定義。這些工作為數據采集和規范奠定了基礎,借助人工智能、深度學習技術的運算能力,免備案服務器,大數據存取、處理和分析看似已水到渠成了。
“但政策引導是戰略性的,缺乏對具體內容的內涵性定義,如果沒有執行也是‘紙面’上的。即便AI在某些領域能夠超越人類專家,技術始終繞不開路徑規范。”梁志剛說,建立大數據的行業規范和標準細則,需要首先建立數據采集的規范。
“通過對數據元素的值域進行定義,利用信息化手段表達出來,建立以病種為單位的專科數據集,梳理出真正有用的數據信息,這是我們目前最需要做的事。”在他看來,標準規范建設可以自下往上,由企業或者行業來梳理,政府層面可以牽頭組織,讓行業規范上升為國家標準,從而推廣至大范圍應用。
此外,大數據分析不能盯著“歷史數據”,不能停留在數據收集上,更重要的是規范“明天的數據”,做好診療過程的標準化,從源頭上對診療內涵質量和病歷內容進行規范,減少垃圾數據的產生。