如何將散落的、非標準化的、復雜的醫(yī)療大數(shù)據(jù)集合起來并可使用、可計算,需要做大量且復雜的工作。當然這并非不可能實現(xiàn),但需要成本及時間。
人類已經(jīng)全面進入大數(shù)據(jù)時代。而醫(yī)療與大數(shù)據(jù)的“聯(lián)姻”一直被人們所期待,但遺憾的是大部分醫(yī)療數(shù)據(jù)仍處于“沉睡”狀態(tài)。如何真正進行實踐,讓大數(shù)據(jù)為醫(yī)生、為患者服務,賦能醫(yī)療新形態(tài),依然是擺在我們面前的一道難題。
專門數(shù)據(jù)庫與大數(shù)據(jù)平臺相配合
2016年,國務院發(fā)布《關于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見》,要求加快建設統(tǒng)一權威、互聯(lián)互通的人口健康信息平臺,推動健康醫(yī)療大數(shù)據(jù)資源共享開放;同年,《“健康中國2030”規(guī)劃綱要》提出,消除數(shù)據(jù)壁壘,建立和完善全國健康醫(yī)療數(shù)據(jù)資源目錄體系。2017 年,國務院發(fā)布《“十三五”深化醫(yī)藥衛(wèi)生體制改革規(guī)劃》,提出健全基于互聯(lián)網(wǎng)、大數(shù)據(jù)技術的分級診療信息系統(tǒng);應用藥品流通大數(shù)據(jù),拓展增值服務深度和廣度。
醫(yī)療大數(shù)據(jù)的應用早已突破診療過程,與整個健康體系密切相關,對藥物研發(fā)、健康管理和公共衛(wèi)生服務等環(huán)節(jié)都具有重要意義。如何實現(xiàn)各個專門數(shù)據(jù)庫與大數(shù)據(jù)平臺之間的聯(lián)通與配合,打通數(shù)據(jù)“孤島”,是擺在醫(yī)療大數(shù)據(jù)實踐面前的一道鴻溝。
北京大學腫瘤醫(yī)院院長、教授季加孚以美國和日本的案例對此進行了分析。他指出:“目前國際大型腫瘤數(shù)據(jù)庫大致分為兩類:基于人群的數(shù)據(jù)庫和基于醫(yī)院系統(tǒng)的數(shù)據(jù)庫。美國SEER(監(jiān)測、流行病學和結果)數(shù)據(jù)庫和日本癌癥登記數(shù)據(jù)庫屬于前者,而美國的NCDB(國家癌癥數(shù)據(jù)庫)和日本的NCD(國家臨床數(shù)據(jù)庫)屬于后者。”
比較來看,不同類型數(shù)據(jù)庫所能實現(xiàn)的效果不同。季加孚分析說:“基于醫(yī)院的數(shù)據(jù)庫,更符合臨床需求,可為患者診斷與治療提供更多有針對性的信息。但是這類數(shù)據(jù)庫存在就診偏倚,并不能很好地反映人口學分層的特點,例如NCDB和SEER數(shù)據(jù)庫在某些癌種的種族、年齡分布上存在差異。基于人群的數(shù)據(jù)庫流行病學意義更加明確,能為國家戰(zhàn)略制定提供更多依據(jù)。通常兩種形式數(shù)據(jù)庫間的相互融合、數(shù)據(jù)共享能起到1+1>2的作用。”
那么不同數(shù)據(jù)庫之間是如何配合的呢?以日本NCD和癌癥登記數(shù)據(jù)庫為例,NCD主要收集詳盡的圍術期數(shù)據(jù),而隨訪數(shù)據(jù)的積累一定程度上需依靠癌癥登記數(shù)據(jù)庫完成。由于《癌癥登記法》的強制性和廣泛覆蓋,服務器租用 免備案服務器,腫瘤登記處會收集腫瘤患者的預后信息。這些信息會由登記處返回到提供信息的醫(yī)院,NCD即可通過醫(yī)院獲取腫瘤相關預后信息。
乳腺癌、胃癌、食管癌、肝癌等專病數(shù)據(jù)庫也逐步并入NCD。此外,NCD還和DPCD(日本診斷程序組合數(shù)據(jù)庫)等醫(yī)療保險數(shù)據(jù)庫互通,開展衛(wèi)生經(jīng)濟學相關研究。與之類似,美國SEER數(shù)據(jù)庫與醫(yī)療保險合作,形成了SEER-Medicare數(shù)據(jù)庫。
跨界合力才能打通數(shù)據(jù)“孤島”
在大數(shù)據(jù)領域從業(yè)近十年的架構師沈辰在接受采訪中告訴《中國科學報》,大數(shù)據(jù)具有所謂的“4V”屬性,即大規(guī)模(volume)、多樣性(variety)、產(chǎn)生和變化速度快(velocity)和價值密度低(value)。
“醫(yī)療大數(shù)據(jù)也是一樣,如何將這些散落的、非標準化的、復雜的數(shù)據(jù)集合起來并可使用、可計算,需要做大量且復雜的工作。當然這并非不可能實現(xiàn),但需要成本及時間。”
南京醫(yī)科大學接受第二附屬醫(yī)院 腸病中心主任張發(fā)明在采訪中提出,醫(yī)療行為過程中會產(chǎn)生大量的數(shù)據(jù),而將這海量的數(shù)據(jù)進行處理,真正為醫(yī)療服務,大部分醫(yī)院目前不具備這樣的能力和經(jīng)驗,需要大型數(shù)據(jù)服務商的支持。
上海第九人民醫(yī)院在2013年搭建了基于臨床數(shù)據(jù)倉庫(CDR)大數(shù)據(jù)集成平臺,其合作對象是微軟中國。通過對所有的業(yè)務數(shù)據(jù)庫的表單進行系統(tǒng)整合與深度挖掘,實現(xiàn)對醫(yī)院的內(nèi)部運營管理、醫(yī)療質(zhì)量控制、醫(yī)院感染管理、績效考核與分配等實時數(shù)據(jù)分析管理,并且整合了單病種臨床數(shù)據(jù)庫與樣本庫、基因庫關聯(lián)的臨床科研信息系統(tǒng)在臨床研究方面的應用。
杭州健培科技有限公司是一家從事醫(yī)學影像大數(shù)據(jù)挖掘和醫(yī)療人工智能技術的企業(yè),開發(fā)了閱片機器人“啄醫(yī)生”。董事長兼CEO程國華在創(chuàng)業(yè)初期就親身經(jīng)歷過醫(yī)生與科技人員在思維與工作方式方法上的碰撞,他在采訪中告訴《中國科學報》:“醫(yī)療大數(shù)據(jù)的應用絕不單純是醫(yī)療領域的事情,而是一項跨學科的問題。”