數(shù)據(jù)采集管理 將kettle的采集過程進(jìn)行可視化管理,主要目的是為了能了解后臺數(shù)據(jù)抽取邏輯業(yè)務(wù)狀態(tài),如:業(yè)務(wù)邏輯的執(zhí)行是否成功、業(yè)務(wù)邏輯的執(zhí)行日志信息詳情等,本功能可以通過作業(yè)名稱、關(guān)聯(lián)的分析主題、執(zhí)行時間、完成時間、執(zhí)行狀態(tài)來過濾數(shù)據(jù);可以停止/開啟執(zhí)行數(shù)據(jù)抽取作業(yè);可以手動直接作業(yè),篩選作業(yè)抽取的時間;還可以直接進(jìn)行數(shù)據(jù)校驗功能。
基礎(chǔ)層:基礎(chǔ)層是指與醫(yī)院數(shù)據(jù)決策支持平臺有數(shù)據(jù)交互的系統(tǒng)中的數(shù)據(jù),主要是HIS、EMR、PACS、LIS等醫(yī)院業(yè)務(wù)系統(tǒng)。從業(yè)務(wù)系統(tǒng)抽取、轉(zhuǎn)換等過程后加載到數(shù)據(jù)中心;交換層:將kettle封裝到該中心管理系統(tǒng)中,將數(shù)據(jù)采集到數(shù)據(jù)中心,將整個采集過程及數(shù)據(jù)校驗可視化;數(shù)據(jù)中心管理層:建立標(biāo)準(zhǔn)化管理,數(shù)據(jù)中心自由構(gòu)建,將采集方式、數(shù)據(jù)模型等進(jìn)行統(tǒng)一管理,建立智能化數(shù)據(jù)管理平臺,利用分布式存儲技術(shù)將數(shù)據(jù)分為不同的數(shù)據(jù)中心存儲hbase數(shù)據(jù)庫中;數(shù)據(jù)門戶:統(tǒng)一數(shù)據(jù)輸出管理,針對前端應(yīng)用的需求,根據(jù)不同的需求類型、需求操作范圍、需求的數(shù)據(jù)范圍、需求操作流程進(jìn)行管理,對數(shù)據(jù)實現(xiàn)智能檢索功能;交互層:可將數(shù)據(jù)放到不同的媒介進(jìn)行展現(xiàn),同時可對接醫(yī)院公有云或區(qū)域公有云等。
數(shù)據(jù)中心管理系統(tǒng)建設(shè)
數(shù)據(jù)校驗管理 數(shù)據(jù)校驗主要是對抽取過來的數(shù)據(jù)進(jìn)行一致性及準(zhǔn)確性的校驗。
權(quán)限設(shè)置與用戶認(rèn)證:平臺對用戶應(yīng)用訪問進(jìn)行控制,只有包含在受控的用戶列表中的用戶才能瀏覽系統(tǒng)應(yīng)用,系統(tǒng)根據(jù)不同的用戶權(quán)限展示允許范圍內(nèi)的報表信息;用戶類型分組:為了控制平臺應(yīng)用服務(wù)的訪問權(quán)限,將系統(tǒng)用戶劃分為不同的類型,如:管理員、科研人員、管理者等。不同的用戶類型享用不同的應(yīng)用服務(wù),也就是對查詢信息擁有不同的訪問權(quán)限;數(shù)據(jù)對外管理:當(dāng)其他系統(tǒng)調(diào)用數(shù)據(jù)中心時,[請確認(rèn)修改]管理其數(shù)據(jù)去向、數(shù)據(jù)權(quán)限、數(shù)據(jù)安全;數(shù)據(jù)日志管理:對數(shù)據(jù)訪問痕跡,數(shù)據(jù)日志,數(shù)據(jù)修改,數(shù)據(jù)報表建立等進(jìn)行相應(yīng)管理;數(shù)據(jù)應(yīng)用類系統(tǒng):將數(shù)據(jù)相關(guān)應(yīng)用類產(chǎn)品實現(xiàn)統(tǒng)一的單點登錄,如科研管理、院長平臺、藥學(xué)管理、醫(yī)保控費、單病種管理等;首頁個性化設(shè)定:用戶可根據(jù)修改系統(tǒng)膚色及、可自由配置首頁、組合所關(guān)注的特定報表、特定功能菜單。
元數(shù)據(jù)管理 元數(shù)據(jù)是數(shù)據(jù)中心數(shù)據(jù)管理功能的基本,是提供數(shù)據(jù)追溯的最基本單位。元數(shù)據(jù)管理模塊需要按照標(biāo)準(zhǔn)去制定,有版本管理,所有的數(shù)據(jù)中心的建立都依賴于標(biāo)準(zhǔn)的元數(shù)據(jù)。用于定義字段名、字段內(nèi)部ID,字段類型等,國內(nèi)服務(wù)器租用 服務(wù)器托管,可內(nèi)置國家標(biāo)準(zhǔn)、省標(biāo)準(zhǔn)或是建立醫(yī)院內(nèi)部標(biāo)準(zhǔn),用戶整個數(shù)據(jù)中心設(shè)計的統(tǒng)一管理,同時為互聯(lián)互通提供數(shù)據(jù)標(biāo)準(zhǔn)。
創(chuàng)建數(shù)據(jù)校驗時維護(hù)字段包括:數(shù)據(jù)校驗名稱、校驗數(shù)據(jù)庫ID、校驗語句、源數(shù)據(jù)庫ID、源數(shù)據(jù)校驗語句。
數(shù)據(jù)集管理 數(shù)據(jù)集管理主要是管理由元數(shù)據(jù)組成的不同數(shù)據(jù)集,例如病人基礎(chǔ)信息、病人醫(yī)囑、病人收費等,主要應(yīng)用于國家、省等標(biāo)準(zhǔn)集管理,VPS租用 國內(nèi)服務(wù)器,管理相應(yīng)的版本、與元數(shù)據(jù)的關(guān)系等。
數(shù)據(jù)中心管理 可通過數(shù)據(jù)集或數(shù)據(jù)元自動建立數(shù)據(jù)中心表,同時對表中元數(shù)據(jù)的標(biāo)準(zhǔn)、數(shù)據(jù)類型、來源、來源表、來源字段和目標(biāo)、目標(biāo)表、目標(biāo)字段等進(jìn)行管理,方便用戶追溯數(shù)據(jù)的來源及自定義表單。醫(yī)院可通過數(shù)據(jù)中心管理查詢到醫(yī)院數(shù)據(jù)標(biāo)準(zhǔn)化程度,同時為數(shù)據(jù)模型提供來源。
數(shù)據(jù)模型管理 利用Saliku在數(shù)據(jù)中心基礎(chǔ)上建立多個數(shù)據(jù)應(yīng)用模型,同時將其模型管理起來,管理模型的關(guān)聯(lián)關(guān)系,模型內(nèi)部指標(biāo)集,定義指標(biāo)來源、出處、規(guī)則、含義等,為規(guī)劃指標(biāo)統(tǒng)計規(guī)則,為規(guī)范指標(biāo)的統(tǒng)計規(guī)則及含義,對指標(biāo)統(tǒng)計進(jìn)行流程化管理,可在該平臺上申請指標(biāo)定義及統(tǒng)計規(guī)則,由專人負(fù)責(zé)審核,完成整個數(shù)據(jù)流的管理工作,用戶在通過數(shù)據(jù)模型自由構(gòu)建報表時可查詢該指標(biāo)列規(guī)則、出處、內(nèi)容,同時可點擊校驗該指標(biāo)數(shù)據(jù)是否抽取完整。
數(shù)據(jù)中心管理組件 建立數(shù)據(jù)中心管理組件,包括基礎(chǔ)資源庫、元數(shù)據(jù)管理組件、值域代碼管理組件、數(shù)據(jù)集管理組件、數(shù)據(jù)抽取及監(jiān)控組件、數(shù)據(jù)檢驗組件、模型管理組件、指標(biāo)管理組件等,為數(shù)據(jù)中心的各種重要功能提供可視化統(tǒng)一管理工具。
標(biāo)準(zhǔn)字典表的基本信息管理包括:類別、元數(shù)據(jù)類型、值域名稱、值域標(biāo)識符、定義等,用戶可建立醫(yī)院內(nèi)部標(biāo)準(zhǔn)字典,或是內(nèi)置國家頒布,在管理過程中建立標(biāo)準(zhǔn)對照功能主要是將醫(yī)院業(yè)務(wù)系統(tǒng)與數(shù)據(jù)中心定義標(biāo)準(zhǔn)進(jìn)行值的對照,亦可通過該平臺發(fā)布同步機(jī)制,影響業(yè)務(wù)系統(tǒng)按照規(guī)定的字典標(biāo)準(zhǔn)統(tǒng)一更新。
基礎(chǔ)資源庫 包括整個平臺從各個業(yè)務(wù)系統(tǒng)(HIS、EMR、LIS、PACS)中抽取并集成的各類標(biāo)準(zhǔn)數(shù)據(jù)信息,例如運營數(shù)據(jù)中心、臨床數(shù)據(jù)中心、科研數(shù)據(jù)中心,采用NoSQL數(shù)據(jù)庫存儲方式。
建立數(shù)據(jù)中心管理,規(guī)范數(shù)據(jù)中心設(shè)計,管理采集來源,將醫(yī)院各業(yè)務(wù)系統(tǒng)數(shù)據(jù)有序有量的加載到數(shù)據(jù)中心庫中,為數(shù)據(jù)類應(yīng)用服務(wù)提供相應(yīng)基礎(chǔ),該平臺利用大數(shù)據(jù)技術(shù)[3]Hadoop中的分布式文件存儲(HDFS)系統(tǒng)保存數(shù)據(jù)以及分布式實時處理框架(Spark)計算平臺來實現(xiàn)。