在“數(shù)據(jù)**”的時代背景下,世界逐漸被數(shù)據(jù)所“淹沒”,隨之而來的“大數(shù)據(jù)”更是滲透到人類生產(chǎn)、生活的各個領(lǐng)域,推動著新一波的技術(shù)***,在這一波時代大潮中,每一個醫(yī)療工作者迫切關(guān)心的是醫(yī)療行業(yè)如何運(yùn)用“大數(shù)據(jù)”這一***性的技術(shù)。2017年3月8日由中國數(shù)字醫(yī)療網(wǎng)(HC3i)、中關(guān)村互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟移動醫(yī)療專委會主辦的“西部醫(yī)院信息化大會”上來自北京大學(xué)腫瘤醫(yī)院(以下簡稱“北大腫瘤醫(yī)院”)的信息中心工程師王立軍,從醫(yī)療的角度分享了大數(shù)據(jù)在醫(yī)院中的實(shí)際應(yīng)用。
北京大學(xué)腫瘤醫(yī)院信息部工程師 王立軍
北大腫瘤醫(yī)院作為一家集醫(yī)、教、研于一體,預(yù)防、治療、康復(fù)相結(jié)合的三級甲等腫瘤??漆t(yī)院,具有較高的醫(yī)療技術(shù)水平和較強(qiáng)的醫(yī)療服務(wù)能力。在2010年被批準(zhǔn)為教育部“惡性腫瘤發(fā)病機(jī)制及轉(zhuǎn)化研究”重點(diǎn)實(shí)驗(yàn)室,醫(yī)院現(xiàn)有29個臨床科室,14個醫(yī)技科室,27個病區(qū)790張病床,年住院人數(shù)4萬余人次,年門診量45萬余人次。如何讓數(shù)據(jù)發(fā)揮更大的作用,為腫瘤患者更好的服務(wù),成為信息中心不斷思考的問題,在一系列的嘗試過程中,王立軍對于“大數(shù)據(jù)思維”,也有了獨(dú)到的見解。
大數(shù)據(jù)思維更重要
眾所周知,大數(shù)據(jù)具有量大、多樣、快速、高值的特點(diǎn)?!皬拇髷?shù)據(jù)的特點(diǎn)來看,醫(yī)院當(dāng)前沒有完全意義上的大數(shù)據(jù);大數(shù)據(jù)技術(shù)是傳統(tǒng)IT的突破性提高,但說不上***性創(chuàng)新”,北大腫瘤醫(yī)院信息中心工程師王立軍這樣說道。
既然醫(yī)院現(xiàn)階段根本沒有真正意義的大數(shù)據(jù),為什么大家都在談醫(yī)療大數(shù)據(jù)?其實(shí)對于醫(yī)療大數(shù)據(jù)來說,不能單純只靠量大來衡量,真正的價(jià)值在于運(yùn)用醫(yī)療大數(shù)據(jù)的技術(shù)實(shí)現(xiàn)歷史醫(yī)療資源的再利用,并借助大數(shù)據(jù)的思維和方法進(jìn)行研究,完成過去傳統(tǒng)思維、方法、技術(shù)無法完成的任務(wù),解決過去無法解決的問題,使得數(shù)據(jù)加以利用,形成從量變到質(zhì)變的過程,同時通過多維度的分析研究,實(shí)現(xiàn)對醫(yī)療數(shù)據(jù)的高效檢索、后結(jié)構(gòu)化、分析計(jì)算。
科研數(shù)據(jù)應(yīng)用--當(dāng)今醫(yī)院的痛點(diǎn)
與普通的綜合醫(yī)院相比,專科醫(yī)院在各方面都有其自身的特點(diǎn),北大腫瘤醫(yī)院的臨床數(shù)據(jù)同樣存在一些特殊性:
第一,復(fù)診率高,治療周期記錄完整(跟隨病人多年診療次的過程);
第二,隨訪數(shù)據(jù)完善(以治療次為時間軸,同時搜集門診數(shù)據(jù)與住院數(shù)據(jù))
對于腫瘤醫(yī)院來說,病人出院后,醫(yī)院需要對病人的復(fù)**況進(jìn)行實(shí)時監(jiān)測,因此如果把每個過程、每個階段聯(lián)系起來,傳統(tǒng)的技術(shù)則無法實(shí)現(xiàn),此時就需要醫(yī)院利用大數(shù)據(jù)來實(shí)現(xiàn)。
經(jīng)過醫(yī)院信息化20余年的發(fā)展,臨床所需的單一患者數(shù)據(jù)已基本能滿足,但是臨床數(shù)據(jù)應(yīng)用由于數(shù)據(jù)質(zhì)量、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)挖掘等問題,還處于試驗(yàn)階段,無法規(guī)模化應(yīng)用于臨床。近年來隨著醫(yī)院科研任務(wù)及要求的增加,對科研數(shù)據(jù)獲取的準(zhǔn)確性及效率要求越來越高,傳統(tǒng)的手工或半手工獲取科研數(shù)據(jù)的方式已不能滿足要求,因此解決醫(yī)院的科研數(shù)據(jù)問題,成為醫(yī)院IT人員的重要任務(wù)。
五大臨床科研探索路徑實(shí)踐
面對當(dāng)前科研存在的二次錄入數(shù)據(jù)效率低,增加臨床大夫負(fù)擔(dān)、書寫效率低及使用率低、臨床醫(yī)學(xué)科研項(xiàng)目數(shù)據(jù)分散、數(shù)據(jù)不延續(xù)等問題,北大腫瘤醫(yī)院通過以下五個臨床科研探索路徑進(jìn)行嘗試實(shí)踐:
第一,篩選入組患者,二次錄入。
傳統(tǒng)的“到信息部或統(tǒng)計(jì)室通過數(shù)據(jù)查詢工具篩選符合條件的入組患者列表,查詢病案或電子病歷記錄,將符合條件的數(shù)據(jù)錄入數(shù)據(jù)庫,最后對數(shù)據(jù)庫進(jìn)行分析”。這種方法的缺點(diǎn)是數(shù)據(jù)收集效率低下、準(zhǔn)確性差。面對這個問題,醫(yī)院思考通過結(jié)構(gòu)化病歷搜集數(shù)據(jù),并因此做了第二階段的嘗試。
第二,結(jié)構(gòu)化電子病歷。
病歷模板結(jié)構(gòu)化采集數(shù)據(jù)是業(yè)內(nèi)共識,然而易增加臨床大夫負(fù)擔(dān),且后期利用仍需要臨床大夫進(jìn)行二次整理,書寫效率低導(dǎo)致使用率低,無法滿足臨床科研采集的需要,那么能否后臺靠算法自動轉(zhuǎn)換成結(jié)構(gòu)化病歷呢?
第三,臨床科研一體化病歷書寫與采集體系。
這一階段則是基于上述結(jié)構(gòu)化電子病歷前結(jié)構(gòu)化的難題產(chǎn)生的,因此在做該采集系統(tǒng)時,要求數(shù)據(jù)盡量在發(fā)生期進(jìn)行采集,同時以醫(yī)師為視角,提升臨床書寫效率,以電子病歷為平臺,建立臨床科研一體化病歷書寫與采集體系。在實(shí)現(xiàn)科研數(shù)據(jù)收集的同時,不增加日常工作量。目前北大腫瘤醫(yī)院已經(jīng)完成5000例的病人數(shù)據(jù)收集。
第四,基于CDR的科研數(shù)據(jù)采集體系。
上一路徑雖然實(shí)現(xiàn)了基于前瞻性研究的科研數(shù)據(jù)搜集,但是回顧性研究數(shù)據(jù)如何解決?基于CDR的科研數(shù)據(jù)采集體系成為了解決方法,該體系**臨床各種數(shù)據(jù),CRF表單對應(yīng)模式,填報(bào)人(醫(yī)生或護(hù)士)進(jìn)行確認(rèn)填寫表單(機(jī)器對應(yīng)自動填寫),同時基于傳統(tǒng)SQL的人工分析思路,做后結(jié)構(gòu)化病理報(bào)告等關(guān)鍵數(shù)據(jù),但是病歷的問題并沒有最終解決,對于如何喚醒“沉睡的歷史病歷”,醫(yī)院又進(jìn)行了基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)。
第五,基于大數(shù)據(jù)技術(shù)的后結(jié)構(gòu)化數(shù)據(jù)采集。
通過后結(jié)構(gòu)化,保持醫(yī)生書寫習(xí)慣和思考邏輯的基礎(chǔ)上,實(shí)現(xiàn)對既往病歷的結(jié)構(gòu)化處理,滿足科研數(shù)據(jù)采集需求。
路徑比較圖
通過以上五個階段的臨床科研路徑探索不難發(fā)現(xiàn):挖掘數(shù)據(jù)價(jià)值,不僅限于解析清洗出臨床數(shù)據(jù),而是在于數(shù)據(jù)價(jià)值臨床、科研、產(chǎn)業(yè)的轉(zhuǎn)化,因此如何挖掘真正有價(jià)值的數(shù)據(jù),這就對數(shù)據(jù)的高準(zhǔn)確性提出了要求。
最后,王立軍還說道:“醫(yī)院目前在做健康篩查,也就是將常人的信息跟患腫瘤人的信息進(jìn)行走勢觀測,從而實(shí)現(xiàn)對腫瘤的預(yù)測,未來有可能實(shí)現(xiàn)滴血驗(yàn)?zāi)[瘤。”對于醫(yī)療大數(shù)據(jù)的發(fā)展前景,他表示十分看好,同時也期待大數(shù)據(jù)在基因組學(xué)分析等方面的更高一級應(yīng)用的出現(xiàn)。