健康醫療大數據分析應用平臺產品解決方案_第1頁
健康醫療大數據分析應用平臺產品解決方案_第2頁
健康醫療大數據分析應用平臺產品解決方案_第3頁
健康醫療大數據分析應用平臺產品解決方案_第4頁
健康醫療大數據分析應用平臺產品解決方案_第5頁
已閱讀5頁,還剩92頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

醫療大數據分析應用平臺產品解決方案

目錄

1.背景介紹...................................................................6

2.產品愿景...................................................................9

3.產品定位.......................................................9

3.1解決的問題..............................................................9

3.2達到的效果..............................................................9

4.產品理念......................................................10

5.總體思路......................................................10

5.1對接數據源,獲取醫療衛生大數據........................................11

5.2對獲取的醫療衛生大數據預處理機制......................................11

5.3建立醫療衛生大數據的存儲機制..........................................12

5.4醫療衛生大數據的處理和分析算法分類和形成..............................13

5.5開發專題大數據分析,形成專題大數據應用................................14

5.6開發機構大數據分析,建立機構大數據應用................................14

5.7建立平臺應用實施推廣組織機制..........................................14

5.8建立平臺產品優化升級服務組織機制......................................15

6.醫療衛生信息的大數據建模描述和分析.......................................15

6.1我們給出的相關數據模型.................................................16

6.2衛計委給出的相關數據模型..............................................16

6.3相關數據特征對比分析...................................................20

7.大數據分析應用平臺支持的業務主題場景....................................20

7.1醫療衛生服務機構應用...................................................22

7.1.1各級醫院自身應用.................................................23

7.1.2基層醫療機構自身應用.............................................26

7.1.3區域衛生醫療聯合體應用...........................................26

7.1.4醫療衛生機構的合規應用...........................................29

7.2患者醫療治療應用.......................................................31

7.2.1患者就醫過程提示服務.............................................31

7.2.2患者服藥提示服務.................................................31

7.2.3患者飲食、運動、習慣注意事項服務................................31

7.2.4患者體征和治療效果服務...........................................32

7.2.5患者交流交往服務.................................................32

7.3個性化醫療服務應用.....................................................32

7.3.1基因測序分析應用.................................................32

7.3.2個性化藥物應用...................................................32

7.3.3個人健康管理應用.................................................33

7.4慢性病預防治療應用(疾控中心)........................................34

7.4.1慢性病檢測、發現、預警服務......................................34

7.4.2慢性病診斷服務...................................................35

7.4.3慢性病防控治療服務...............................................35

7.5居民健康保健應用(疾控中心)..........................................36

7.5.1居民自我健康保健應用.............................................36

7.5.2政府衛生管理部門進行居民健康管理應用............................36

7.5.3政府醫療規劃結構進行居民健康保健決策應用.........................36

7.6醫療衛生管理機構應用(衛生局)........................................37

7.7醫療保險管理機構應用(醫保局)........................................37

7.7.1基本醫療保險的決策支持分析......................................39

7.7.2基本醫療保險費用單據的智能化審核................................39

7.7.3基本醫療保險的有效支付和治理應用................................40

7.7.4基本醫療保險和服務監管應用......................................40

7.7.5降低看病率提升醫療效果應用......................................40

7.8醫藥監管機構應用(藥監局)............................................43

7.9醫藥研發生產經營應用(醫藥企業)......................................43

7.9.1醫藥研發企業應用.................................................43

7.9.2醫藥生產企業應用.................................................44

7.9.3醫藥流通企業應用.................................................44

7.9.4醫藥零售企業應用.................................................46

7.10醫療衛生資源配置管理規劃應用(政府主管部門)........................46

7.10.1醫療衛生資源服務現狀分析........................................47

7.10.2醫療衛生資源財務供給能力分析...................................47

7.10.3醫療衛生資源規劃指標對比........................................47

7.10.4醫療衛生資源政策建議............................................48

7.11商業醫療保險應用(保險公司).........................................48

7.11.1獲得新客戶和保留已有客戶的分析應用.............................48

7.11.2有效控制醫療費用的分析應用.....................................49

7.11.3商業醫療保險的保障設計和精算定價...............................49

7.11.4商業醫療保險的理賠運營管理應用.................................50

7.11.5商業醫療保險的市場和銷售拓展應用...............................51

7.12公共衛生服務應用(衛生防疫中心).....................................52

7.12.1傳染病預警預報..................................................53

7.12.2公共衛生輿情監測預警............................................54

7.12.3疾控和保健應用..................................................54

7.13政府監管應用(政府主管部門).........................................55

7.13.1醫藥監管應用....................................................55

7.13.2醫療監管應用....................................................55

7.13.3醫保監管應用....................................................57

7.13.4醫療服務機構和醫生監管應用.....................................57

7.14新型醫療衛生服務應用(政府主管部門).................................57

7.14.1遠程醫療........................................................58

7.14.2移動醫療........................................................58

7.14.3互聯網醫療......................................................59

7.14.4數字醫療........................................................59

7.14.5大數據醫療......................................................59

7.14.6智慧醫療........................................................59

7.14.7精準醫療........................................................60

8.大數據分析應用平臺支持的專題大數據應用....................................61

8.1患者分析(基于電子病歷EMR)....................................................................................62

8.1.1患者數據預處理...................................................62

8.1.2患者個體(個性)分析.............................................62

8.1.3患者群體(統計)分析.............................................62

8.2疾病分析(基于電子病歷EMR和電子健康檔案EHR)............................................63

8.2.1常見疾病分析.....................................................63

8.2.2慢性疾病分析.....................................................63

8.2.3疾病誘因分析.....................................................63

8.2.4疾病統計分析.....................................................63

8.2.5臨床路徑分析.....................................................63

8.3醫生及醫護人員分析(基于醫療衛生資源數據)...........................63

8.3.1醫生及醫護人員資歷資格分析.......................................63

8.3.2醫生及醫護人員行醫記錄分析.......................................63

8.3.3醫生及醫護人員培訓進修分析.......................................63

8.4處方分析(基于電子病歷EMR).................................................................................63

8.4.1醫生用藥分析.....................................................64

8.4.2患者用藥分析.....................................................64

8.4.3處方用藥分析.....................................................64

8.4.4醫院科室用藥分析.................................................65

8.4.5安全用藥分析.....................................................65

8.4.6處方符合性分析...................................................65

8.4.7處方用藥-診斷結論關聯分析........................................65

8.4.8診斷結論-處方總價聚類分析........................................65

8.4.9患者特征-診斷結論分類分析........................................66

8.4.10患病時間-診斷結論序列分析.......................................66

8.5居民人口分析(基于電子健康檔案EHR).................................................................66

8.5.1居民個體健康分析.................................................66

852人口群體健康分析..................................................66

8.5.3人口亞健康相關因素關聯分析.......................................66

854人口健康相關因素關聯分析..........................................66

8.5.5人口健康時間空間分布分析.........................................66

856人口健康預測分析..................................................66

8.6藥品分析(基于醫藥產業鏈數據)........................................67

8.6.1藥品種類分析.....................................................67

8.6.2藥品研發分析.....................................................68

8.6.3藥品生產分析.....................................................70

8.6.4藥品銷售分析.....................................................70

8.6.5藥品物流分析.....................................................71

8.6.6藥品資金流分析...................................................71

8.6.7藥品信息流分析...................................................71

8.6.8藥品庫存分析.....................................................71

8.6.9藥品質量偏差分析.................................................74

8.6.10藥品不良反應&藥品群體不良事件分析.............................75

8.7醫療健康檢驗檢測分析(基于電子健康檔案EHR).................................................75

8.7.1生理信號檢測分析.................................................75

8.7.2醫學影像圖像分析.................................................75

8.7.3DNA檢測和DNA序列分析..........................................75

8.7.4重要人體征數據分析...............................................75

8.7.5遠程自助健康醫療檢測分析.........................................75

8.8醫療安全風險分析(基于電子病歷EMR)...................................................................76

8.8.1醫療安全分析.....................................................76

8.8.2醫療風險分析.....................................................76

883假藥、過期藥、成分異常藥的使用分析..............................76

8.8.4醫療事故誘因分析.................................................76

8.8.5醫療安全風險統計分析.............................................76

8.9醫療衛生資源分析(基于政府的醫療衛生資源數據).......................76

8.9.1醫生護理人員分析.................................................76

8.9.2醫院床位分析.....................................................76

8.9.3醫療檢測檢驗能力分析.............................................76

8.9.4醫療衛生資源需求分析.............................................77

8.9.5醫療衛生資源匹配度分析...........................................77

8.9.6醫療衛生資源對比分析.............................................77

8.10醫療衛生效果分析(基于電子健康檔案HER和醫療衛生資源數據).........77

8.10.1醫療衛生滿意度分析..............................................77

8.10.2醫療衛生問題誘因分析............................................77

8.10.3醫療衛生規劃符合度分析..........................................77

9.關鍵核心技術和算法.........................................................77

9.1大數據分析能力.........................................................78

9.2大數據分析技術.........................................................78

9.3大數據存儲技術和系統...................................................79

9.4大數據業務模型建模.....................................................79

9.5大數據的實時查詢.......................................................81

9.6大數據的復雜分析.......................................................82

10.用醫療衛生大數據為業務服務................................................84

10.1核心理念..............................................................85

10.2管理閉環..............................................................85

11.未來市場前景分析...........................................................87

12.簡化版方案.................................................................88

(初稿)

本應用平臺產品的總體方案思路是:基于目前醫療服務機構及相關機構已有

的HLI、NHLI、HIS等有關系統形成并積累的醫藥醫療大數據和信息,采用最新

的大數據技術、云計算技術、BI和數據挖掘技術,形成對醫療行業具有新視角、

全方位、智能性、預測性、可視性的深層次展示分析效果(Insight),揭示醫療

行業整體規律和內在發展趨勢,揭示患者個體的獨有特質并形成個性醫療,將醫

療行業的宏觀大勢與每個患者的微觀個體定性定量描述有機結合,達到支撐和形

成醫療行業新應用場景和新服務模式。“醫藥醫療大數據”是具有更強的決策力、

洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產,但需要新計

算處理模式。

1.背景介紹

根據國際著名分析機構Gartner給出的定義:大數據就是那些具有規模大、

速度快、種類多三大特征的數據資產。大數據分析從海量數據中篩選出有用的信

息,然后通過各種手段將信息轉化為洞察力,從而做出正確決策,并最終推動業

務發展。通過一系列分析處理,大數據可以幫助企業制定明智且切實可行的戰略,

獲取前所未有的客戶洞察,支持客戶購買行為,并構建新的業務模式,進而贏得

競爭優勢。

隨著人們的生活水平不斷提高,健康也越來越受到家庭的關注。2009年2

月27日,我國衛生部公布的第四次國家衛生服務調查結果顯示,截止至2008年,

我國居民腦血栓,糖尿病,高血壓等慢性病病例數達到2.6億,占全國總人數的

20%,其中高血壓病人對自身疾病的知曉率只有30%,同時這些病人中的治療率

只有25除控制率僅為6除糖尿病病人中,能堅持做到規范治療的也只有33虬

由此我們可以看出,建立科學、規范、高質量的慢性病管理策略,實現對人體慢

性病的監護具有重大的意義。通過慢性病的早期診斷和監護,不僅能提前預防和

控制各種疾病,還能幫助他們合理用藥,減少醫藥開支。另一方面,我國公共醫

療衛生資源緊缺,城鄉醫療衛生資源的差距比較大,城市人口平均擁有的醫療衛

生資源是農村人口的2.5倍以上,比如,占全國總人口近70%的農村擁有全國醫

療衛生資源的30%,而占全國總人口30%的城市卻占有全國醫療衛生資源的70%,

優質的醫療衛生資源集中分布在城市,尤其是大城市。因此,實現城鄉之間的醫

療衛生資源共享成為丞待解決的重要問題。

同時,隨著國家積極倡導“3521”醫療系統建設,我國醫療領域信息化程度

得到了很大的提高,預計在全國會出現上百個醫療數據中心,每個數據中心都將

承載近1000萬人口的醫療數據,數量多、更新快且類型繁雜,使醫院數據庫的

信息容量不斷膨脹,這就產生了醫療大數據。醫療大數據通常具有以下特征:

(1)數據巨量化:區域醫療數據通常是來自于擁有上百萬人口和上百家醫

療機構的區域,并且數據呈持續增長的趨勢。依照醫療行業的相關規定,患者的

數據通常至少需要保留50年。

(2)服務實時性:醫療信息服務中會存在大量在線或實時數據分析處理的

需求。例如:臨床中的診斷和用藥建議、健康指標預警等。

(3)存儲形式多樣化:醫療數據的存儲形式多種多樣,例如各種結構化數據

表、非(半)結構化文本文檔、醫療影像等。

(4)高價值性:醫療數據對國家乃至全球的疾病防控、新藥研發和頑疾攻克

都有著巨大的作用。

因此,如何在海量的醫療大數據中提取信息的能力正快速成為戰略性發展的

方向,通過大數據分析挖掘出有價值的信息,將對疾病的管理、控制和醫療研究

都有著非常高的價值。

目前,大數據、云計算是已經普及并成為IT行業的主流技術。國內外都已

經進入了大數據、云計算的研究熱潮,同時大數據、云計算技術也逐漸成熟,大

規模區域醫療信息系統和大型數據中心的建立也在同時進行。而云計算是大數據

成長的驅動力,與此同時,由于醫藥醫療大數據越來越多,對云計算的需求日益

增長,所以二者是相輔相成的。隨著醫療數據的急劇增長,如何充分利用這些數

據,運用大數據、云計算技術,搭建合理先進的數據云服務平臺,為廣大患者、

醫務人員、科研人員提供服務和協助,必將成為未來信息化工作的重要方向。

“大數據時代”已經降臨,“大數據”正在對每個領域都造成影響。在商業、

經濟及其他領域中,決策行為將日益基于數據和分析的結果,而非基于經驗和直

覺;而在公共衛生、經濟發展和經濟預測等領域中,“大數據”的預見能力也已

經嶄露頭角。2012年3月,美國政府公布了“大數據研發計劃”(BigDataResearch

andDevelopmentInitiative)..該計劃的目標是改進人們從現有的海量和復雜

的數據中獲取知識的能力。其中,與醫療衛生領域相關的有生物傳感2.0、虛擬

實驗室環境(VLE)、癌癥基因組圖譜(TCGA)、神經科學信息框架(NIF)、患者報

告結果測量信息系統(PROMIS)等10余項。2014年美國的公共數據開放項目

OpenFDA上線之后,先導項目開放了“300萬份藥物不良反應報告”,這些數據

是2004至2013年間被提交給FDA的藥物不良反應和醫療過失記錄。對醫療機構

來說,不良反應和醫療過失記錄起到的是長遠的貢獻作用,能減少醫療悲劇的重

現。

根據我國居民第三次死因調查報告顯示,腦血管病已成為居民的第一死因。

腦卒中發病率正以每年8.7%的速率上升,我國每年用于治療腦血管病的費用約

在100億元以上。2014年,GE醫療中國聯合國家衛生計生委腦卒中防治工程委

員會(腦防委)啟動了“腦卒中行動”合作戰略。GE醫療“腦卒中行動”的法寶

之一就是大數據。尤其是GE構建的三級篩查網絡,對雙側內膜增厚的高危人群

檢出率提升了近10%oGE搭建的腦卒中信息管理系統可以與醫院Lis和His系統

全面對接,記錄患者的基本信息、初篩信息、復篩信息、用藥信息、實驗室檢查、

體格檢查信息及其隨訪信息等,全面跟蹤患者的診治流程。還可以與PACS系統

對接,全面記錄患者的影像學信息,實現患者影像信息的共享。同時,可對患者

全流程疾病影像信息回顧,減少患者重復檢查的負擔,協助醫生對患者疾病信息

的全面判斷。

在上述這些大背景下,本公司提出并計劃研發“醫療大數據分析應用平臺”

(以下簡稱''本平臺")產品,以期為我國醫療衛生實現數字醫療、智慧醫療、

健康醫療發揮重要作用。從而達到:服務模式(以患者為中心,形成居民健康全

過程服務),從被動到主動;醫療模式(以預防為主,人人享有基本醫療衛生服

務,將醫療衛生工作重點由后治前移到預防保健),從治病到防病;診療模式(避

免各自為政,實行上下聯合,專業分工),從排斥到聯動;數據模式(從業務系

統數據向整體數據轉變,改變過去的數據不統一、不互通、不共享),從隔離到

整體;技術模式(采用各種新技術手段,包括大數據、云計算、物聯網、移動互

聯等,形成技術合力),從簡單到綜合的轉變。

2.產品愿景

形成充分發揮大數據技術的,針對醫療醫藥行業的,能充分適應醫療衛生信

息特征的大數據分析應用支撐平臺,通過大數據分析,達到發現知識、發現規律、

預測未來,將醫療衛生行業推進進入大數據時代提供技術可行性。

3.產品定位

本平臺以醫療衛生行業的整體數據架構(數據模型、數據構成、數據關系)

為基礎和標準,以對應的醫療衛生業務數據為輸入,通過大數據技術,形成針對

醫療衛生行業中不同機構、角色和業務活動的智能化應用,因此本平臺不是代替

已有醫療衛生信息化系統,而是在多個方面強化已有醫療衛生信息化系統,包括

任意查詢、即興分析、業務增強、規則約束、預測未來、發現知識,并提供互動

性、及時性、預知性、洞察性,從而達到實現智慧醫療的目標。

3.1解決的問題

當前醫療衛生信息化建設的主要問題是各個區域內不同醫療機構中患者的

基礎信息和各種臨床信息資源分散、重復、孤立,導致有效信息閑置、信息重復

或不一致,很難得到有效利用。

通過本平臺實現國家醫療衛生信息化規劃中“4631-2"的三大基礎數據庫,

即電子健康檔案數據庫、電子病歷數據庫和全員人口個案數據庫的應用落地;

通過本平臺實現智慧醫療的核心部分,即醫療衛生服務體系的智能化,使醫

療衛生的各種應用提升水平;

通過本平臺為“看病難、看病貴”的解決提供科學定量判斷依據、對比分析

依據和方案效果評價依據;

3.2達到的效果

本平臺預期部署到云平臺上運行,采用SOA的理念進行架構開發,通過分層

將公共大數據算法模型封裝為服務,對業務應用提供服務,同時平臺業務應用也

是服務的形式存在,即應用單位不再需要購買部署自己的服務器硬軟件環境,只

需要開通相應服務就可以了。各個應用單位根據自己的業務需要定制服務,平臺

支持“開通即用”服務模式,為實現業務應用集成,本平臺將對外支持WebService

方式的接口服務。

本平臺希望將醫療衛生的智慧功能應用普及到業務角色和過程的方方面面,

包括醫生(包括專科醫生、全科醫生、保健醫生等)、患者(包括慢性病患者、

潛在患者等)、管理者(包括醫療管理者、醫療保險管理者、醫藥監管管理者、

公共衛生管理者等)、醫藥經營者(藥品研發、藥品生產、藥品物流、藥品零售

等)以及商業醫療保險經營者(健康險、大病險、醫療意外險等)。

4.產品理念

醫療衛生、健康保健、醫藥器械形成的海量數據就象一座待開發的金礦,利

用大數據技術、云計算技術、物聯網技術和便攜設備技術的最新成果,將給醫療

衛生事業帶來全新革命性的改變,明顯解決看病難和看病貴的問題,達到醫療衛

生資源配置分布合理、大病小病治療各司其職、疾病預防治療有機結合、公民健

康保健全過程覆蓋。

5.總體思路

通過建立醫療衛生大數據的統一標準和規范,形成可被相關業務應用所利用

的醫療衛生大數據源和交互機制,在此基礎上,首先形成專題大數據應用,這些

應用具有跨部門和組織機構的通用性,并具有良好的穩定性,因為這些應用是面

向醫療衛生專題的;基于專題大數據應用,根據醫療衛生相關部門和組織機構的

業務要求,可開發形成各種業務大數據應用,并且隨著平臺的推廣,積累的醫療

衛生業務大數據應用的實例將會越來越多,并最終形成不同方向的最佳應用樣例。

醫療衛生大數據源專題大數據應用業務大數據應用

5.1對接數據源,獲取醫療衛生大數據

醫療衛生大數據中心為本平臺進行醫療衛生大數據分析提供數據源,但不在

本平臺范圍內,并平臺只是開發提供一套與該數據中心的數據讀取接口,并具有

監控數據讀取情況匯總統計和異常提示功能。

該數據中心的定位:整合區域內不同醫療機構中患者/健康人群的各種臨床

診療數據、健康數據,在相對集中的邏輯/物理環境中,構建一個以存儲和處理

患者/健康人群診療信息為核心,覆蓋多學科、多專業的面向區域內主要衛生行

政主管部門、臨床醫療機構和社會公眾的醫學(醫藥、醫療、健康)信息資源共

享機制一一區域性醫學數據中心。區域性醫學數據中心的建設以行政業務處理、

醫療、預防、保健、康復為服務主線,以健康人群和患者的醫療活動需求為基礎。

區域衛生數據中心通過制定標準的數據接口,建立基于廣域網的信息交換、數據

采集和傳輸機制,對區域內醫療衛生信息數據進行采集、傳輸、清洗和匯總,將

醫院、社區、醫藥企業以及公共衛生機構的各類數據、系統有機地整合起來,生

成區域的衛生大數據。

5.2對獲取的醫療衛生大數據預處理機制

醫療衛生大數據預處理主要完成對已接收數據的辨析、抽取、清洗等操作,

目的是將數據按統一的格式提取出來,然后再轉化,集成,載入數據倉庫的工具

(ETL)包括:抽取:因獲取的數據可能具有多種結構和類型,數據抽取過程可

以幫助我們將這些復雜的數據轉化為單一的或者便于處理的構型,以達到快速分

析處理的目的;清洗:對于大數據,并不全是有價值的,有些數據并不是我們所

關心的內容,而另一些數據則是完全錯誤的干擾項。因此要對數據通過過濾“去

噪”從而提取出有效數據。

5.3建立醫療衛生大數據的存儲機制

雖然關系型數據庫系統(RDBMS)在安裝和使用上仍然占有主要地位,但毋庸

置疑,非關系型數據庫NoSQL技術已經成為今天發展最快的數據庫技術。NoSQL

是對數據庫系統的總稱,在某種程度上,它的性能和用途可能完全不同。

目前除了關系型數據庫外,還主要存在有以下四種NoSQL數據管理系統:

鍵值數據庫:當數據以鍵的形式訪問時,比如通過國際標準書號ISBN找一

本書,鍵值數據庫是最理想的。在這里,ISBN是鍵,書籍的其他信息就是值。

必須知道鍵才能查詢,不過值是一堆無意義的數據,讀取之后必須經過翻譯。

文檔數據庫:該數據庫以文檔的形式管理和存儲數據。有點類似于鍵值數據

庫,但文檔數據庫中的數據有結構。與鍵值數據庫中值是一堆無意義的數據不同,

文檔數據庫中數據以文檔的結構被描述,典型的是JavaScriptObjectNotation

(JSON)或XML。文檔存儲數據庫中的數據可以通過定義的任何模式進行查詢,但

鍵值數據庫只能通過它的鍵進行查詢。

列式數據庫:也被稱為列式存儲或寬列存儲,一改之前行式存儲的方式,對

數據進行列式存儲。在傳統關系型數據庫中,數據經常以行來訪問。以列式管理

記錄的NoSQL數據庫可以管理大規模的動態列。因為沒有固定的模式,所以列

名和鍵可以變換。列式數據庫適用于不經常寫的情況,要滿足ACID(原子性、

一致性、隔離性和持久性)的要求并不難,而且模式是變化的。

圖型數據庫:圖型數據庫關注值與值之間的關系,用圖型的數學概念存儲數

據。圖型數據庫用帶有點、邊緣和屬性的圖的結構表示和存儲數據。在圖型數據

庫中,每一個元素都包含一個直接的指向它毗鄰元素的點,所以也就不需要索引

查找。

每個種類的NoSQL數據庫都有適用的不同類型的應用程序和用例,這就涉及

到一個NoSQL社區常用的一個話題,即多樣持久性,或者說根據數據庫處理應用

程序需求的不同,使用不同的數據庫系統,用于不同的應用程序和用例。

5.4醫療衛生大數據的處理和分析算法分類和形成

?技術分類方法

/根據挖掘任務:分為分類或預測模型發現、數據總結、聚類、關聯規則發

現、序列模式發現、依賴關系或依賴模型發現、異常和趨勢發現等等;

,根據挖掘對象:可分為關系數據庫、面向對象數據庫、空間數據庫、時態

數據庫、文本數據源、多媒體數據庫、異質數據庫、遺產數據庫以及環球

網Web;

/根據挖掘方法:可分為:機器學習方法、統計方法、神經網絡方法和數據庫

方法。

?主要處理和分析技術

/預言處理:用歷史預測未來;

,挖掘規律處理:了解數據中潛在的規律;

/關聯分析:查找存在于項目集合或對象集合之間的頻繁模式、關聯、相關

性、或因果結構;

/序列模式處理:給定一個由不同序列組成的集合,其中,每個序列由不同

的元素按順序有序排列,每個元素由不同項目組成,同時給定一個用戶指

定的最小支持度閾值,序列模式挖掘就是找出所有的頻繁子序列,即該子

序列在序列集中的出現頻率不低于用戶指定的最小支持度閾值;

/分類(預言)分析:預測分類標號(或離散值),根據訓練數據集和類標號

屬性,構建模型來分類現有數據,并用來分類新數據。建立連續函數值模

型,比如預測空缺值;

/聚類分析:聚類是一種無監督分類法:沒有預先指定的類別。在同一個類

中,對象之間具有相似性;不同類的對象之間是相異度分析;把一個給定

的數據對象集合分成不同的簇。將物理或抽象對象的集合分組成為由類似

的對象組成的多個類;聚類在不同的應用領域,用作描述數據,衡量不同

數據源間的相似性,以及把數據源分類到不同的簇中;聚類是將數據分類

到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似

性,而不同簇間的對象有很大的相異性;聚類與分類不同,聚類所要求劃

分的類是未知的;

/異常檢測分析:異常檢測是數據挖掘中一個重要方面,用來發現”小的模

式”(相對于聚類),即數據集中間顯著不同于其它數據的對象;

/可視化分析。數據可視化可以讓數據自己說話,讓用戶直觀的感受到結果;

/數據挖掘算法。分割、集群、孤立點分析還有各種算法讓我們精煉數據,

挖掘價值。這些算法要能夠應付大數據的量,同時還具有很高的處理速度;

/語義引擎。人工智能從數據中主動地提取信息。包括機器翻譯、情感分析、

輿情分析、智能輸入、問答系統等;

,數據質量和數據管理。透過標準化流程和機器對數據進行處理可以確保獲

得一個預設質量的分析結果。

5.5開發專題大數據分析,形成專題大數據應用

面向醫療衛生專業所特有的專題,開發形成一系列的專題大數據應用。在充

分調研和分析醫療衛生行業的業務特性基礎上,研發形成具有我國醫療衛生行業

特征的分類專題大數據分析,并根據專題組成和業務功能要求形成滿足該業務專

題的大數據應用,如心臟病專題的大數據應用,包括其成因的大數據分析、其日

常行為對病情影響的大數據分析等,為有關機構進行心臟病的有關活動(預測、

預防、治療、恢復)提供支撐。

5.6開發機構大數據分析,建立機構大數據應用

面向不同的醫療衛生機構和部門及其相關企業機構,開發形成針對不同機構

和部門業務的機構大數據應用,如醫療衛生機構應用、醫療衛生管理機構應用等。

在上述專題大數據應用基礎上,結合所承擔的相關醫療衛生及其相關機構項目,

進行機構大數據應用定制開發。

5.7建立平臺應用實施推廣組織機制

在本平臺開發和部署基礎上,逐步形成基于本平臺開發應用項目的實施推廣

組織機制,包括市場宣傳、營銷推廣、實施維護和售后服務等。

5.8建立平臺產品優化升級服務組織機制

本平臺作為公司的主打產品系列,要建立嚴格的版本控制,并根據市場反饋

和內部技術發展,進行有計劃的平臺版本升級,并將新版本升級信息和文檔,按

規定要求通知已有用戶,并及時進行產品升級,并提供維護服務。

6.醫療衛生信息的大數據建模描述和分析

伴隨著中國醫療衛生服務的信息化進程推進,將產生大量的數據。這些數據

主要來源于醫療業務活動、健康體檢、公共衛生等9項醫療衛生服務。數據內容

包括來自醫院的大量電子病歷、區域衛生信息平臺采集的居民健康檔案等。其中

大量充斥著非結構化/半結構化的數據,包括圖像,。ffice文檔,以及XML結構

文檔等。醫療大數據的應用,關鍵是整合所有可能得到的這些數據,為機構和政

策制定者來找到如何刺激經濟并降低共享數據的技術門檻。

臨床數據

6.1我們給出的相關數據模型

我國醫療衛生行業涉及的數據實體對象種類非常眾多,包括醫療機構一科室

一醫生(門診、住院)、大眾群體一患者、醫療管理部門一衛生局一疾控中心一

醫保中心一發改委一中醫藥管理局、醫藥管理部門一藥監局、醫藥研發一醫藥生

產一醫藥經營一藥品(處方藥、ODC藥)、醫療器械研發一醫療器械生產一醫療

器械經營一醫療器械、商業醫療保險公司、體檢中心一體檢醫生、APP服務等。

如下圖所示。

6.2衛計委給出的相關數據模型

2010年底,原衛生部完成了“十二五”衛生信息化建設工程規劃編制工作,

初步確定了我國衛生信息化建設路線圖,簡稱“3521-2工程”,即建設國家級、

省級和地市級3級衛生信息平臺,加強公共衛生、醫療服務、新農合、基本藥物

制度、綜合管理等5項業務應用,建設健康檔案和電子病歷2個基礎數據庫和1

個專用網絡建設,進行醫療衛生信息標準化體系和安全保障體系2個體系建設。

2013年11月,衛生部和計生委合并后,信息化建設工程規劃的頂層設計規

劃又調整為“4631-2工程”,其中,“4”代表4級衛生信息平臺,分別是:國家

級人口健康管理平臺,省級人口健康信息平臺、地市級人口健康區域信息平臺及

區縣級人口健康區域信息平臺;“6”代表6項業務應用,分別是:公共衛生、醫

療服務、醫療保障、藥品管理、計劃生育、綜合管理;“3”代表3個基礎數據庫,

分別是:電子健康檔案數據庫、電子病歷數據庫和全員人口個案數據庫;“1”

代表1個融合網絡,即人口健康統一網絡;最后一個“2”是人口健康信息標準體

系和信息安全防護體系。依托中西醫協同公共衛生信息系統、基層醫療衛生管理

信息系統、醫療健康公共服務系統打造全方位、立體化的國家衛生計生資源體系。

衛計委規劃的三大基礎數據庫相互關系和包括的主要數據如下圖所示。

病歷概要:包括患者基本信息等四項內客;、

2、門(急)診診療記錄:包括門(急)診病歷、

處方等六項內容。

3、住院診療記錄:包括住院病案首頁、住院志等

九項內容。

4、健康體檢記錄:?股常規健康體檢記錄。

轉診(院)記錄:患者轉診的主要工作記錄。

法定醫學證明及報告:包括出生醫學證明等

醫療機構信息:醫療機構法人信息。

電子病歷數據庫

個人基本信息:包括姓名、性別、照片、英文

1、個人基本信息:包括人口學信息、社會經濟、曾用名、身份i正號碼,年齡、證件類型、i證件號碼、籍

學信息、親屬信息、社會保障信息、基本健康信息打、國籍、戶籍類型、,戶籍地址、政治面貌.、能康狀況、

、建檔信息。婚姻狀況、宗教信仰'兵役狀況、文化程度、學位

2、主要衛生服務記錄:包括兒童保健信息、婦、職稱、從業狀態、工作單位、工作單位通訊地址社保

女保健信息、疾病預防信息、疾病管理:高血壓、?、民政撫助對象類型C聯系電話、手機號碼、電子郵件

!、死亡標識信息等。

糖尿病、腫痂、重癥精神疾病等病例管理信息,老現居住地址、居住類型

年人健康管理信息、醫療服務信息等。個人擴展信息:包括工作、教育

房、社保、公積金、計劃生育、衛生健康、犯罪記

親、死亡信息等。,

電子健康檔案數據庫全員人口個案數據庫

電子健康檔案的數據架構是以人的健康為中心,以生命階段、健康和疾病問

題、衛生服務活動(或干預措施)作為三個緯度構建的一個邏輯架構,用于全面、

有效、多視角地描述健康檔案的組成結構以及復雜信息間的內在聯系。通過一定

的時序性、層次性和邏輯性,將人一生中面臨的健康和疾病問題、針對性的衛生

服務活動(或干預措施)以及所記錄的相關信息有機地關聯起來,并對所記錄的

海量信息進行科學分類和抽象描述,使之系統化、條理化和結構化。

個人健康檔案的三維概念模型,可以清晰地反映出每個個人不同生命階段、

主要疾病和健康問題、主要衛生服務活動三者之間的相互聯系。同時,坐標軸上

的三維坐標連線交叉所圈定的空間位置(域),表示了人在特定生命時期、因特

定健康問題而發生的特定衛生服務活動所需記錄的特定記錄項集。由于三維空間

中的任意一個空間位置都對應著某個特定的健康記錄,從而構成了一個完整、立

體的健康記錄,這些健康記錄全面地反映了個人健康檔案內容的全貌。

?第一維(X軸):生命階段

按照不同生理年齡可將人的整個生命進程劃分為連續的若干生命階段,如:

嬰兒期(0-1歲)、幼兒期(1?3歲)、學齡前期(3~6歲)、學齡期(6?12

歲)、青春期(12?20歲)、青年期(21?45歲)、中年期(46?60歲)、老年期

(60歲以上)等八個生命階段。也可以根據基層實際工作的需要,將人群化分

為:兒童、青少年、育齡婦女、中年和老年人。

?第二維(Y軸):健康和疾病問題

每一個人在不同生命階段所面臨的健康和疾病問題不盡相同。確定不同生命

階段的主要健康和疾病問題及其優先領域,是客觀反映居民衛生服務需求、進行

健康管理的重要環節。

?第三維(Z軸):衛生服務活動(或干預措施)

針對特定的健康和疾病問題,醫療衛生機構開展一系列預防、醫療、保健、

康復、健康教育等衛生服務活動(或干預措施),這些活動反映了居民健康需求

的滿足程度和衛生服務利用情況。

■專甘日

個人健康檔案(EHR)基本結構

6.3相關數據特征對比分析

從醫藥醫療健康大數據分析應用角度,本平臺需要一個盡可能全和細的數據

集合,所以理想狀態是結合上兩部分數據內容形成的超集集合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論