智慧醫療大數據中心建設方案_第1頁
智慧醫療大數據中心建設方案_第2頁
智慧醫療大數據中心建設方案_第3頁
智慧醫療大數據中心建設方案_第4頁
智慧醫療大數據中心建設方案_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、智慧醫療大數據中心建設方案新醫療,新智慧智慧醫療(一)建設什么樣的大數據中心大數據利用是個性化的數據研究服務,簡單例子:數據檢索:數據分析:化療后白細胞數下降的患者30天內二次住院的患者65歲以上老年人患兩種以上疾病的排名前三的共病組合 老年下肢關節手術麻醉方式與術后肺部感染的相關性大數據中心的職責是服務,與傳統的信息中心有所不同信 息 中 心大 數 據 中 心信息系統建設 與運維數據服務大 數據 應用 系統之一:數據管理中心職責數據采集、整合數據存儲管理數據訪問授權工作平臺數據整合平臺(ETL)數據檢索系統數據瀏覽系統數據在線使用(虛擬桌面)所需人才IT工程師數據 存儲數據 檢索數據 瀏覽虛

2、擬 桌面數據整合平臺數據管理授權 提取之二:數據加工中心職責根據用戶需求,從原始數據加工生成特征數據工作平臺自然語言處理工具專病數據庫平臺組學等專業數據處理平臺SQL所需人才IT工程師原始 數據結構化處理、SQL、組學數據平臺特征數 據特征數 據特征數 據專病數據庫平臺之三:數據分析中心職責為用戶提供數據分析服務工作平臺各類建模工具數據可視化工具深度學習平臺所需人才IT工程師數據分析工程師數據存儲SAS、SPSS、R、深度學習人工服務大數據中心的職能定位大數據中心的三種職能定位全功能的 大數據中心數據分析+數據加工+數據管理(一)建設什么樣的大數據中心觀點認識:“大數據中心”是數據服務中心而不

3、是系統建設中心,“服 務”有不同的內涵,不同的職能定位對應不同的技術平臺與人才 團隊建設內容。在提出建設大數據中心規劃時,首先要明確大數 據中心的職能定位。(二)數據是否要做整體預處理清洗后數據 歸一化 結構化數據整合原始數據 數據整合分析分析結構化結構化分析歸一化分析歸一化VS大數據中心數據處理的兩種流程整體預處理針對應用的預處理數據治理可以一次性完成嗎?(二)數據是否要做整體預處理信息的損失病歷文本結構化的結果不能完整表達原病歷文本的語義標準化(歸一化)可能導致特定信息丟失,如藥品名稱轉換:諾欣、鉑龍、順鉑順鉑技術上的困難歷史數據的不一致,如疾病編碼 ICD-9與ICD-10由于編碼原則可

4、能不同導致轉換難以自動對照完成整體結構化的困難,如不同病種的病歷文本有不同的特點,目前尚難以做到泛病 種的結構化處理(二)數據是否要做整體預處理病歷結構化不能完整反映文本語義,如癥狀之間的順序關系(二)數據是否要做整體預處理如,判斷不同腫瘤分期的結構化處理方法不同肺癌N分期判定胃癌N分期判定N0:無區域淋巴結轉移N1:同側支氣管或肺門淋巴結轉移N2:同側縱隔和/隆突下淋巴結轉移N0:無區域淋巴結轉移N1:區域淋巴結轉移12個N2:區域淋巴結轉移36個N3:區域淋巴結轉移715個N4:區域淋巴結轉移16個以上格式:陽性個數/送檢個數(二)數據是否要做整體預處理觀點認識:在大數據中心數據資源建設中

5、,預先將數據整體進行預處理 的過程會帶來信息丟失,技術上也存在較大困難,一次性的數據治理難以滿足數據后續利用需求。采用“數據湖”概念,保留數據的原始性,針對特定研究問題開展數據預處理是更好的選擇。(三)臨床數據研究的兩種路徑原始數據建立專病庫選擇特征數據 分析預先分析時抽取數據/特征提取分析時專病數據庫路徑:按病種設置特征,建立數據模型,預先整理加工隨機特征提取路徑:按照研究問題抽取和處理特征,在分析時進行建立科研病種數據庫是臨床數據研究的必然選擇嗎?科研數據庫的局限性是否接受過降糖治療、降糖治療類型、胰島素注射、目前規律口服降糖藥、一年內服用降糖藥物或注射胰島素;磺脲類促泌劑是否使用、磺脲類

6、促泌劑藥物劑量、開始日期、服用時程(月);非磺脲類促泌劑是否使用、非磺脲類促泌劑藥物劑量、開始日期、服用時程(月); 雙胍類是否使用、雙胍類名稱、劑量、開始日期、服用時程(月);糖苷酶抑制劑是否使用、糖苷酶抑制劑名稱、劑量、開始日期、服用時程(月); 噻唑烷二類酮是否使用、噻唑烷二類酮名稱、劑量、開始日期、服用時程(月); 目前是否規律使用胰島素、普通胰島素名稱、劑量、開始日期、服用時長(月); 長效胰島素是否使用、長效胰島素名稱、劑量、開始日期、服用時長(月)泛研究目的的科研病種數據庫以收集準備病種數據為目的,用以支持本病種不同目的的研究數據庫涉及數據項多,結構復雜,人工加工工作量巨大,持續

7、難度大針對問題分析時需要二次加工難以滿足所有研究需求例:糖尿病視網膜病變專病數據庫(片段)是否降血壓藥物、服用降血壓藥物種類數量、開始日期、服用時長(月)、目前規律服用降血壓 藥物;鈣離子拮抗劑降壓藥是否使用、藥物名稱、劑量、開始日期、服用時長(月);受體阻滯劑降壓藥是否使用、藥物名稱、劑量、開始日期、服用時長(月); 血管擴張藥是否使用、藥物名稱、劑量、開始日期、服用時長(月);Ang受體阻滯劑是否使用、藥物名稱、劑量、開始日期、服用時長(月);科研數據庫的局限性單一研究目的的科研病種數據庫以特定問題為導向收集病種數據數據庫涉及數據少,人工加工工作量小難以滿足特定問題以外的研究需求例:肺癌患

8、者生存研究數據庫性別、年齡、吸煙史、是否戒煙、家族史、ABO血型、RhD血型、基礎疾病、合并癥、病理類型、 分化程度、基因檢測方法、基因突變狀態、PD-L1(陽性/陰性)、MMR/MSI、TNMG分期、手術、 輔助治療(化療、放療)、一線治療、療效評估、副反應、PFS、二線治療、生存狀態、隨訪 時間、總生存時間、最后一次隨訪時間、是否存活、是否復發/進展、復發/進展位置、復發/進 展時間(三)臨床數據研究的兩種路徑觀點認識:通過建立專病數據庫和直接基于原始數據庫開展臨床數據研究是大數據中心兩種數據研究路徑。依托專病數據庫的路徑有較 大的局限性。在現實研究實踐中,特別是在回顧性研究中,更多 地采

9、用直接依托原始數據的方式。(四)對醫療大數據平臺的認識面向一線臨床研究人員的需求數據檢索與瀏覽系統科研專病數據庫管理系統多中心數據采集系統數理統計工具院后隨訪系統深度學習數據標注工具問題:醫療大數據平臺是什么?是一體化的產品嗎?技術形態是什么?面向數據處理分析人員的需求數據處理工具SQL、ETL工具自然語言處理及結構化工具去隱私工具各類建模工具:R、Matlab、SAS、SPSS可視化分析工具深度學習平臺組學數據處理分析平臺功能形態(四)對醫療大數據平臺的認識數據形態數據檢索:列數據庫(結構化數據),文本分布式索引(病歷文本)數據處理:傳統關系數據庫數據分析:傳統關系數據庫專病系統:傳統關系數據庫/XML多重數據存在針對不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論