數據元標準化基本方法_第1頁
數據元標準化基本方法_第2頁
數據元標準化基本方法_第3頁
數據元標準化基本方法_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據元標準化基本方法計算機世界/2019年/10月/16日/第B20版行業主題公共衛生數據元的標準化 , 不僅要對數據自身進行“名、型、值”的定義 , 還要找出 數據之間內在與外在間的關聯關系 , 對構建高效穩健的公共衛生數據模型起到積極的作用。數據元標準化基本方法劉麗華 金水高 王駿 胡凱數據標準化工作是信息系統建設的基礎工作。數據工作的無規則性,必然會導致系統 的低效能和資源的浪費。長期以來,我國公共衛生信息系統的建設缺乏整體規劃,在國家 層面上缺乏對公共衛生數據的標準定義與規范,導致了不同系統之間的數據難以交換、共 享,也造成了資源的極大浪費。公共衛生數據元的標準化,不僅要對數據自身進行

2、“名、型、值”的定義,還要找出 數據之間內在與外在間的關聯關系,對構建高效穩健的公共衛生數據模型起到積極的作用。數據元基本概念與結構數據元可定義為通過標識、定義、表示以及允許值等一系列屬性描述的數據單元,在 特定的語義環境中被認為是不可再分的最小數據單元,一般由對象類詞、特性類詞和表示 三部分組成。( 1 )對象類詞 : 是指人們希望研究、搜集和存儲其相關數據的事物,如 : 人、家庭、 醫療機構、觀察與干預等。( 2)特性類詞 : 是某個對象的一個特征。例如,人這個對象類可以具有很多特征, 如性別、出生日期、身高、職業或患病情況等。(3)表示是值域、數據類型的組合,必要時也包括度量單位或字符集

3、。它所表達的 是數據元概念的數據類型及可能的取值范圍。表示類詞可以是一個編碼,如國際疾病分類 (ICD-1 0 ),也可能是一個取值范圍,如身高的取值。對象往往有多個特性,對象與其任何一個有意義的特性的結合就組成一個數據元概念。 例如,人這個“對象”可以有性別、身高、出生日期等多個“特性”,將它與其中的某一 個特性結合在一起就組成一個“數據元概念”,如人性別、人身高和人出生日期等 都是數據元概念的例子。數據元是數據元概念與值域的結合。即一個特定的數據元概念與一個特定的值域結合 創建一個數據元。例如在兒童營養監測中,定義的一個數據元概念“兒童身高”,與身高的表示值域結合,構成數據元“兒童身高的測

4、量值” ; 而與兒童身高的平均水平值域結合, 則構成“兒童身高的平均值”這個數據元。顯然,這是兩個不同的數據元。數據元概念與 數據元之間存在一對多的關系,即一個數據元概念與不同的表示組合后可以生成不同的數 據元。數據元標準化的重要作用(1)規范和統一數據的采集與應用 ; ( 2)構筑數據共享的基礎,為不同系統多種模 式的數據存取和數據共享提供數據轉換格式和編程接口 ; ( 3)實現對公共衛生數據在 “元數據”層面上的管理,從而使“應用軟件”真正與“數據”分家,使應用軟件的開發 更具靈活性 ; (4)為公共衛生內部數據交換及公共衛生與外部數據交換在“數據”這一 層上提供統一的、各學科可以共同遵守

5、的數據交換規范 ; ( 5)是構建統一、集成、高效 的公共衛生數據模型的基礎。數據元標準化方法1. 數據元的提取公共衛生數據元的提取采用以下步驟:業務需求分析。包括流程分析,業務建模。基本數據集設置。將必需收集的數據按照特性分成不同數據集,確定每個數據集中的數 據項;數據元構建。對抽取的數據項,按對象類詞、特性類詞及表示類詞構建數據元。2. 數據元的規范化描述數據元的規范化描述是指按照國際或國家標準對于所提取的數據元的屬性進行描述。 國家公共衛生數據元的屬性的規范化描述遵循的標準為ISO/IEC 11179-3:2002 和國家標準 GB/T 18391.3-2001 (信息技術 / 數據元的

6、規范與標準化 / 第三部分 : 數據元的基本屬 性),基本屬性的模型如圖所示。該標準要求對數據元的 22 個屬性進行描述。內容包括標識類屬性、定義類屬性、關 系類屬性、表示類屬性、管理類屬性及附加類屬性。數據元其中還說明了屬性的出現次數 以及可選屬性之間的綁定關系。結合實際,在公共衛生數據元的規范化的描述中,增加了 英文名稱及英文簡稱兩個新的屬性。以“傷害發生原因”數據元規范化描述為例說明如下。標識類屬性標識符 : PH0802019名稱 : 傷害發生原因版本號 : 0.1英文名稱 : cause of injury英文簡稱 : cause of injury同義名稱 :注冊機構 : 標準化研

7、究總體組相關環境 : 該數據元用以收集傷害發生的原因。該數據元用于傷害監測數據集。定義類屬性定義 : 填寫造成傷害的起始原因,即在傷害發生鏈中最前面的原因。表示類屬性表示類別 : 代碼法表示形式 : 代碼數據元值的數據類型 : CV數據元值的最大長度 : 2數據元值的最小長度 : 1表示格式 : n數據元允許值 : 傷害原因代碼表管理類屬性主管機構 : 中國疾病預防控制中心注冊狀態 : 已登錄提交機構 : 中國疾控中心慢病中心備注:數據元著錄工具為了便于對數據元進行著錄于管理而編制的公共衛生數據元著錄與管理系統是參照中 華人民共和國國家質量監督檢驗檢疫總局發布的數據元的規范與標準化國家標準(G

8、B/T18391 )進行設計開發的,其主要功能包括數據元著錄、管理、查詢和調用等。目 的是以軟件工具作為輔助手段建立一套符合數據元標準化的工作程序,保證用戶在可操作 性比較強的方式下,以標準化的方式進行數據元的著錄和管理。系統設計為帶有客戶端軟 件的WEB服務模式,用戶通過INTERNET或局域網絡下載本系統的客戶端軟件,然后通過 客戶端界面與網絡連接進行錄入與管理功能,權限級別不同的用戶可進行操作的范圍不同。系統具有如下主要功能1. 數據元著錄功能 : 數據元著錄分為三個主要環節 : 術語條目庫建立、數據元生成和 數據元屬性著錄。在具體操作中,用戶可直接進入數據元生成環節進行操作,也可以在有 完整數據元的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論