




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
ICS11.020CCSC07代替WS/T305-2009MetadataspecificationofhealthinformationdatasetWS/T305-2023本標準為推薦性標準。本標準代替WS/T305-2009《衛生信息數據集元數據規范》。與WS/T305-2009相比,主要為編輯性修改。本標準由國家衛生健康標準委員會衛生健康信息標準專業委員會負責技術審查和技術咨詢,由國家衛生健康委統計信息中心負責協調性和格式審查,由國家衛生健康委規劃發展與信息化司負責業務管理、法規司負責統籌管理。本標準起草單位:中國人民解放軍總醫院、國家衛生健康委統計信息中心、中國人民解放軍空軍軍醫大學。本標準主要起草人:劉麗華、王珊、張黎黎、李林、王霞、劉建超、胡建平。1WS/T305-2023衛生健康信息數據集元數據標準本標準規定了數據集元數據內容框架、衛生健康信息數據集核心元數據、衛生健康信息數據集參考元數據、引用信息與代碼表。本標準適用于作為衛生健康信息數據集屬性的統一規范化描述,也可用于衛生健康領域針對數據集制定專用元數據標準的依據。2規范性引用文件下列文件中的內容通過文中的規范性引用而構成本標準必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本標準;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本標準。GB/T2260中華人民共和國行政區劃代碼GB/T7408數據元和交換格式信息交換日期和時間表示方法WS/T306衛生健康信息數據集分類與編碼規則RFC2396統一資源定義符:通用語法3術語和縮略語下列術語和縮略語適用于本標準。3.1術語3.1.1元數據metadata定義和描述其他數據的數據。3.1.2數據集dataset具有一定主題,可以標識并可以被計算機化處理的數據集合。3.1.3元數據元素metadataelement元數據的基本單元。3.1.4元數據實體metadataentity一組說明數據相同特性的元數據元素。可以包含一個或若干個元數據實體。元數據子集metadatasection元數據的子集合,由相關的元數據子集和元數據元素組成。數據元dataelement2WS/T305-2023用一組屬性規定其定義、標識、表示和允許值的數據單元。3.2縮略語XML:可擴展標記語言(ExtensibleMarkupLanguage)4數據集概述4.1數據集基本概念對數據集概念的詳細解釋可見WS/T306。4.2衛生健康信息數據集對衛生健康信息數據集的闡述可見WS/T306。5衛生健康信息數據集元數據概述5.1元數據內容組成衛生健康信息數據集元數據規定了兩個層次的元數據內容的集合:核心元數據與參考元數據,其中參考元數據包含了核心元數據,它們之間的內容包含關系見圖1。圖1核心元數據與參考元數據的內容包含關系5.2元數據結層次構元數據結構:元數據元素、元數據實體和元數據子集。元數據元素是元數據的最基本的信息單元。例如,數據集名稱、數據集標識符、元數據創建日期等,是最基本的屬性信息單元,用元數據元素來表示。元數據實體是同類元數據元素的集合,用于一些需要組合若干個更加基本的信息來表達的屬性。本信息來說明,而數據集“關鍵詞說明”需要“關鍵詞”和“詞典名稱”來說明,對于“數據集提交和發布方”和“關鍵詞說明”這類屬性用元數據實體來表示。元數據子集由共同說明數據集某一類屬性的元數據元素與元數據實體組成,例如標識信息、內容信息、分發信息等。5.3元數據的摘要描述5.3.1元數據的摘要描述符主要采用摘要描述方法定義和描述衛生健康信息數據集的元數據內容。摘要描述的方法通過表1所列的描述符針對元數據的元素、實體與子集進行定義。“約束”表示一個描述符是“必選”(M還是“條件選”(C或者是“可選”(O摘要描述符見表1。3WS/T305-2023表1摘要描述符MMMMCMCM5.3.2中文名稱元數據子集、實體或元素的中文名稱,即為核心元數據的元數據實體或元數據元素的中文名稱。5.3.3定義描述元數據子集、實體或元素的基本內容,是衛生健康信息數據集某個屬性和特征的概念與說5.3.4英文名稱元數據子集、實體或元數據元素的英文名稱,一般使用英文全稱。英文名稱中,詞匯均采用無縫連寫。元數據子集與實體英文名稱的每個詞匯的首字母均為大寫,元數據元素英文名稱的首詞匯全部小寫,其余詞匯的首字母采用大寫。5.3.5數據類型對元數據的有效值域和允許對該值域內的值進行有效操作的規定。元數據實體與元數據子集的數據類型為復合型,元數據元素的數據類型包括為數值型、布爾型、字符串、日期型和復合型等。當元數據元素的數據類型為復合型的時候,表明該元數據元素使用了引用信息中的引用數據類引用數據類型是由一組元素組成、能被重復引用的元素集合。例如,“數據集提交和發布方”政編碼”和“電子郵件地址”這一組子元素來表示,為了表達的方便,衛生健康信息元數據定義了一個叫做“負責方”的數據類型見本標準9.1.1條款,供“數據集提交和發布方”和“元數據維護方”進行引用。5.3.6取值規則元數據子集、實體或元素取值方式的說明。5.3.7短名元數據元素、實體或子集的英文縮寫名稱,具體縮寫規則如下:a)短名在本標準范圍內必須唯一。b)對存在國際或行業慣用英文縮寫詞匯的元數據元素或元數據實體,采用慣用英文縮寫作短c)對于根據英文名稱或自定義的短名,在可以保證其(本標準范圍中的所有短名范圍內)唯一性的情況下取每個詞匯的前3位字母作為其短名,當如此取詞時發現不能夠保證短名標識的唯一性時,應當延展取詞的位數,通常增加1位。如果仍然不能滿足唯一性要求,則照此順延。d)元數據子集、元素和元數據實體的短名中,詞匯均采用無縫連寫。元數據子集與實體短名4WS/T305-2023中每個詞匯的首字母均為大寫;元數據元素短名的首詞匯全部小寫,其余詞匯的首字母采用大寫。5.3.8子元素子元素是通過一定的表示規則以確定一個元數據實體中包含的下一級的元數據實體或元數據元素。表示規則為:“標識符=表達式”。表達式中各符號的含義見表2。表2表達式的符號含義=+與|表示{}中的元數據元素a為可選/條件必選項,且最大a在子元素表示中,{}中均使用元數據元素或實體的中文名稱。例如:子元素:關鍵詞說明=1{關鍵詞}n+0{詞典名稱}15.3.9注解對元數據子集、實體或元素的含義的進一步解釋,包括該元數據的約束/條件(必選、可選或條件必選)和最大出現次數。當該元數據為條件必選時,應注明其約束條件。約束/條件可選元數據子集或元數據實體可以有必選元數據實體或元素。但這些必選的實體或元素只有當上一級的可選子集或實體被選用時才成為必選的;如果上一級的可選元數據子集或實體未被選用,則其所包含的必選實體或元素也不選用。最大出現次數說明元數據子集、實體或元素可以重復出現的次數。只允許出現一次的用“1”表示,允許重復出現(但重復的次數不是固定值)的用“N”表示。不為1的固定出現次數用相應的數字表示,如“2”、“3”、“4”等。5.4適用功能5.4.1數據集元數據著錄對具體的衛生健康信息數據集選擇元數據內容進行描述時,以核心元數據作為著錄(根據必選、可選等約束條件)的基礎,然后根據需要可以選擇參考元數據的內容進行著錄,見圖2:5WS/T305-2023圖2直接作為著錄標準的使用方式用戶針對衛生健康信息數據集進行元數據著錄的示例,可參照本標準附錄A(以只著錄核心元5.4.2制定專用標準的依據在衛生健康領域內,以數據集為對象制定專用的元數據標準時,可依照本標準進行制定。所制定的數據集專用元數據標準,必須包含核心元數據的內容,同時將參考元數據的內容作為擴展內容的參考,使用方式見圖3:圖3作為制定專用標準依據時的使用方式要在衛生健康信息參考元數據的基礎上繼續進行元數據內容的擴展時,應當符合附錄B的要求。6元數據內容框架衛生健康信息數據集元數據的全集,即參考元數據的內容規定了7個元數據子集,分別如下:a)元數據標識信息(子集包含元數據本身的基本信息,如名稱、維護方、創建日期等。b)數據集標識信息(子集包含元數據所描述的數據集的基本信息,包括名稱、標識符、提交或發布方等。c)內容信息(子集內容信息提供數據內容特征的描述信息,包括摘要、特征數據元等。d)分發信息(子集分發信息包含有關資源分發者的信息以及用戶獲取資源的途徑。e)數據質量信息(子集數據生產者有關數據集數據志信息的一般說明。f)限制信息(子集包含對數據集和元數據進行訪問和使用的限制信息。g)維護信息(子集包含關于元數據或數據集的更新頻率及更新范圍的信息。參照UML類圖中聚集關系與依賴關系的表示方法,概要描述了衛生健康信息數據集參考元數據的內容框架(見圖4)。6WS/T305-2023圖4衛生健康信息參考元數據內容構成7個子集是參考元數據這一整體的組成部分,在圖4中標記出了各自的可出現次數。元數據標識信息(子集)、數據集標識信息(子集)、限制信息(子集)和維護信息(子集)中有元數據元素使用到了引用信息中由本標準定義的數據類型,所以它們對引用信息存在依賴關系。7衛生健康信息數據集核心元數據7.1概述衛生健康信息核心元數據包括8個必選元數據元素或實體,10個可選元數據元素與實體。衛生健康信息數據集核心元數據內容見表3,其中的第四列“約束”是指該元數據元素或元數據實體是“必選(M)?,或者是“可選(O)?,第五列是說明核心元數據在參考元數據中的相應位置。表3衛生健康信息數據集核心元數據內容1M2M3M4M5M6M7O8O9OOOOMMOOOO7WS/T305-20237.2摘要描述7.2.1數據集名稱(必選)定義:能夠簡要描述衛生健康信息數據集主題與內容的標題英文名稱:datasetTitle數據類型:字符串取值規則:自由文本短名:dataTitle注解:必選項;最大出現次數為17.2.2數據集標識符(必選)定義:衛生健康信息數據集的唯一標識符英文名稱:datasetIdentifier數據類型:字符串取值規則:按照“提交機構-編號-版本號”的命名規則進行賦值。提交機構使用機構標準名稱,版本號用一位整數加兩位小數的表示方式,例如“2.10”(版本)。短名:dataID注解:必選項;最大出現次數為17.2.3數據集摘要(必選)定義:數據集內容的簡單說明英文名稱:abstract數據類型:字符串取值規則:自由文本短名:abstract注解:必選項;最大出現次數為17.2.4數據集提交或發布方(必選)定義:提交或發布數據集,并對數據集的真實性、正確性負責的單位或部門英文名稱:datasetContact數據類型:復合型取值規則:負責方<<數據類型>>(見本標準9.1.1)短名:dataContact注解:必選項;最大出現次數為N7.2.5關鍵詞說明(必選)定義:關鍵詞種類、類型和參考資料英文名稱:DescriptiveKeywords數據類型:復合型短名:DescKeys子元素:關鍵詞說明=1{關鍵詞}n+0{詞典名稱}1注解:必選項;最大出現次數為N關鍵詞定義:用于描述數據集主題的通用詞、形式化詞或短語英文名稱:keyword數據類型:字符串WS/T305-2023取值規則:自由文本短名:keyword注解:必選項;最大出現次數為N詞典名稱定義:正式注冊的詞典名,或類似的權威關鍵詞資料名稱英文名稱:thesaurusName數據類型:字符型取值規則:自由文本短名:thesaName注解:可選項;最大出現次數為17.2.6數據集語種(必選)定義:數據集采用的語言英文名稱:datasetLanguage數據類型:字符串取值規則:語種代碼<<代碼表>>(見本標準9.2.1)短名:dataLang注解:必選項;最大出現次數為N7.2.7數據集特征數據元(可選)定義:衛生健康信息數據集中,能夠表達數據集核心內容與特征資源的數據元列舉英文名稱:characteristicDataElement數據類型:字符串取值規則:自由文本,數據元之間使用英文狀態下的逗號分開短名:charaDataEle注解:可選項;最大出現次數為17.2.8數據集發布日期(可選)定義:衛生健康信息數據集進行提交或發布的日期英文名稱:datasetPublicationDate數據類型:日期型取值規則:按照GB/T7408-2005規定,格式應當為YYYY-MM-DD短名:dataPubDate注解:可選項;最大出現次數為17.2.9數據集分發格式(可選)定義:分發數據的格式說明英文名稱:DistributionFormat數據類型:復合型短名:DistFormat子元素:分發格式=分發格式名稱+注解:可選項;最大出現次數為N分發格式名稱定義:數據集分發格式名稱英文名稱:formatNameWS/T305-2023數據類型:字符串取值規則:自由文本,默認為文件擴展名稱短名:formName注解:必選項;最大出現次數為1版本定義:數據集分發格式所對應的軟件版本(日期、版本號等)英文名稱:formatVersion數據類型:字符串取值規則:自由文本短名:formVer注解:可選項;最大出現次數為17.2.10在線訪問地址(可選)定義:可以對數據集進行在線訪問或獲取的信息英文名稱:online數據類型:字符型取值規則:自由文本,按照RFC2396規定填寫短名:online注解:可選項;最大出現次數為N7.2.11數據集分類(可選)定義:數據集的分類信息英文名稱:DatasetCategory數據類型:復合型短名:DataCat子元素:數據集分類=類目名稱+類目編碼+分類標準注解:可選項;最大出現次數為N類目名稱定義:對應于所使用的某種分類方法所得到的具體類目名稱英文名稱:categoryName數據類型:字符串取值規則:自由文本短名:cateName注解:必選項;最大出現次數為1類目編碼定義:類別名稱對應的編碼英文名稱:categoryCode數據類型:字符串取值規則:自由文本短名:cateCode注解:必選項;最大出現次數為1分類標準WS/T305-2023定義:所依據的分類標準名稱英文名稱:categroyStandard數據類型:字符串取值規則:自由文本短名:cateStd注解:必選項;最大出現次數為17.2.12相關環境說明(可選)定義:說明數據集生產的處理環境,包括軟件、計算機操作系統、文件名和數據量等英文名稱:environmentDescription數據類型:字符串取值規則:自由文本短名:envirDesc注解:可選項;最大出現次數為17.2.13元數據創建日期(必選)定義:創建、采集元數據的日期英文名稱:metadataDateStart數據類型:日期型取值規則:按照GB/T7408-2005規定,格式應當為YYYY-MM-DD短名:mdDateStart注解:必選項;最大出現次數為17.2.14元數據標識符(必選)定義:元數據的唯一標識英文名稱:metadataIdentifier數據類型:字符串取值規則:在7.2.2的數據集標識符取值前加“MD-”字樣。短名:mdID注解:必選項;最大出現次數為1;標識符須唯一、由字母[含下劃線(_)短劃線(-)點(.)斜線(/)逗號和空格]或數字組成7.2.15元數據負責方(可選)定義:提交元數據并對元數據負責的部門和單位英文名稱:metadataContact數據類型:復合型取值規則:負責方<<數據類型>>(見本標準9.1.1)短名:mdContact注解:可選項;最大出現次數為N7.2.16元數據標準名稱(可選)定義:執行的元數據標準名稱英文名稱:metadataStandardName數據類型:字符串取值規則:自由文本短名:mdStdName注解:可選項;最大出現次數為17.2.17元數據標準版本(可選)WS/T305-2023定義:執行的元數據標準版本英文名稱:metadataStandardVersion數據類型:字符串取值規則:自由文本短名:mdStdVer注解:可選項;最大出現次數為17.2.18元數據更新日期(可選)定義:更新元數據的日期英文名稱:metadataDateUpdata數據類型:日期型取值規則:按照GB/T7408-2005規定,格式應當為YYYY-MM-DD短名:mdDateUpd注解:可選項;最大出現次數為18衛生健康信息數據集參考元數據8.1元數據根實體衛生健康信息參考元數據由7個元數據子集構成,繼續采用5.3中的規則來對參考元數據的各個子集、實體和元素進行摘要描述。衛生健康信息參考元數據的根實體描述如下:中文名稱:元數據(根實體)定義:衛生健康信息數據集參考元數據的根實體英文名稱:Metadata數據類型:復合型短名:Metadata子元素:元數據=元數據標識信息子集+數據集標識信息子集+內容信息子集+0{分發信息子集}1+0{數據質量信息子集}n+0{限制信息子集}n+0{維護信息子集}18.2元數據子集8.2.1元數據標識信息子集定義:關于元數據本身的基本信息英文名稱:MetadataIdentificationInfo數據類型:復合型短名:MdIDInfo子元素:元數據標識信息子集=元數據創建日期+元數據標識符+0{元數據負責方}n+0{元數據更新日期}1+0{元數據標準名稱}1+0{元數據標準版本}1+注解:必選項,最大出現次數為1元數據創建日期WS/T305-2023定義:創建、采集元數據的日期英文名稱:metadataDateStart數據類型:日期型取值規則:按照GB/T7408-2005規定,格式應當為YYYY-MM-DD短名:mdDateSt注解:必選項;最大出現次數為1元數據標識符定義:元數據的唯一標識英文名稱:metadataIdentifier數據類型:字符串取值規則:在7.2.2的數據集標識符取值前加“MD-”字樣。短名:mdID注解:必選項;最大出現次數為1;標識符須唯一、由字母[含下劃線(_)短劃線(-)點(.)斜線(/)逗號和空格]或數字組成元數據負責方定義:提交元數據并對元數據負責的部門和單位英文名稱:metadataContact數據類型:復合型取值規則:負責方<<數據類型>>(見本標準9.1.1)短名:mdContact注解:可選項;最大出現次數為N元數據更新日期定義:更新元數據的日期英文名稱:metadataDateUpdata數據類型:日期型取值規則:按照GB/T7408-2005規定,格式應當為YYYY-MM-DD短名:mdDateUpd注解:可選項;最大出現次數為1元數據標準名稱定義:執行的元數據標準名稱英文名稱:metadataStandardName數據類型:字符串取值規則:自由文本短名:mdStdName注解:可選項;最大出現次數為1元數據標準版本定義:執行的元數據標準版本英文名稱:metadataStandardVersion數據類型:字符串取值規則:元數據標準版本的規范寫法短名:mdStdVer注解:可選項;最大出現次數為18.2.2數據集標識信息子集WS/T305-2023定義:元數據所描述的數據集的基本信息英文名稱:DatasetIdentificationInfo數據類型:復合型短名:dataIdInfo子元素:數據集標識信息子集=數據集名稱+數據集標識符+0{目的}1+0{可信度}n+1{數據集提交或發布方}n+1{關鍵詞說明}n+1{數據集語種}n+1{數據集分類}n+0{相關環境說明}1注解:必選項,最大出現次數為1數據集名稱定義:能夠簡要描述衛生健康信息數據集主題與內容的標題英文名稱:datasetTitle數據類型:字符串取值規則:自由文本短名:dataTitle注解:必選項;最大出現次數為1數據集標識符定義:衛生健康信息數據集的唯一標識符英文名稱:datasetIdentifier數據類型:字符串取值規則:按照“提交機構-編號-版本號”的命名規則進行賦值。提交機構使用機構標準名稱,版本號用一位整數加兩位小數的表示方式,例如“2.10”(版本)。短名:dataID注解:必選項;最大出現次數為1目的定義:數據集開發的目的說明英文名稱:purpose數據類型:字符串取值規則:自由文本短名:Purp注解:可選項;最大出現次數為1可信度定義:對數據集中數據內容可靠性的說明英文名稱:credit數據類型:字符串取值規則:自由文本短名:Credit注解:可選項;最大出現次數為NWS/T305-2023數據集提交或發布方定義:提交或發布數據集,并對數據集的真實性、正確性負責的單位或部門英文名稱:datasetContact數據類型:復合型取值規則:負責方<<數據類型>>(見本標準9.1.1)短名:dataContact注解:必選項;最大出現次數為N關鍵詞說明定義:關鍵詞種類、類型和參考資料英文名稱:DescriptiveKeywords數據類型:復合型短名:DescKeys子元素:關鍵詞說明=1{關鍵詞}n+0{詞典名稱}1注解:必選項;最大出現次數為N.1關鍵詞定義:用于描述數據集主題的通用詞、形式化詞或短語英文名稱:keyword數據類型:字符串取值規則:自由文本短名:keyword注解:必選項;最大出現次數為N.2詞典名稱定義:正式注冊的詞典名,或類似的權威關鍵詞資料名稱英文名稱:thesaurusName數據類型:字符型取值規則:自由文本短名:thesaName注解:可選項;最大出現次數為1數據集語種定義:數據集采用的語言英文名稱:datasetLanguage數據類型:字符串取值規則:語種代碼<<代碼表>>(見本標準9.2.1)短名:dataLang注解:必選項;最大出現次數為N數據集分類定義:數據集的分類信息英文名稱:DatasetCategory數據類型:復合型短名:DataCat子元素:數據集分類=類目名稱+WS/T305-2023類目編碼+分類標準注解:可選項;最大出現次數為N.1類目名稱定義:對應于所使用的某種分類方法所得到的具體類目名稱英文名稱:categoryName數據類型:字符串取值規則:自由文本短名:cateName注解:必選項;最大出現次數為.2類目編碼定義:類別名稱對應的編碼英文名稱:categoryCode數據類型:字符串取值規則:自由文本短名:cateCode注解:必選項;最大出現次數為.3分類標準定義:所依據的分類標準名稱英文名稱:categroyStandard數據類型:字符串取值規則:自由文本短名:cateStd注解:必選項;最大出現次數為1相關環境說明定義:說明數據集生產的處理環境,包括軟件、計算機操作系統、文件名和數據量等英文名稱:environmentDescription數據類型:字符串取值規則:自由文本短名:envirDesc注解:可選項;最大出現次數為18.2.3內容信息子集定義:衛生健康信息數據集內容特征的描述信息英文名稱:Content數據類型:復合型短名:Cont子元素:內容信息子集=數據集摘要+0{數據集特征數據元}1+0{數據獲取手段}1+0{數據描述對象}n+注解:必選項,最大出現次數為1數據集摘要WS/T305-2023定義:數據集內容的簡單說明英文名稱:abstract數據類型:字符串取值規則:自由文本短名:abstract注解:必選項;最大出現次數為1數據集特征數據元定義:衛生健康信息數據集中,能夠表達數據集核心內容與特征資源的數據元列舉。英文名稱:characteristicDataElement數據類型:字符串取值規則:自由文本,數據元之間使用英文狀態下的逗號分開。短名:charaDataEle注解:可選項;最大出現次數為1數據獲取手段定義:數據集產生的手段、途徑,包括監測、流調、電子病歷等英文名稱:dataFrom數據類型:字符串取值規則:自由文本短名:dataFrom注解:可選項;最大出現次數為1數據描述對象定義:數據集所描述的對象,包括環境、食品藥品、人群、人體、器官等英文名稱:dataTarget數據類型:字符串取值規則:自由文本短名:dataTarget注解:可選項;最大出現次數為N8.2.4分發信息子集定義:提供數據集的分發格式和分發方式的信息英文名稱:DistributionInfo數據類型:復合型短名:DistInfo子元素:分發信息子集=0{數據集發布格式}n+0{數據集發布日期}n+0{在線訪問地址}n+0{離線發布介質}n注解:可選項;最大出現次數為1數據集分發格式定義:分發數據的格式說明英文名稱:DistributionFormat數據類型:復合型短名:DistFormat子元素:分發格式=WS/T305-2023分發格式名稱+注解:可選項;最大出現次數為N.1分發格式名稱定義:數據集分發格式名稱英文名稱:formatName數據類型:字符串取值規則:自由文本,默認為文件擴展名稱短名:formName注解:必選項;最大出現次數為.2版本定義:數據集分發格式所對應的軟件版本(日期、版本號等)英文名稱:formatVersion數據類型:字符串取值規則:自由文本短名:formVer注解:可選項;最大出現次數為1數據集發布日期定義:衛生健康信息數據集進行提交或發布的日期英文名稱:datasetPublicationDate數據類型:日期型取值規則:按照GB/T7408規定,格式應當為YYYY-MM-DD短名:dataPubDate注解:可選項;最大出現次數為1在線訪問地址定義:可以對數據集進行在線訪問或獲取的信息英文名稱:online數據類型:字符型取值規則:自由文本,按照RFC2396規定填寫短名:online注解:可選項;最大出現次數為N離線發布介質定義:數據集進行離線發布所使用的介質名稱英文名稱:mediaName數據類型:字符串取值規則:介質名稱代碼<<代碼表>>(見本標準9.2.2)短名:medName注解:可選項;最大出現次數為18.2.5數據質量信息子集定義:提供數據集質量的總體評價信息英文名稱:DataQualityInfo數據類型:復合型短名:DataQuaInfo子元素:數據質量信息子集=數據志說明WS/T305-2023注解:可選項;最大出現次數為N數據志說明定義:數據集生產者對數據源和處理步驟的一般說明英文名稱:statement數據類型:字符串取值規則:自由文本短名:statement注解:必選項;最大出現次數為18.2.6限制信息子集定義:對數據集和元數據進行訪問和使用的限制信息英文名稱:DataConstraints數據類型:復合型短名:DataConst子元素:限制信息子集=0{數據集限制信息}n+0{元數據限制信息}n+注解:可選項;最大出現次數為N數據集限制信息定義:提供數據集和元數據進行訪問和使用的限制信息英文名稱:datasetConstraints數據類型:復合型取值規則:限制信息<<數據類型>>(見本標準9.1.2)短名:dataConst注解:可選項,最大出現次數N元數據限制信息定義:對元數據進行訪問和使用的限制信息英文名稱:metadataConstraints數據類型:復合型取值規則:限制信息<<數據類型>>(見本標準9.1.2)短名:mdConst注解:可選項,最大出現次數N8.2.7維護信息子集定義:對數據集或元數據進行更新與維護的有關信息英文名稱:MaintenanceInfo數據類型:復合型短名:MaintInfo子元素:維護信息=0{數據集維護信息}1+0{元數據維護信息}1注解:可選項;最大出現次數為1數據集維護信息定義:對數據集進行更新與維護的有關信息英文名稱:datasetMaintenanceInfo數據類型:復合型取值規則:數據維護信息<<數據類型>>(見本標準9.1.3)WS/T305-2023短名:dataMaint注解:可選項,最大出現次數為1元數據維護信息定義:元數據更新與維護的相關信息英文名稱:metadataMaintenance數據類型:復合型取值規則:數據維護信息<<數據類型>>(見本標準9.1.3)短名:mdMaint注解:可選項,最大出現次數為19引用信息與代碼表9.1引用信息9.1.1負責方<<數據類型>>定義:負責單位或聯系人的相關信息英文名稱:ResponsibleParty數據類型:復合型短名:RespParty注解:可選項;最大出現次數為N子元素:負責方=負責單位名稱+0{聯系人姓名}n+0{聯系電話}n+0{負責方地址}1+0{郵政編碼}1+0{電子郵件地址}n負責單位名稱定義:負責單位名稱英文名稱:responsibleOrganizationName數據類型:字符串取值規則:自由文本短名:rpOrgName注解:必選項;最大出現次數為1聯系人姓名定義:聯系人姓名英文名稱:responsibleIndividualName數據類型:字符串取值規則:自由文本短名:rpIndName注解:可選項;最大出現次數為N聯系電話定義:可以與負責人或負責單位聯系的電話號碼英文名稱:contactPhone數據類型:字符串取值規則:自由文本短名:cntPhoneWS/T305-2023注解:可選項;最大出現次數為N通訊地址定義:能夠進行郵政聯系的詳細地址英文名稱:postalAddress數據類型:字符串取值規則:自由文本短名:postAddr注解:可選項;最大出現次數為1郵政編碼定義:郵政編碼英文名稱:postalCode數據類型:字符串取值規則:按GB/T2260的規定短名:postCode注解:可選項;最大出現次數為1電子郵件地址定義:聯系人或負責單位的電子郵件地址英文名稱:electronicMailAddress數據類型:字符串取值規則:自由文本短名:eMailAdd注解:可選項;最大出現次數為N9.1.2限制信息<<數據類型>>定義:對數據集和元數據的訪問、使用以及安全施加的限制和約束英文名稱:Constraints數據類型:字符串短名:Consts子元素:限制信息=1{訪問限制|使用限制}n+安全限制分級注解:條件必選項;最大出現次數為N;當不選用“使用限制”時為必選訪問限制定義:為保護隱私權或知識產權,對訪問元數據施加的限制和約束英文名稱:accessConstraints數據類型:字符串取值規則:限制代碼<<代碼表>>(見本標準9.2.3)短名:accessConsts注解:條件必選項;最大出現次數為N;當不選用“使用限制”時為必選使用限制定義:為保護隱私權或知識產權,對使用元數據施加的限制和約束英文名稱:useConstraints數據類型:字符串取值規則:限制代碼<<代碼表>>(見本標準9.2.3)短名:useConsts注解:條件必選項;最大出現次數為N;當不選用“訪問限制”時為必選WS/T305-2023安全限制分級定義:對元數據處理限制的名稱英文名稱:securityClassification數據類型:字符串取值規則:安全限制分級代碼<<代碼表>>(見本標準9.2.4)短名:secuClass注解:必選項;最大出現次數為19.1.3數據維護信息<<數據類型>>定義:對數據進行更新與維護的有關信息英文名稱:DataMaintenance數據類型:復合型短名:DataMaint子元素:數據維護信息=維護和更新頻率+0{更新范圍說明}n+0{維護注釋}n+0{維護方聯系信息}n維護和更新頻率定義:在數據集初次完成后,對其進行修改和補充的頻率英文名稱:maintenanceAndUpdateFrequency數據類型:字符串取值規則:維護頻率代碼<<代碼表>>(見本標準9.2.5)短名:mainFreq注解:必選項;最大出現次數為1更新范圍說明定義:數據集內容更新范圍的說明英文名稱:updateScopeDescription數據類型:字符串取值規則:范圍代碼<<代碼表>>(見本標準9.2.6)短名:upScpDesc注解:可選項;最大出現次數為N維護注釋定義:有關對數據集維護更新的特殊需求信息英文名稱:maintenanceNote數據類型:字符串取值規則:自由文本短名:maintNote注解:可選項;最大出現次數為N維護方聯系信息定義:聯系負責維護數據集的人和單位的標識和方法英文名稱:contact數據類型:復合型WS/T305-2023取值規則:負責方<<數據類型>>(見本標準9.1.1)短名:maintCont9.2代碼表9.2.1語種代碼表<<代碼表>>12345679.2.2介質名稱代碼<<代碼表>>1234567899.2.3限制代碼<<代碼表>>1法律批準的發行者在確定的時間內,對出版、創作或銷售數據資料的專有權利,或使用商業印刷品或2patent政府已經批準的制造、出售、使用或特許發明或發3patentPending4正式注冊標識產品的、法律上只限于所有者或廠商56從創造活動生產的無形資產的分發或分發控制獲得78WS/T305-20239.2.4安全限制分級代碼<<代碼表>>12349.2.5維護頻率代碼<<代碼表>>12數據每天更新一次3數據每周更新一次4數據每兩周更新一次5數據每月更新一次6數據每季更新一次78數據每年更新一次9unknown9.2.6范圍代碼<<代碼表>>123part4WS/T305-2023(資料性)衛生健康信息數據集核心元數據著錄示例以《2022年中國衛生健康統計年鑒》中的衛生設施數據集為例,進行衛生健康信息數據集的核心元數據著錄。《2022年中國衛生健康統計年鑒》中,包含了醫療衛生機構、衛生人員、衛生設施、衛生經費、醫療服務、基礎醫療衛生服務、中醫藥服務、婦幼保健、人民健康水平、疾病控制與公共衛生、居民病傷死亡原因等16個部分,每個部分圍繞主題內容進行收據的收集、形成數據集合,分別構成16個數據集。以其中的衛生設施數據及內容為例,進行核心元數據的著錄見表A.1。表A.12022年中國衛生健康統計年鑒衛生設施數據集核心元數據著錄示例主要介紹全國及31個省、自治區、直轄市醫療衛生機構床位、醫用設備、房屋面積數據集提交床位數,每千人口醫院,衛生院床位數,設備臺數,購數據集發布《2022年中國衛生健康統計年鑒》內容的一個部MD-國家衛生健康委員會-2022年中國衛生健康統計年鑒-衛元數據負責方WS/T305-2023(規范性)衛生健康信息數據集元數
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 33798-2025生物聚酯連卷袋
- 期中測試卷 第1、2、3單元 (含答案)統編版七年級語文下冊
- 財務決策與風險管理相關對策試題及答案
- 項目戰略思考的試題及答案
- 駕校教練車使用承包協議
- 探究2025年國際金融理財師考試的投資者行為試題及答案
- 項目管理資格考試中的重要習慣與試題答案
- 行政管理師考試的知識與能力要求試題及答案
- 有趣的學習角度的證券從業資格證考試試題及答案
- 戰略調整的關鍵因素與總結計劃
- 菠蘿蛋白酶的影響因素及影響其酶活力的因素
- 前言 馬克思主義中國化時代化的歷史進程與理論成果
- 職業高中高二上學期期末英語試題卷(含答案)1697
- 2022河南大學版四年級信息技術下冊全冊教案
- 《格林童話》讀書分享ppt
- DNA的粗提取和鑒定(香蕉)
- 2023年大學生創業的商業計劃書模板(四篇)
- GA 137-2007消防梯
- 通用報價單模板
- 血精的診治課件
- 考研考博-英語-北京建筑大學考試押題三合一+答案詳解4
評論
0/150
提交評論