TGDPHA 003-2023 病毒性肝炎臨床表型數據共享標準_第1頁
TGDPHA 003-2023 病毒性肝炎臨床表型數據共享標準_第2頁
TGDPHA 003-2023 病毒性肝炎臨床表型數據共享標準_第3頁
TGDPHA 003-2023 病毒性肝炎臨床表型數據共享標準_第4頁
TGDPHA 003-2023 病毒性肝炎臨床表型數據共享標準_第5頁
已閱讀5頁,還剩21頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

ICS11.020CCSC05StandardforSharingClinicalphenotypicdataIT/GDPHA003—2023 3 33規范性引用文件 44術語和定義 55病毒性肝炎臨床表型數據采集規范 66病毒性肝炎臨床表型數據存儲規范 77病毒性肝炎臨床表型數據治理規范 88病毒性肝炎臨床表型數據共享使用規范 9病毒性肝炎臨床表型數據驗證規范 10病毒性肝炎臨床表型數據安全及倫理規范 11病毒性肝炎常用數據標準集示例 T/GDPHA003—2023本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結構和起草規則》的規定起請注意本文件的某些內容可能涉及專利。本文件的發布機構不承擔識別專利的責任。本文件由中山大學附屬第三醫院提出。本文件由廣東省醫院協會歸口。本文件起草單位:中山大學附屬第三醫院、廣東精點數據科技股份有限公司、廣州市疾病預防控制中心、中山大學、廣州市城市規劃勘測設計研究院、醫渡云(北京)技術有限公司、聯通(廣東)產業互聯網有限公司、廣州市白云區疾病預防控制中心本文件主要起草人:劉子鋒、盧婭欣、揭育勝、崇雨田、李新華、李爍、周曉梅、吳元凱、李向永、龔嬌、李青海、秦鵬哲、袁俊、杜志成、劉洋、朱博威、高偉、朱艷春、陸劍云3T/GDPHA003—2023病毒性肝炎臨床表型數據共享標準目前對醫院內臨床表型數據的研究日益受到重視,許多國際權威期刊如《新英格蘭醫學雜志》和《美國醫學會雜志》等均利用醫院臨床表型數據發表了大量文章。然而目前相關建設廠商間采用的系統各異,相關標準與規范不統一,在缺乏數據共享標準和質量控制標準的情況下,難以進行數據共享、挖掘等研究,對數據共享和利用造成障礙。病毒性肝炎是一種常見的傳染病,對人民健康和社會發展造成了嚴重影響。目前對于病毒性肝炎的相關研究還大多集中在基礎研究領域,然而對臨床表型數據的利用尚不充分,究其原因在于缺少臨床數據共享標準。病毒性肝炎臨床表型數據共享標準是指在保障患者隱私和個人信息安全的前提下,促進病毒性肝炎臨床表型數據在各機構間的共享和交流,推動該病種的預防和治療研究。該共享標準的制定,可以規范其數據的采集和管理,提高數據的質量和可靠性,為科學研究提供更加豐富且準確的數據資源。目前國際上已經初步建立了幾個病毒性肝炎臨床表型數據共享平臺,如美國國立衛生研究院的全球肝病數據庫(GlobalHepatitisOutcomesLiKaInitiative,GHOLKI)、歐洲肝病研究會的肝病數據庫(LiverDiseaseDatabase,LDD)等。然而,目前國際常見的臨床醫學術語,包括醫學系統命名法-臨床術語(SystematizedNomenclatureofMedicine--ClinicalTerms,SNOMEDCT)、觀測指標標識符邏輯命名與編碼系統(LogicalObservationIdentifiersNamesandCodes,LOINC)等,其標準制定的數據基礎大多來自于歐美,而中國國內的很多指標定義與國外不甚相同,且國外各自標準的制定也均不一致,比如,中國診斷指南、亞太標準及歐洲標準對“慢加急性肝衰竭”的定義各不相同。基于以上問題,暫時難以實現對各單位間病毒性肝炎數據的規范化共享與交流。因此,建立一套針對中國患者的病毒性肝炎明確統一的數據元定義,確定臨床表型數據統一表達的內容和方式,統一同源數據的收集內容與方法,從而改善數據的共享與使用效率,顯著推動病毒性肝炎的預防和治療研究。2范圍旨在推動數據共享,方便科研工作者獲取臨床表型數據開展科學研究,針對我國法定乙類傳染病中發病率最高的病毒性肝炎病種制定本標準。本標準的發起基于廣州市科技計劃《重大傳染病監測預警系統構建關鍵技術研究與示范應用》(項目編號202206080003)。本標準適用于對中國病毒性肝炎臨床表型數據進行規范性數據治理、共享及利用,可供醫療機構、科研機構及科研工作者使用。本標準確定了中國病毒性肝炎臨床表型數據共享的通用規范,規定了病毒性肝炎在數據采集、存儲、治理、共享、驗證以及數據安全及倫理等方面的要求,對病毒性肝炎專病數據庫設計、建設、數據采集、數據關聯、數據共享、隱私保護等具有借鑒意義。本標準的應用可指導病毒性肝炎臨床表型數據在我國多地區、多中心及不同層級醫院的匯集與管理,促進數據互聯互通與共建共享,為我國醫療數據資源整合和利用提供參考工具;對提升臨床研究水平,促進國內外病毒性肝炎研究的交流和合作具有重要的意義和價值。本標準的應用思路如下圖1。4病毒性肝炎病毒性肝炎臨床表型數據共享標準GB/T38664.1-2020信息技術大數據政務數據開放共享第1部分:總則WS445.2-2014電子病歷基本數據集第2部分:門(急)診病歷WS445.3-2014電子病歷基本數據集第3部分:門(急)診處方WS445.16-2014電子病歷基本數據集第16部分:轉診(院)記錄5T/GDPHA003—20234術語和定義下列術語和定義適用于本文件。4.1病毒性肝炎(ViralHepatitis)病毒性肝炎是由肝炎病毒引起的,以損害肝臟為主的感染性疾病。具有傳染性強、傳播途徑復雜、流行面廣泛,發病率較高等特點。臨床上主要表現為乏力、食欲減退、惡心、嘔吐、肝腫大及肝功能損害。從病原學上劃分,包括甲、乙、丙、丁、戊型肝炎;從臨床表現上劃分,包括急性肝炎、慢性肝炎、重型肝炎、淤膽型肝炎、肝炎肝硬化。4.2臨床表型數據(ClinicalPhenotypicData)指患者在疾病發生過程中所呈現的臨床表現、體征、檢查結果等信息所組成的數據,如生化指標、影像學檢查結果等。4.3數據采集(DataCollection)指從各種來源收集數據的過程,可能涉及從臨床醫療記錄、生物樣本、傳感器設備等收集數據的方法和過程。4.4數據存儲(DataStorage)指將采集到的數據保存在特定的存儲介質或系統中的過程,該過程涉及將數據存儲在數據庫、云存儲或其他物理介質中,以供后續分析、共享或使用。4.5數據治理(DataManagement)指對院內數據資產進行管理和控制,支撐并保障數據被安全高效地交換與應用的過程。4.6數據加密(DataEncryption)指通過使用加密算法,將數據轉換為密文的過程,以保護數據的機密性和安全性,防止未經授權的訪問和數據泄露。4.7數據傳輸(DataTransmission)指在不同系統、設備或網絡之間傳輸數據的過程。4.8數據脫敏(DataDesensitization)指通過模糊化等方法處理原始數據,以實現屏蔽敏感數據且屏蔽后的數據不可恢復的數據保護方式。4.9數據共享(DataSharing)指將臨床表型數據和生物組學數據提供給其他研究人員的過程,這一過程涉及數據的采集、錄入、治理、共享、存儲和使用。4.10數據提供者(DataProviders)指生產或收集數據,并提供數據進行共享的個人、組織和機構。4.11數據使用者(DataUsers)6T/GDPHA003—2023指對臨床表型數據和生物組學數據有使用需求的個人、組織和機構。4.12服務提供者(ServiceProviders)指為數據提供者、使用者或平臺管理者提供數據存儲、數據分析處理、數據安全保障、數據保護能力測評等技術和安全服務,對平臺管理者的工作提供支撐的個人、組織和機構。4.13監督者(Supervisor)指依照國家法律法規和政策文件的授權,對數據共享進行指導、監督管理的政府部門,包括網信、公安、安全、保密等部門。5病毒性肝炎臨床表型數據采集規范在進行病毒性肝炎數據采集前,應先明確采集前相關準備工作,如是否已通過倫理審查、采集對象的數據結構、被抽取系統的數據庫類型、采集工具、采集方式、存儲方式、校驗方式以及數據安全保障等,制定完善的采集方案。同時數據采集人員應該接受標準化統一培訓,以此確保所采集數據的合法性、規范性、可靠性、準確性、一致性等。5.1數據采集前的準備工作1)倫理審查:倫理審查過程用于確保研究符合倫理規范并保護研究對象的權益。數據采集前,應確保研究對象知情同意并簽署知情同意書,盡可能保證其隱私和自主權并通過倫理委員會審查。數據采集時,應保持數據的安全性和完整性,且為確保研究過程中的公正性和透明度,應及時向研究對象和其他相關方披露研究結果。同時,還應嚴格明確限制數據的使用范圍和訪問權限,定期更新相關隱私政策。2)制定規范化采集方案:包括明確研究對象的范圍和特征,開展實地調研以明確需求,系統探查和測試,明確醫院被抽取的業務系統承載能力,選擇合適的采集工具和采集方式,避免出現數據采集過程中可能導致的系統崩潰等問題。3)數據安全:采集人員應具有合法的采集文件,如合同、授權書等,并應簽署個人保密協議或承諾書以保障數據采集過程中的信息安全和患者隱私。4)召開項目啟動會:對數據采集相關人員進行系統培訓,統一步調,設定項目負責人負責整個項目進度,并詳細制定項目計劃書。5.2數據采集原則1)科學性:數據采集的方法須符合科學規范和標準,同時應注意避免主觀臆斷和誤導性解讀等問題,確保數據客觀。2)準確性:數據采集前需選擇可靠的數據源,并規范數據采集標準,以保證數據質量和可信度。數據采集后需要進行數據校驗和清洗,通過對所采集的數據進行邏輯關系、范圍格式等方面的校驗,并對異常值、缺失值、重復值等數據進行識別處理,從而糾正數據中的錯誤和不一致性。3)全面性:數據采集應全面反映所研究對象的各方面臨床特征,包括人口學基本信息、診斷、手術、生化、影像以及量表問卷等多領域指標。4)完整性:數據采集應盡可能完整覆蓋研究對象所處的各個環節,包括入院前、入院時、治療過程和隨訪等階段,并對數據采集的審核流程進行嚴格把控,具體包括:a.預審核階段:在數據輸入之前進行預審核,檢查數據的格式、完整性和合理性。例如,對于實驗室數據,確保所有必要的生物標志物都已被記錄。7T/GDPHA003—2023b.實時審核:在數據錄入過程中實施實時審核機制,以識別和糾正任何錯誤或異常。例如,設置系統自動檢測超出正常范圍的數值。c.后審核階段:在數據錄入完成后進行最終審核,以確保數據的完整性和準確性。這包括比較不同數據源之間的信息,以驗證數據的一致性。5)可擴展性:在采集數據時,應考慮到未來可能出現的新問題和需求,盡量使得數據可擴展、可更新。因此,在確定采集工具和標準時需要盡可能具有普適性和通用性。6)數據質控標準:在數據采集前應制定詳細的數據質量控制標準,采集過程中應定期進行數據質量評估,例如定期對數據庫進行抽樣審查,以評估數據質量。此外,還需進行持續的數據質量改進工作,根據定期評估的結果,不斷優化數據采集和管理流程。5.3數據采集范圍病毒性肝炎數據采集的過程中,應盡量保證數據涵蓋患者在院內信息系統內的全部信息,因信息系統原因無法關聯的信息可通過自建主索引或人工制定規則進行關聯,仍無法關聯的信息應存儲備用。同時建議將患者隨訪信息關聯到院內信息,構建多模態數據集(含影像、超聲、病理、組學等數據模式)。病毒性肝炎數據的采集內容包括但不限于:患者基本信息(包括姓名、年齡、性別等)、病史(包括現病史、既往史、個人史等)、疾病診斷(包括主次要診斷、疾病相關并發癥等)、檢查結果、檢驗結果、醫囑、手術記錄和用藥記錄(包括醫生的處方藥品名稱、用量、頻率等),以及其他非結構化數據(包括患者主訴、醫生診療意見、波形數據以及影像圖片等)。5.4數據采集方式在進行病毒性肝炎數據采集時,應根據數據類型和采集目的選擇合適的采集方式。主要采集方式包括以下6種:1)接口方式:即通過建立API接口對接醫院相關業務系統獲取患者數據。例如,通過對接電子病歷系統獲取患者基本信息、就診記錄、診斷結果、用藥信息等;通過對接醫學影像系統獲取患者的X線、CT、磁共振等醫學影像數據;通過對接檢驗系統收集患者實驗室檢驗數據;通過對接藥物管理系統獲取患者處方信息和用藥記錄等。2)整庫采集方式:通過與數據庫建立連接,使用SQL等查詢語言從數據庫中直接采集數據。常見的數據庫連接方式包括ODBC(OpenDatabaseConnectivity)、JDBC(JavaDatabaseConnectivity)以及ORM(Object-RelationalMapping)等框架。3)電子表單采集方式:即通過讀取和寫入各種文件格式來實現數據采集。常見的文件格式包括CSV(逗號分隔值)、Excel、JSON(JavaScriptObjectNotation)、XML等。4)移動設備采集方式:通過佩戴可測量和記錄健康相關生理參數的傳感器,可以對患者的心率、步數、睡眠狀態、運動等數據進行實時采集。同時,患者也可利用具有用戶界面的移動設備自發記錄其日常飲食攝入情況、藥物使用情況、血壓及血糖等數據。5)人工錄入方式:對于紙質量表、紙質問卷或其他數據無法電子化的情況,可采用手動錄入的方式進行收集。擔任數據錄入工作的人員應接受相關培訓,了解問卷量表的內容、填寫規則以及數據錄入標準等,錄入時應使用專業的數據錄入工具,并設立嚴格的數據驗證和檢查機制,必要時可采用雙重錄入和復核的方式。錄入后應對數據采取抽樣核查、重復錄入比對及邏輯驗證等質控方式,保障數據準確性。6)其他采集方式:對于以上5種采集方式均不適用的情況,使用者可根據實際情況采用適當的方式進行數據收集。6病毒性肝炎臨床表型數據存儲規范8T/GDPHA003—2023病毒性肝炎臨床表型數據存儲的規范應遵循安全性和完整性原則,采取相應的安全措施和完整性檢查機制,保障數據的安全性和完整性。6.1數據存儲分類在進行數據分類存儲時,應重點注意以下幾點事項:1)根據數據敏感程度進行分類存儲:對于高敏感數據應當加密存儲,避免未經授權人員訪問造成數據泄露。2)根據數據格式進行分類存儲:對于非結構化數據如病理圖像等占用存儲空間較大的數據,可存儲其調用地址,避免冗余存儲。6.2數據存儲備份為了防止數據丟失或損壞,應建立定期備份機制。備份數據應存儲在不同的地點和存儲介質上,以確保在數據丟失或損壞的情況下也能夠恢復數據。1)多地備份:為了避免單點故障和數據意外丟失,建議將數據備份到不同的位置,如不同機房、不同城市等。2)定期備份:定期進行數據備份可以確保數據的及時性和完整性,且可避免因數據更新導致舊數據被覆蓋的情況。3)數據恢復測試:在備份數據后,需要進行數據恢復測試以確保備份數據可以正常恢復。4)備份規范操作:備份操作應由專業人員進行,并且應該遵守一定的規范操作,包括備份時間、備份方式、備份文件命名規則等。6.3數據存儲安全病毒性肝炎數據存儲的第一原則是保證數據的安全性。這包括采取各種安全措施來保護數據免受未經授權的訪問和惡意攻擊,如限制數據訪問權限、使用身份驗證和加密技術等。此外,在數據傳輸和共享過程中,也應采取相應的安全措施,如使用安全協議和加密傳輸等,以確保數據的機密性和完整性。1)數據加密:所有敏感或個人身份識別信息必須進行加密,應通過使用強密碼、數字證書以及其他可靠的加密技術來實現。2)訪問權限控制:管理員應對所有用戶和數據的訪問權限進行分層分級管理,所有訪問記錄都應記錄存儲,以便核對溯源。3)物理隔離:對于存儲敏感信息的服務器等設備,必須嚴格控制物理訪問,可通過使用安全門禁、視頻監控、報警系統等措施來實現。4)軟件安全:所有服務器均應安裝病毒防護軟件,并定期開展安全自查工作,任何發現的漏洞都須盡快修復,并定期進行更新和升級。6.4數據存儲完整性校驗數據完整性是指數據在存儲、傳輸和處理過程中保持其完整性和準確性。所有與病情診斷和治療有關的信息都應被收集并記錄下來,包括癥狀、檢查結果、診斷、治療方案和隨訪情況等。為確保數據的完整性,應采取一系列措施,如數據備份、版本控制和數據校驗等。可引入自動化的數據完整性檢查和監控機制,如定期自動檢查數據的完整性、設置異常報警機制等,以提高數據完整性的維護效率。7病毒性肝炎臨床表型數據治理規范7.1明確治理目標9T/GDPHA003—2023明確數據治理目標可以幫助制定有效的數據治理策略和措施。在對數據進行后結構化處理前,需明確數據來源、提取類型、輸出值域等內容。例如,計劃開展針對現病史癥狀的后結構化任務時,需要明確以下問題:1)針對單科還是全科,數據來源應與目標一致。2)后結構化任務的實體類型和關系類型。例如,除了提取癥狀外,是否還需提取與癥狀相關的有無、發生時間、性質程度、誘因等。3)值域如何定義及展示等問題。7.2標準數據元定義為了方便不同醫療機構間的數據交流和共享,需要將病毒性肝炎臨床表型數據轉化為統一的數據元,標準化數據元應與國際或國家的現有標準(如LOINC、SNOMEDCT等)一致,以便于跨機構間的數據共享和比較以保證數據的可比性和可重復性。例如,在描述病毒RNA或DNA在單位體積血液中的含量水平時,可以使用“病毒載量”作為數據元的名稱,并使用“國際單位/毫升(IU/mL)”來描述其計量單位。同時,還需定義該數據元的取值范圍、采樣時間、采集方法等相關信息,以確保數據的準確性和一致性。7.3結構化數據治理方式針對病毒性肝炎患者的基本信息、檢驗結果、診斷數據和醫囑等結構化數據,可使用以下質檢和校驗機制,以保障和提高數據質量:1)數據完整性校驗:包括必填字段的校驗以及約束條件的驗證等。比如使用既定的數據約束規則,確保必需字段不為空,所有字段均滿足定義的數據類型和長度,數據值符合有效范圍等。2)數據一致性校驗:包括數據關聯和關系的驗證等。確保同一患者的所有數據記錄在不同時間點保持一致,如檢驗結果的時間序列應連續無缺。3)邏輯判斷規則:評估數據的合理性,例如使用統計分析方法檢查數據分布是否符合預期,或檢查年齡、性別等基本信息的邏輯一致性。可以通過邏輯判斷規則驗證數據的邏輯關系、邏輯流程和邏輯約束,以確保數據符合邏輯規則和業務規范。4)數據重復性校驗:避免重復錄入相同的數據,確保每條記錄的唯一性。數據異常檢測和質控:通過建立數據異常檢測和糾正機制,及時發現和修正結構化數據中的異常或錯誤。可以使用數據質量儀表板,結合自動化數據監測工具和規則,監測潛在的數據質量問題,并提供糾正措施。比如識別和修正數據中的重復記錄、無效值、異常趨勢等。7.4非結構化數據治理方式針對非結構化數據,例如醫療記錄和圖像等,應采用合適的數據治理方式,如自然語言處理和圖像識別等技術,以便更好地管理和利用這些數據。基于字典表等規則匹配和基于NLP算法是數據后結構化處理的兩種常見方式,就實際應用而言,二者皆有利弊。基于規則的方法主觀性強,實現快捷,但可移植性不好,很難覆蓋所有語言現,且易存在歧義現象。而分詞、標注等NLP算法有自主學習能力,能夠挖掘文本規律識別各類實體,對文本歧義及變化容錯性更高,且能通過不斷訓練提高準確性。但NLP方式往往需要大量的標注樣本,成本高,實現復雜度較大。很多情況下也會將二者結合起來開展一系列后結構化任務。此外,隨著生成式人工智能技術的迅速發展,基于大語言模型(LargeLanguageModel,LLM)對非結構化數據進行語義理解的模式也作為數據治理的新興方法。通過大語言模型的信息抽取能力,對長文本非結構化數據進行語義定位,提取潛在實體及關系以構建實體關系三元組,并將所提取的三元組映射到相關醫學專業術語庫及映射詞典,從而形成結構化醫學標準數據。此種模式構建流程相對自動化、T/GDPHA003—2023耗費成本低,能通過小樣本數據標注快速提取到非結構化文本數據中的重要信息,且基于醫學術語庫的術語映射可對非結構化數據的挖掘顆粒度更細化。8病毒性肝炎臨床表型數據共享使用規范病毒性肝炎臨床表型數據共享的規范應包括共享目的、共享對象、共享權限和數據隱私保護等方面。在進行數據共享時,應遵循相關規定標準和倫理標準,確保數據的安全性和隱私保護,同時促進病毒性肝炎的研究和治療發展。8.1共享目的在進行病毒性肝炎數據共享前,應先明確數據共享的目的,并確保所有參與方都清楚了解,如促進科學研究、改善醫療服務、推動醫療技術的發展等。數據共享過程應符合相關法律法規和倫理標準,確保數據合法、安全地被使用和共享。例如,歐盟于2016年通過的《一般數據保護法案(GDPR)》規定了個人數據處理的合法性標準以及相關隱私權保護的規定。8.2共享方式常見的數據共享接口形式主要包括實時接口和文件接口。1)實時接口:是指在數據共享平臺上直接進行數據交互,可實現即時查詢、檢索和獲取數據。2)文件接口:是將數據以文件的形式進行傳遞,常見的文件格式包括CSV、Excel、XML等。在實際應用中,不同的臨床表型數據共享方案可能采用不同的數據接口形式或者混合模式,具體選擇應根據實際情況進行綜合考慮。8.3成果分配臨床表型數據共享使用后的成果分配需要綜合考慮多個利益相關方的權益和需求,并通過協商達成一定的共識和平衡。通常,需要考慮以下幾個方面:1)數據提供者:如果臨床表型數據是由某家醫院提供,則該機構可能會要求對使用后的成果進行一定的歸屬。2)數據使用者:如果臨床表型數據被用于研究或開發某種新的醫療產品或服務,那么數據使用者可能會要求獲得一定程度的知識產權或商業利益(可通過協議簽署達成)。3)研究人員:如果數據被用于研究,研究人員可能因此獲得一定的學術聲譽、出版和發表論文的機會,以及可能的研究資金或獎勵等。4)患者:所有的數據利用最終受益的是患者,因此患者的權益也應該得到重視,患者應能夠享有數據所帶來的的醫療進步成果。同時在共享成果分配時,也應考慮如何回饋患者,例如提供參研補貼。8.4共享數據的隱私保護機制在進行病毒性肝炎數據共享前,建立共享數據隱私保護機制是非常重要的,這些機制旨在確保患者的隱私和數據安全不會受到侵犯。1)共享數據應該采用匿名化或去標識化的方式去除個人身份信息和敏感信息等。匿名化可以通過刪除或替換數據中個人身份信息(如姓名、社會保障號碼等)來實現,使患者無法被唯一識別出來。去標識化則是在保留一部分識別信息的基礎上對數據進行處理,以確保患者個體隱私的保護。T/GDPHA003—20232)數據共享需要遵守相關法律法規的規定。例如在我國,病毒性肝炎數據共享時應嚴格遵守《中華人民共和國個人信息保護法》等相關法律法規。3)數據共享應采用安全的傳輸和存儲方式,防止未經授權的訪問引發數據泄漏。這些技術包括加密技術、網絡隔離、訪問控制、審計跟蹤等。4)明確共享數據的范圍應該是必要的,數據使用者可獲得的數據不得超出特定研究或臨床實踐所需的范圍。5)根據2021年《中華人民共和國個人信息保護法》相關條例,未滿十四周歲未成年人的個人信息全部作為敏感個人信息,因此數據共享對象應對此部分人群制定專門的個人信息處理規則。在進行病毒性肝炎數據共享時,共享對象應簽署保密協議,保證共享的數據不會被濫用、非法使用或泄露。例如,在共享醫療圖像或健康信息時,應確保受試者的身份得到保護,重點要求其保證數據的安全性和隱私性,盡可能保護病人的權益和利益,避免泄露敏感信息。同時,還需要考慮受試者知情同意的問題,確保數據采集和共享是建立在受試者自愿參與的基礎上進行的。9病毒性肝炎臨床表型數據驗證規范病毒性肝炎臨床表型數據驗證的規范應包括真實性原則、保密性原則、有限性原則和權威性原則等方面。在進行數據驗證時,應遵循相關的規定標準和倫理要求,確保驗證結果具有可靠性和權威性。9.1來源真實性規范在對病毒性肝炎數據進行驗證時,應確保數據的真實性和準確性。所提取的所有驗證測試數據首先要保證來源都必須是醫院真實的醫療文檔,遇到模糊不清的問題時,只能認真求真,絕不得以任何理由隨意改變測試數據的內容,即使在進行數據增強等涉及具體文本內容操作時,也應該在不改變原始文檔內容的前提下進行。驗證人員應對驗證數據的來源進行核實,并進行必要的數據清洗和處理。驗證結果應基于可靠的數據來源,并避免虛假數據造成的誤導和誤判。9.2保密性規范在進行病毒性肝炎數據驗證時,應嚴格保守數據隱私和機密性,無論是從法律層面還是從倫理層面,都要求遵循保密性原則。這一原則要求不僅要在提取前數據清洗階段做到脫敏,在驗證測試時也要進行脫敏操作,以有效保障患者的隱私和避免數據泄露。驗證人員應簽署保密協議,確保驗證數據不會被非法使用或泄露。同時,應采取必要的技術和管理措施,防止數據被不正當使用或訪問。9.3有限性原則在進行病毒性肝炎數據驗證時,應遵循有限性原則。應該承認,建立的任何模型都是有限的,即模型只能適用于一定范圍內的數據,模型不可能無限制推廣。也就是說任何訓練出來的模型都應有與之相對應的有限數據范圍,不存在一個大而全的模型能夠覆蓋并驗證所有測試數據。每個模型都有其對應的業務域,不能一味地追求泛化能力而忽略模型的生效范圍。驗證人員應明確驗證的數據范圍和驗證的目的,避免無關的數據被驗證和使用。同時,應遵循數據共享的相關規定,僅在合法的權限范圍內使用驗證數據。常用的模型評估指標如下:1)AUC(ReceiverOperatingCharacteristiccurveandAreaUndertheCurve用于評估二分類模型的性能。2)準確率(Accuracy):正確預測的樣本數與總樣本數的比例。3)召回率(Recall):所有實際為正類的樣本中,被模型預測為正類的比例。4)F1分數(F1Score):綜合考慮精確率和召回率的平衡指標。T/GDPHA003—20235)均方誤差(MeanSquaredError,MSE):預測值與真實值之間的平均差距的平方。6)平均絕對誤差(MeanAbsoluteError,MAE):預測值與真實值之間的平均絕對差距。7)R方(R-squared):模型對因變量變化的解釋能力。9.4權威性原則在進行病毒性肝炎數據驗證時,應確保驗證結果具有權威性和可信度。驗證人員應具備相關的專業知識和技能,并采用合適的驗證方法和工具,確保驗證結果可靠和準確。可根據模型的類型和任務,選擇相應的性能評估指標來衡量模型的性能表現。此外,還可以使用交叉驗證、混淆矩陣等方法來更全面地評估模型的性能和泛化能力。任何有疑議的測試結果,其最終的判斷都應該以臨床醫生或專家的判斷為金標準。由于醫療文檔的專業性和復雜性,當發生疑議時往往還需要咨詢對應專科的醫生。同時,驗證結果應基于科學的數據分析和研究,避免主觀臆斷或偏見造成的誤判和誤導。10病毒性肝炎臨床表型數據安全及倫理規范數據安全和倫理規范的違反可能會導致患者隱私泄露、數據完整性破壞,以及可能會帶來科研機構、醫療供應商以及學術出版和知識產權保護等方面的信任危機。為了避免以上情況發生,需要建立相應的規范機制。病毒性肝炎臨床表型數據安全及倫理規范應包括數據查詢機制、數據申請機制、數據導出機制、數據使用機制和數據銷毀機制等方面。在進行數據保護和安全管理時,應遵循相關的規定標準和倫理要求,確保數據的安全保密和合法使用,為病毒性肝炎的預防和治療提供科學依據和支持。10.1數據查詢機制為保障病毒性肝炎數據安全,應設立數據查詢機制。數據查詢是指誰有權查看患者數據,能夠查看哪些數據,如何數據脫敏和數據授權。只有合法授權人員才能進行數據查詢,同時應設立數據查詢審批流程和日志記錄機制,確保查詢操作的合法性和可追溯性。建議醫療機構應根據自身實際情況,遵循患者信息保護基本原則,制定一系列相關的規章制度,做到數據查詢有記錄,可追溯。10.2數據申請機制數據申請則是數據導出的前置程序,需要明確申請權限和數據量的控制、申請人和審批人職責等,數據申請的同時還需簽署數據保密協議、獲得倫理審批以及發表數據利用聲明等文件。只有具備相關研究或臨床治療資質的人員才能申請使用數據,同時應簽署保密協議并遵守相關法律法規和倫理標準,確保數據的安全保密。10.3數據導出機制數據導出是數據管理人員的職責,管理人員應當嚴格遵守醫院制定的各項相關規則,避免人情導出數據,每個導出操作都要有跡可循,做到有記錄、可追溯。只有經過審批和授權的人員才能進行數據導出,同時,還應采取加密傳輸、身份認證等措施,確保數據的安全性和完整性。10.4數據利用機制數據使用的用途十分廣泛,為保護病人隱私和個人信息安全,應設立數據使用機制。數據利用是數據使用人員獲得數據后的管理,如果使用人員不按照既往申請的倫理要求使用數據,很可能會侵害到數據提供者的知情權。因此,要求數據使用者嚴格按照所申請的內容和相關倫理要求使用數據,不得在獲得數據后有任何違規使用行為。只有在合法授權范圍內的人員才能使用數據,同時應簽署保密協議并遵守相關法律法規和倫理標準,確保數據的安全保密。T/GDPHA003—202310.5數據銷毀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論