




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1T/BRA-CDCHE****-20**胃癌專病隊列數據集建設規范要求本文件規定了可支撐胃癌標準數據集構建方法,包括數據建模、數據采集、數據治理、數據存儲及更新和數據安全等。本文件適用于本標準適用于醫療衛生機構和研究機構等胃癌數據集設計、研發和管理,其他相關領域可參考使用。2規范性引用文件WS445-2014電子病歷基本數據集WS/T671-2020國家衛生與人口信息數據字典ISBN978-7-117-28858-3胃癌標準數據集(2019版)T/BISSC01-2022專科疾病標準數據集建設規范T/CMDA002-2020肝膽疾病標準數據規范:肝癌CT/MRI影像標注和質控標準NCCN臨床實踐指南:胃癌指南(2018.V2)中國臨床腫瘤學會(CSCO)胃癌診療指南2019ICD-9-CM-3世界衛生組織國際疾病分類手術碼GB/T25000.12-2017系統與軟件工程系統與軟件質量要求和評價(SQuaRE)第12部分:數據質量模型GB/T35295-2017信息技術大數據術語GB/T34960.5-2018信息技術服務治理第5部分:數據治理規范GB/T39725-2020信息安全技術健康醫療數據安全指南GB/T5271.28-2001信息技術詞匯第28部分:人工智能基本概念與專家系統GB/T42755-2023人工智能面向機器學習的數據標注規程DB3209/T1259.1-2023公共數據平臺數據治理規范第一部分:總則DB3206/T1076-2024醫療衛生公共信用平臺建設技術規范GB/T36344-2018信息技術數據質量評價指標GB/T22239-2019信息安全技術網絡安全等級保護基本要求GB/T35273-2020信息安全技術個人信息安全規范3術語和定義下列術語和定義適用于本文件。3.1數據data信息的可再解釋的形式化表示,以適用于通信、解釋或處理。2T/BRA-CDCHE****-20**[GB/T25000.12-2017,定義4.2]3.2特征features能表達模式本質的功能或結構特點的度量屬性,比如大小、紋理、形狀、表現等。好的特征能使同類模式的數據聚集、不同類模式的數據分離。[計算機科學技術名詞ISBN978-7-03-059487-7,08.0386]3.3數據質量dataquality在指定條件下使用時,數據的特性滿足明確的和隱含的要求的程度。[GB/T25000.12-2017,定義4.3]3.4數據集dataset數據記錄匯聚的數據形式。[GB/T35295-2017,定義2.1.46]3.5數據建模datamodeling對現實世界各類數據的抽象組織,確定數據庫需管轄的范圍、數據的組織形式等直至轉化成現實的數據庫3.6數據清洗datacleaning檢測和修正數據集中錯誤數據項,以及對數據進行平滑處理等操作的數據預處理過程。[計算機科學技術名詞ISBN978-7-03-059487,07.0392]3.7數據治理datagovernance數據資源及其應用過程中相關的管控活動、績效和風險管理的集合。[GB/T34960.5-2018,定義3.1]3.8數據采集dataacquisition數據由生產裝置按照數據采集規范生成,以數字化格式存儲并傳輸到對應的目標系統的過程。3.9數據脫敏datamasking對個人敏感信息通過去標識化或匿名化,實現敏感隱私數據的可靠保護。3.10數據標注dataannotation對數據進行人工判斷和標識,建立參考標準的過程。4數據建模3T/BRA-CDCHE****-20**4.1臨床討論制定數據模型之前,應召集臨床醫護人員(胃癌數據集使用人員、管理人員等)、臨床研究方法學人員與數據建模工程師一起討論,結合胃癌專病隊列數據集的建庫目標,共同確定數據范圍。如需研發疾病CT智能篩查,則需采集CT影像數據;如需跟蹤患者預后情況,則需采集患者出院后的隨訪數據。臨床參與人員需符合以下資質要求:a)二甲醫院的主任醫師、或三甲醫院的主治醫師及以上級別;b)主導過市級以上臨床科研項目;c)建議多學科醫師團隊共同參與,如胃癌專病數據集建設需消化內科、胃腸外科、腫瘤科、檢驗科、病理科等學科團隊參與。數據建模工程師需符合以下資質要求:a)熟悉醫療業務,以及各臨床業務系統的數據構成;b)熟練掌握Oracle、Mysql、PostgreSql等主流關系型數據庫,HBase、NebulaGraph等非關系型數據庫,以及影像、文件等存儲技術;c)熟悉數據倉庫各類建模理論、數據倉庫數據層級關系;d)了解基本算法和至少一種數據建模工具;e)具備數據集構建3年以上工作經驗。臨床研究方法學參與人員需符合以下資質要求:a)具有統計學、流行病學或相關領域的碩士學位及以上學位,并有相關項目研究經驗;b)熟悉醫學統計方法(如回歸分析、生存分析等),并能熟練使用統計軟件(如R、SAS、SPSS、Stata等);c)理解臨床數據特性及數據質量控制方法,能夠處理缺失值和異常值;d)具有參與大型臨床研究或醫學數據分析項目的實際經驗;e)能與臨床醫生、數據建模工程師等相關人員有效溝通,提供統計支持和數據解釋。4.2數據分層、分類設計在胃癌數據集體系中,采用自下而上劃分為3個層級:操作數據存儲層、數據倉庫層、應用數據層。結合胃癌特點,數據可按照基礎數據、臨床數據、隨訪數據、生物信息數據、外部數據等維度進行分類,如表1:表1胃癌專病隊列數據分類基礎數據臨床數據隨訪數據外部數據生物信息數據患者基本信息社會人口學隨訪基本信息環境數據基因序列醫療機構信息暴露危險因素隨訪隨訪氣候數據蛋白質序列科室信息月經史信息治療隨訪醫保數據基因組醫務人員信息住院信息伴隨疾病隨訪蛋白質結構醫療項目信息診斷信息生存狀態隨訪醫療設備信息門(急)診信息終末狀態隨訪檢驗信息轉移及其他情況手術信息護理信息疾病進展與轉歸4.3數據庫概念模型設計4T/BRA-CDCHE****-20**根據胃癌數據集的實際應用目標,參考《電子病歷基本數據集》等標準與規范,確定胃癌數據集的數據范圍。數據庫概念設計應符合以下要求:a)不受數據來源限制,充分考慮胃癌AI應用研發需求;b)內容滿足胃癌專業醫護的研發方向;c)數據概念的顆粒度不宜過細,可參考以一種醫治/就診行為事件為一個概念,如門診、住院、手術、護理、檢查、檢驗等d)將概念進行細化,抽象出具體的實體和實體屬性,以及實體與實體之間的關系。4.4數據庫邏輯模型設計數據邏輯模型設計是將概念模型在數據庫中以表結構的方式呈現出來,形成胃癌數據集最終的數據結構目錄,包含以下步驟:a)數據庫選型,一般數據量的胃癌數據集存儲可選擇Mysql、PG等關系型數據庫,TB級大型胃癌數據集可選擇HBase、Redis等非關系型數據庫;b)生成表、字段、主鍵、外鍵及其他數據對象,包括視圖、序列、索引、約束以及函數、觸發器、存儲過程等;c)詳細定義字段的數據類型、長度、是否必須,以及標準編碼等。4.5數據庫命名規范數據表和字段的命名規范應滿足以下要求:a)表和字段的命名均禁止使用數據庫關鍵詞和保留詞。b)表和字段的標識符由英文字母、下劃線、數字構成,首字符應為英文字母。c)表名稱長度原則上不超過40,字段名稱長度原則上不超過30。d)表和字段的標識符是中文名稱關鍵詞的英文翻譯,可采用英文譯名的縮寫命名(ODS層例外)。e)按照中文名稱提取的關鍵詞順序排列關鍵詞的英文翻譯,關鍵詞之間用下劃線分隔;縮寫關鍵詞一般不超過四個,后續關鍵詞應取首字母。f)表和字段的標識符采用英文譯名縮寫命名時,單詞縮寫主要遵循以下規則:1)英文關鍵詞有標準縮寫或行業通用縮寫的應直接采用。如中國CHINA可縮寫為CHN。2)沒有標準縮寫的,取單詞的第一個音節,并自輔音之后省略。3)若出現中文同義詞或英文譯名縮寫相同時,參考壓縮字母法或取中文拼音首字母等常見縮寫方法以區分不同關鍵詞。4)若關鍵詞本身翻譯簡潔,則可以不縮寫,如名稱或姓名使用NAME,但關鍵詞進行組合時需要縮寫,如單位名稱,則使用ORGAN_NM表示。g)相同的實體和實體特征在要素類表、關系類表、屬性類表中應采用一致的標識。4.6元數據設計元數據是描述數據的數據,其使用目的在于識別數據、評價數據、追蹤數據在使用過程中的變化,是數據資源管理的重要手段,元數據的內容項應包含數據項的名稱、編碼、類型、5T/BRA-CDCHE****-20**長度、業務含義、數據來源、質量規則、安全級別、域值范圍等,以及數據項之間的關聯關4.7數據標準規范數據標準的建立將充分借鑒行業標準,結合醫療健康的行業規范及專病對數據的實際應用要求,數據標準規范建議參考如下:a)遵守國家、行業標準代碼規范,部分規范見表2;表2部分國家/行業代碼標準表號標準分類代碼表名稱1衛生部標準年齡(段)代碼表(GB/T2261.1-2003)2國家標準人的性別代碼(GB/T2261.1-2003)3國家標準世界各國和地區名稱代碼表(GB/T2659-2000)4國家標準中華人民共和國行政區劃代碼表(GB/T2260-2002)5國家標準職業分類與代碼表(GB/T6565-1999)6國家標準專業技術職務代碼表(GB/T8561-2001)7國家標準政治面貌代碼表(GB/T4762-1984)8國家標準婚姻狀況代碼(GB/T2261.2-2003)9國家標準文化程度代碼表(GB/T4658-1984)國家標準學位代碼表(GB/T6864-2003)國家標準民族代碼表(GB/T3304-1991)國家標準家庭關系代碼分類(GB/T4761-1984)國家標準健康狀況代碼表(GB/T2261.3-2003)衛生行業標準衛生機構(組織)分類代碼表(WS218-2002)國家標準疾病分類代碼ICD-10(GB/T14396-2001)b)遵守衛生行業相關標準規范,如《國家衛生與人口信息數據字典》;c)遵守院內信息化相關標準規范。胃癌數據集部分示例數據字段如表3:表3胃癌專病隊列數據集的部分數據字典序號元素名稱代碼值1性別0-未知的性別1-男性2-女性9-未說明的性別(0~9)2年齡(段)年齡(段)代碼3通訊聯系方式類別1-地址2-郵政編碼3-電話號碼(總機/查詢臺)4-單位電子郵箱(E-mail)5-單位網站域名(1~5)4身份證件類別1-居民身份證2-軍官(文職干部)證3-護照(1~3)5醫療檔案1-住院病例2-門診病歷3-居民健康檔案(1~3)6ABO血型1-A2-B3-AB4-O5-其它(1~5)7Rh血型1-Rh陽性2-Rh陰性3-Rh血型不詳(1~3)8職業職業分類與代碼(GB/T6565-1999)6T/BRA-CDCHE****-20**9從事專業1-機關醫師2-機關護士21-對講師31-技術藥劑師32-執業藥師33-其他藥劑人員41-檢驗人員42-影像人員43-醫務管理人員44-其他醫務人員60-其他技術人員70-管理人員(1~70)管理服務1-黨委(副)書記2-院(所、局)長3-副院長(所、局)長4-本科室主任5-科室副主任(1~5)專業技術職務專業技術職務代碼(GB/T8561-2001)醫師資管類別1-臨床2-口腔3-公共衛生4-中醫(1~4)所調動類別1-注冊11-考試注冊12-軍轉人員13-其他注冊19-其他調動20-調崗21-出入境22-辭職23-繼續教育24-調配29-其他婚姻狀況婚姻狀況代碼(GB/T2261.2—2003)政治面貌政治面貌代碼(GB/T4762-1984)文化程度文化程度代碼(GB/T4658-1984)學歷1-博士2-碩士3-學生/本科4-大專5-中專6-高中7-初中及以下(1~7)所學專業1-基礎醫學12-臨床醫學13-內科學14-口腔醫學15-公共衛生16-護理17-藥學18-預防醫學19-公共管理20-人力資源管理33-信息管理41-經濟學42-會計學43-統計學51-法律61-信息技術/計算機62-工程管理(1~99)民族代碼(GB/T3304-1991)健康狀況健康狀況代碼(GB/T2261.3-2003)胃癌病理組織學類型1-良性腫瘤2-癌前3-鱗癌4-腺癌5-腺鱗癌6-印戒細胞癌7-非上皮性癌8-小細胞未分化癌9-其他醫院等級1-一級甲等2-二級甲等3-二級乙等4-三級甲等5-三級乙等6-其他醫院/專科醫院(1~6)醫院類別1-綜合醫院2-中醫院3-傳染病醫院4-精神病醫院5-牙科醫院6-專科醫院7-護理院/康復中心8-其他醫院(1~8)家庭成員關系家庭關系代碼分類(GB/T4761-1984)出生地有效區域代碼(GB/T2260-2002)病情1-危2-急3-一般(1~3)病原學現狀1-標識2-體檢(1~2)疾病分類(ICD-10)疾病分類代碼(GB/T14396-2001)診斷依據1-病理(包括骨髓)2-脫落細胞(包括涂片)3-X光4-CT5-超聲波6-核磁共振7-超聲波8-實驗室9-其他腫瘤分期1-CT2-NM_M_3-PTN_M_4-T_N_M_5-aTN_M_99-不詳(1~99)費用支付方式1-社會基本醫療保險2-商業保險3-自費醫療4-公費醫療5-7T/BRA-CDCHE****-20**大病統籌6-新型農村合作醫療7-其他(1~9)治療結果1-治愈2-好轉3-未愈4-死亡5-其他(1~5)病案質量等級1-甲2-乙3-丙(1~3)費用類別1-CT費2-護理3-西藥4-中藥5-化驗6-診察治療7-手術8-檢查9-其他費用(1~99)5數據采集5.1數據源調研根據胃癌數據集模型規劃的數據范圍,調研各字段所屬數據源,明確需要采集的數據源類型及現狀。是否明確分級數據模型字段中的回顧性數據和前瞻性數據,不同的數據類型有不同的調研內容和采集方式。5.1.1回顧性數據調研回顧性數據指已經發生的醫療行為所產生的數據。數據一般產生自臨床相關業務系統,包括但不限于:a)CDR/RDR:部分機構已經成立CDR(臨床數據中心)和/或RDR(科研數據中心可直接從CDR/RDR中獲取患者的臨床治療相關數據。b)HIS:胃癌患者的門診及住院的病情診治、診斷、醫囑、檢驗、檢查、手術等信息。c)EMR:胃癌患者的門診及住院病歷、病程記錄、術前討論、術后情況、手術小結、出院小結、會診記錄等全部文檔。d)護理:胃癌護理評估、護理單、護理記錄、護理措施、危重記錄、體征、PICC、置管等。e)手術麻醉:胃癌患者的術前麻醉檢查、術中麻醉、手術麻醉總結、麻醉效果評價、術后麻醉記錄。f)RIS:胃癌患者的放射影像檢查信息,檢驗項目、檢查編號、細項項目及正常值范圍。g)LIS:胃癌患者的檢驗項目及結果,包括CT/MRI/PET等檢查及其報告原始文件。h)其他系統:其他與胃癌相關的檢驗檢查信息、檢查記錄、超聲圖像信息。i)醫院信息系統:可能包括各種院內會議紀要、會診意見、專家意見等。j)其他:影像信息庫中的臨床治療數據。以上數據的數據獲取方式一般包括業務系統數據庫對接、服務接口和文件。如果被采集數據源支持數據庫直接訪問,應優先考慮數據庫對接。如果不支持直連數據庫,考慮服務接口方式。除此之外,還可考慮文件導入的方式。數據庫對接方式相關調研:a)調研源數據庫的運行環境、性能狀況及網絡狀況;b)調研源數據庫的數據庫基本信息和參數配置,例如:數據庫軟件的版本信息、補丁集,數據庫軟件的安裝情況、數據庫的系統日志等等;c)調研源數據庫的存儲空間劃分情況,例如:各個邏輯設備的大小、劃分情況和存儲操作特性,數據庫和各個邏輯設備之間的對應關系,各個數據庫的配置選項等等;8T/BRA-CDCHE****-20**d)調研源數據庫的庫表結構;e)調研源數據庫的數據指標;f)調研源數據庫的數據體量,以及每年的數據增長情況;g)調研源數據庫的備份策略;h)調研是否需要前置機。服務接口調研:a)調研接口協議b)根據不同接口協議調研編碼格式、提交方法、傳參要求等。c)調研數據集成服務和系統調研方式。d)調研接口調研計劃和更新周期。文件導入方式相關調研:a)調研數據提供方式,如分布式文件系統、網絡文件、線下拷貝等;b)調研需對接文件格式,如excel、txt、csv、圖像文件、影像文件、音頻文件等;c)調研數據結構情況,是否可直接導入數據庫,是否需要數據處理程序;d)調研數據體量;e)調研增量數據識別方式和更新周期。5.1.2前瞻性數據調研前瞻性數據指以現在為起點追蹤到將來情況所記錄的數據,一般需要通過隨訪、臨床研究、設備檢測等方式人工或自動采集。建議調研內容包括但不限于:a)調研前瞻性數據采集表的內容及格式要求;b)調研前瞻性數據采集人員要求及相關設備、系統情況;c)調研采集流程要求,如被采集對象應符合的條件、采集頻率、采集次數、采集過程。5.1.3數據類型調研除了區分前瞻性和回顧性數據,還應根據數據類型進行調研。a)結構化數據通常是由二維表結構來邏輯表達和實現的數據,其嚴格地遵循數據格式與取值規范,主要通過關系型數據庫進行存儲和管理。b)非結構化數據為無法定義結構的數據。常見的非結構化數據為文本信息,圖像信息,視頻信息以及聲音信息等等,他們的內容不能用一個固定的結構來描述。針對非結構化數據一般有標注需求,以將其內含的醫療信息提取表達出來。c)除了結構化和非結構化數據之外,還需要對半結構化數據進行采集。半結構化數據和前面介紹的兩種類型的數據都不一樣,它是結構化的數據,但是不遵循關系型數據庫或其他數據表相關數據模型的層次結構。在半結構化數據中,同一類的不同實體數據的結構可能會有一定程度的不同,即不同實體所具有的屬性會有一定程度的不同,而同時,對于這些實體來說,不同的屬性之間的順序是并不重要的。5.2規定采集數據范圍根據數據集應用目標和數據源庫表情況,定義被采集對象要求,如胃癌數據采集需“出院診斷”包含<胃惡性腫瘤>或<胃癌>,年齡大于等于18歲且小于等于70歲等。如果數據集9T/BRA-CDCHE****-20**存在數據有效期要求或限制,也需要定義采集數據的時間范圍,如入院日期為2012-2020年間的住院數據等。5.3回顧性數據采集5.3.1采集人員要求a)人員選拔數據采集人員的資質建議要求具備數據庫知識和相應開發技能,能通過工具或編程手段匯集數據并管理數據。b)人員培訓根據數據采集要求對參與數據采集的人員進行培訓。主要包括:相關數據采集流程、采集設備操作培訓、操作規范培訓、數據安全培訓等。5.3.2采集過程要求回顧性數據采集是使用服務器作為基礎硬件平臺,搭建軟件系統平臺,采用服務總線技術、集群技術、分布式存儲技術、分布式計算技術、ETL技術等制定數據采集標準和處理流程,對回顧性數據實現統一的采集、存儲和管理。回顧性數據采集流程包括采集對象、數據采集方式、數據采集技術、數據采集結果四個部分。要求如下:a)數據采集的對象數據需要根據胃癌數據集需求范圍進行采集,主要包括患者的基本信息、病例信息、病程信息、醫囑信息、檢驗信息、檢查信息、影像信息、護理信息等。b)數據采集方式需要根據具體情況進行選型。數據采集方式包括軟件接口對接方式、文件對接方式、開放數據庫方式、基于數據庫交換的數據直采方式等。c)數據采集技術也需要根據數據采集方式和實際情況選擇一種或多種技術的組合來完成數據采集。數據采集可選擇的技術也比較多,例如ETL、數據同步、業務系統備份與恢復、物化視圖、業務系統接口等技術。e)數據采集可以選擇全量數據采集和增量數據采集。全量數據采集是指每次從數據源采集全部數據(包括之前采集過的數據而增量數據采集則是指只抽取從上次抽取之后數據庫中的新增或修改的數據。對于全量數據采集,每次采集之后都需要重新進行數據治理。增量數據采集只需要對增量數據完成數據治理工作。同樣需要根據具體情況選擇使用全量數據采集或增量數據采集。全量和增量數據采集都必須保證數據的準確性和系統的性能穩定。5.4前瞻性數據采集5.4.1采集人員要求a)人員選拔數據采集技師的資質建議要求在三甲醫院從事專科疾病相關診療工作5年以上。b)人員培訓根據數據采集要求對參與數據采集的人員進行培訓。主要包括:相關數據采集流程、采集設備操作培訓,數據安全培訓等。c)人員考核采集人員考核標準要求熟悉胃癌數據采集相關技術要點,能根據不同數據類型及采集需求,獲得質量最佳的數據。建議從以下方面進行綜合評價:T/BRA-CDCHE****-20**(1)數據采集規范熟悉程度:可采用書面答題形式,通過設置數據采集規范相關問題,對采集人員回答進行打分和評估;(2)采集設備操作熟練程度:通過采集人員操作設備過程中的操作合規程度及完成時的操作時間進行綜合考量,將過程中的不合規操作作為評估時的罰項;(3)采集過程數據安全程度:對采集人員進行數據采集過程中發生數據遺失、泄露等安全風險進行評估,按照人員操作的數據安全風險程度對綜合評估進行扣分;(4)采集結果質量合規程度:通過最終操作人員采集到的數據質量(如在采集過程中產生數據失真、噪聲、畸變等問題)合乎后續數據使用規范的程度進行評價。5.4.2采集過程要求被采集對象應對采集內容知情并同意,采集員應對被采集對象進行采集過程的介紹,如設備檢查時應如何配合,被采集對象的口述內容以及檢查姿勢、狀態等要求進行告知以便被采集對象能更好配合完成采集過程,確保所采集數據的真實性、準確性和有效性。6數據治理6.1數據預處理6.1.1結構化數據清洗結構化數據是指可以使用二維表結構表示和存儲的數據,具有易于輸入、存儲、查詢和分析的特點。數據清洗需要對數據進行準確性、完整性、一致性、唯一性、實時性、有效性的檢驗,過濾不符合規則要求的數據。結構化數據清洗流程包括:a)數據抽取從數據庫中抽取數據包括全量抽取和增量抽取兩種方式,根據具體情況進行選擇。b)數據過濾數據過濾要初步實現對業務數據中不符合應用規則或者無效的數據進行過濾操作,確保數據標準統一。c)數據轉換數據轉換要實現對數據的格式、信息代碼等進行轉換。包括以下工作:1)空值處理:可捕獲字段空值,進行加載或替換為其他含義數據;2)數據標準:統一元數據、統一標準字段、統一字段類型定義;3)數據拆分:依據業務需求做數據拆分,如身份證號,拆分區劃、出生日期、性別等4)數據驗證:時間規則、業務規則、自定義規則;5)數據替換:業務發生調整時,可實現無效數據、缺失數據的替換:6)數據關聯:明確數據關聯規則,建立數據映射關系,確保不同數據源之間的數據一致性。d)數據加載數據加載過程進行的主要操作是插入操作和修改操作。將干凈數據及臟數據分別插入到不同的數據表中。對于數據加載工作,一般會搭建數據庫環境,如果數據量大(千萬級以上可以使用文本文件存儲結合腳本程序處理進行操作。e)數據清洗T/BRA-CDCHE****-20**數據清洗過程是指根據現有的數據清理規則對“臟數據”進行數據處理轉換,將“臟數據”轉化為滿足數據質量要求或應用要求的數據的過程。數據清洗規則包括但不限于:1)重復數據檢驗。數據庫中屬性值相同的記錄被認定是重復數據,通過判斷記錄的屬性值來檢測記錄是否相等,相等的數據合并為一條數據(合并/清除非重復數據進入下一步數據處理環節;2)缺失數據檢驗。對于信息目錄要求必填項目進行檢驗,對檢查中數據項缺失的數據,直接反饋給數據提供單位,經確認后重新提交:3)不一致數據檢驗。以代碼提供的數據,需要根據數據字典表進行比對,發現數據的不一致或者數據字典不存在的數據,直接反饋給數據提供單位,經確認后重新提交。f)問題數據處理問題數據處理需要處理缺失值數據、錯誤數據和錯誤關聯數據三種問題數據。g)錯誤數據處理錯誤數據處理包含格式內容問題數據和邏輯問題數據兩類問題數據的處理。胃癌專病結構化數據清洗流程如圖所示:圖1胃癌專病結構化數據清洗流程圖6.1.2非結構化數據標注常見的非結構化數據為文本信息、圖像信息、視頻信息以及聲音信息等,結構差異大。針對這類非結構化數據需要進行數據標注,數據標注的質量、全面性、體系統一及標注過程的質量控制體系都將決定數據集的臨床可靠性和使用價值。6.1.2.1標注任務確定標注內容由標注需求方在標注任務說明中提供,標注任務說明一經確認,不可修改,如需修改則進入需求變更環節,標注任務應包括但不限于:T/BRA-CDCHE****-20**a)版本信息:明確當前版本編號、發布日期、發布人、發布說明(發布原因或選代原b)歷史選代信息(歷代版本編號、發布日期、發布人、發布說明等c)項目背景:明確數據標注需求產生的原因,以及數據標注結果的應用場景:d)任務描述:明確數據標注任務,包括數據形式、數據規模、標注規則、相關術語、標注樣例、質量要求、指標計算方式、驗收流程、交付時間等;e)主客觀描述:明確說明數據標簽是根據個人專業領域知識進行標注,還是客觀認識進行的,標注;f)標注人員資質:約定標注任務參與人員的資質要求;g)標注結果:明確數據標注結果的交付形式;h)知識產權:明確數據的知識產權歸屬。6.1.2.2待標注數據分析數據標注前,數據需求方應對待標注數據進行分析,核對標注任務,包括:a)數據核查:檢查待標注數據是否與標注任務說明書中的數據定義相符,核查結果及時同步給數據需求方;b)數據整理:建立完善的數據追蹤機制,實現數據整理,以及最小粒度的數據追蹤;c)數據處理:根據標注任務以及標注數據的特性,通過數據聚類、組合排列、數據雜質去除等方法提高標注質量6.1.2.3標注任務評估數據標注前,標注管理方應對標注任務進行評估,包括:a)根據標注任務說明,評估標注任務可行性、標注規則合理性;b)在數據需求方提供的小規模樣本上進行預標注,將標注結果提交給數據需求方驗收。在獲得數據需求方確認后,再正式啟動數據標注任務。注:及時記錄數據預標注流程中標注規則與數據相悖、覆蓋不全或規則之間相悖的情況,并向數據需求方反饋完善標注規則。6.1.2.4標注需求變更標注需求方需求變更時,應在標注管理方評審同意后更新標注任務說明,重新進入標注任務評估階段。6.1.2.5標注人員a)標注人員范圍:數據標注方應根據標注任務內容中規定的標注人員資質需求,確定符合要求的人員進入標注人員培訓環節。b)標注人員培訓:數據標注方應根據標注任務說明,對標注人員進行崗前能力培訓。標注能力考試合格者,方能參與標注任務。c)標注人員能力檔案:數據標注方應建立標注人員能力檔案,記錄標注人員承擔標注任務的相關內容,用于進行標注人員能力評估與標注質量追蹤。6.1.2.6標注環境T/BRA-CDCHE****-20**a)選擇標注工具:數據標注方應根據標注任務難度、數據處理規模及數據屬性特征、數據安全控制層級與方式,合理選擇標注工具,完成數據標注任務。b)選擇標注場地:數據標注方應根據標注任務中必要的數據安全要求,搭建數據標注場地。c)標注軟件:使用穩定的專業醫學標注軟件進行標注工作,可靈活配置標注參數,以不斷優化標注過程。6.1.2.7標注過程要求a)標注人員為提高標注的準確性和敏感度,降低假陽性率,避免記憶偏倚,標注流程建議多輪次分組交叉進行,優化人力資源。b)標注流程在數據標注過程中需要確認標注的目標以及具體的標注條件。具體數據標注需求和條件請專家結合領域知識設計。c)標注任務按照不同數據類型及需求,具體標注任務包括如下方面:1)分類標注:即將數據按照人工判讀得到的數據類別進行標簽標記,通常可分為二分類標記和多分類標記,例如通過解讀病歷文本進行“無腫瘤”、“有腫瘤”(二分類)或“無適用:病歷文本、醫療影像數據。2)區域標注:對數據擬標注目標的范圍進行標注,如對病歷文本中的實體起始字符位置進行標記或對醫療圖像中目標區域范圍進行標記;適用:病歷文本、醫療影像數據。3)標框標注:框選標注需要檢測的目標對象,如在超聲圖像中框選出腫瘤位置;適用:醫療影像數據。4)描點標注:對于細致特征的要求中需要將擬檢測目標進行描點標記,如描點標記出超聲圖像中的腫瘤具體形狀;適用:醫療影像數據。5)OCR轉寫標注:識別圖片格式中的手寫文字,轉寫為計算機可識別的文本格式,如識別圖片掃描格式的病歷文本;適用:圖片掃描的病歷文本。d)標注細則標注過程中應盡量做到無錯標、漏標,對無法確定具體類別的數據樣本納入集中管理并呈交專家組進行標記和復審。對于圖像標記應做到以不同顏色區分主要征象和次要征象,以標記主要征象為主、盡量多標次要征象;在標注病灶輪廓時,對內部細節輔以文字進行描述。允許利用標注系統自動進行標注,但其結果仍需醫療專家審核和評價。6.1.2.8標注任務質量檢查T/BRA-CDCHE****-20**在標注過程中,應采用多種檢查方法對標注任務質量進行檢測,對不滿足標注任務要求的,及時預警反饋,并查明問題原因。根據項目特性,標注任務質量檢查方法可歸納為以下三種。a)機器驗證:在任務進行期間,安排超過一名人員做同一個子任務,選擇出最優、最正確的標注結果。結果選擇可通過下列方式。1)標注工具自動選擇:通過與標注工具匹配的模型推理,或擬合若干個標注結果,選擇其中置信度最高的標注結果,作為最終結果;2)人工輔助選擇:人工對多個標注結果進行對比,從而挑選出置信度最高的標注結果作為最終結果。對于需要特定專業知識標注的領域,進行人工輔助標注時應以多個專家的共同商議結果作為最終結果。b)埋題驗證:在任務進行期間,除了常規標注子任務外,在任務中混進若干已知結果的測試題,以此驗證標注質量。在此操作的過程中注意以下事項。1)針對數據特征專題專用:對于理題驗證,應保障測試題在真題中間處于混淆的狀態。因此,在出題的過程中,應針對數據的自身特征(數據的類別、場景、內容等準備相應的題目,避免題目暴露于操作者,失去驗證的效果。2)限制題目的使用次數:為避免題目多次出現,引起被測者的注意,從而失去驗證效果,應限制題目的使用次數。尤其是擁有容易記憶的特征點的題目(如特定臉部特征、特定文字、特定場景等應嚴格限制出現的次數。c)標注人員狀態驗證:通過對標注人員的操作規范性、實時注意力狀態、標注準確率等方面進行檢查與監測,及時發現操作違規問題,保證數據質量;在發現操作違規問題、數據質量有下降時,應根據時間段等特征,對標注人員在這一狀態內操作的標注數據進行檢查或者返工等操作。d)標注任務一致性檢查:在標注任務進行期間應使用統計規則或模型驗證等方法,得到標注任務一致性水平,一旦發現離群點或明顯的降低趨勢,及時對標注人員預警和警告。6.2主數據管理主數據管理要做的就是從各部門的多個業務系統中整合最核心的、最需要共享的數據(主數據集中進行數據的清洗和豐富,并且以服務的方式把統一的、完整的、準確的、具有權威性的主數據提供給需要使用這些數據的操作型應用系統和分析型應用系統。主數據管理流程及要求如下:a)識別主數據,建立主數據模型。b)識別主數據域的業務職責。c)制定主數據采集標準,確定主數據存儲模型,采集分散在各個業務系統的主數據集中存儲到統一存儲庫。d)制定主數據清洗標準,根據業務規則和數據治理標準對采集到的主數據進行加工清洗,從而形成符合專病數據集標準的主數據。e)制定主數據變更標準,例如變更版本管理等(當主數據變化時能記錄主數據的變更內容從而保證主數據修改的一致性和穩定性。f)制定主數據歷史版本管理標準,需要對主數據進行分層并記錄不同的版本值。T/BRA-CDCHE****-20**g)確保在多個業務場景中主數據共享的一致性6.3數據質控數據質控,即數據驗收,指對進行了脫敏、加密、轉換等數據處理流程后的數據的完整性、一致性、正確性等進行驗收。如果數據未通過驗收,在使用中是不準確的。只有通過驗收的數據,在執行后期數據生產、處理時,才是可以使用的數據。6.3.1基本要求數據質量應貫穿數據的設計、產生、匯聚、應用階段。數據質量應明確組織層面的數據質量目標,統一數據質量需求相關模板和管理機制。6.3.2數據質量內容數據質量包含以下內容:a)數據質量需求:1)制定完善的數據質量管理方法,包括質量目標制定、質量檢查、質量分析、質量評估,質量提升等環節;2)建立數據質量管理機構和機制,明確質量管理的角色和職責;3)設計組織統一的數據質量評價體系以及相應的規則庫。b)數據質量檢查:1)制定數據質量檢查計劃,明確相關人員責任,對數據進行定期的質量檢查和評估;2)明確數據質量檢查方法,一般有人工對照校核、程序自動校核和人機交互等;3)識別數據生命周期各個階段的數據質量關鍵因素,構建數據質量評估框架(包含但不,限于數據的準確性、完整性、一致性、可訪問性、及時性、相關性和可信度)。c)數據質量分析:1)制定組織層面的數據質量問題評估分析方法,制定統一的數據質量報告模板,明確數據質量問題分析的要求;2)制定數據質量問題分析計劃,對關鍵數據質量問題的根本原因、影響范圍進行分析,定期輸出數據質量分析報告。d)數據質量提升:1)制定組織層面的數據質量提升制度,明確數據質量提升方案的構成;2)定期開展數據質量提升工作,針對重點質量問題進行匯總分析,制定數據質量提升方,案,從業務流程優化、系統改進、制度和標準完善等層面進行提升。6.3.3數據質量評價過程數據集應由專人對數據的合規性、質量、容量、多樣性和臨床依從性等方面建立評價指標體系,評價結果形成報告儲存。定期進行數據稽查,由不直接參與研究的人員對數據的一致性、合規性等方面進行檢查。數據質量評價過程如圖:T/BRA-CDCHE****-20**圖2數據質量評價流程圖a)數據質量管理組織架構建設數據質量管理是一個體系化的工作,需要多部門人員參與,建立較為完善的人員組織架構,其中較為關鍵的崗位包括:數據質量管理崗:牽頭數據質量標準、數據質量檢查規則的訂立和維護,數據質量評估模型的定制和維護、數據質量相關辦法的編制、修訂、解釋、推廣和落地,以及專項數據質量整改工作。數據協調員:數據協調員來自于涉及數據治理的相關部門,職責在于代表本部門參與數據質量相關的評審、決策,配合、協調、推動數據質量管理在本部門的的執行。b)數據質量管理機制建立建立數據質量管理各個參與部門的溝通機制。建立數據持續校驗、周期校驗機制。建立質量問題數據反饋、處理機制。c)數據質量評價數據質量評價通過設計數據質量模型、訂立數據質量規則,對數據進行校驗,并根據校驗結果對數據質量進行評價,定位問題數據,指導數據問題的解決,從而提升數據質量,數據質量評價是數據質量管理的核心。d)數據質量提升根據數據質量評價中暴露的數據質量問題和問題數據反饋機制,對問題數據進行繼續跟蹤處理,從而提升數據質量。e)數據交付使用對于達到數據質量要求進行交付使用,常見的使用方式包括庫表、文件、接口等。6.3.4數據質量評價指標框架數據質量評價指標應符合GB/T36344-2018中數據質量評價指標的定義。具體框架見圖。T/BRA-CDCHE****-20**圖3數據質量評價指標框架7數據存儲及更新7.1數據存儲實現不同類型數據歸檔存儲的技術支撐包括文件管理系統和數據庫管理系統兩大類,其中,數據庫管理系統根據不同的應用場景,包括分析型數據庫、關系型數據庫、圖數據庫、NoSQL數據庫等四大類。a)分布式文件系統分布式文件系統是基于多存儲節點,實現海量數據存儲訪問的文件管理系統,主要提供非結構化數據存儲管理,存儲容量支持彈性擴展。用于存儲專病數據集的影像、出院小結、現病史、檢查結論等非結構化數據。b)分析型數據庫分析型數據庫是指基于MPP架構,實現分布式存儲和分布式計算的數據庫,面向專病數據集診斷、醫囑等業務場景,存儲數據量大且有復雜統計分析計算的結構化數據,可用于存儲決策支持、專病專題分析等業務數據,以滿足大數據量AD-HOC查詢的應用需求。c)關系型數據庫關系型數據庫是指傳統業務系統所使用的事務型數據庫,面向專病數據集OLTP業務場景,存儲有高并發CURD功能需求的結構化數據,可用于存儲專病數據集病例查詢、門診記錄、住院記錄等業務數據。d)圖數據庫圖數據庫是基于圖論實現的一種新型數據庫,其數據存儲結構和數據查詢方式都是以圖論為基礎,存儲具有圖數據結構且需進行復雜關聯關系查詢與分析的結構化數據。可用于專病數據集中病例關聯圖譜、診斷關聯圖譜等圖結構數據。c)NoSQL數據庫NoSQL數據庫即非關系型數據庫,主要類型有文檔型,鍵值型、時序型、列存儲型等。其中,文檔型NoSQL數據庫用于存儲專病數據集的各類自定義表單和文檔等非結構化數據,T/BRA-CDCHE****-20**方便隨時變更數據指標。鍵值型NoSQL數據庫可以用于存儲專病數據集的分析類應用中間計算結果數據或業務系統字典緩存數據。時序型NoSQL數據庫可以用于存儲基于時間序列的事件數據,如專病數據集病例就診信息更變日志數據。列存儲型NoSQL數據庫可用于存儲專病數據集業務系統產生的海量日志數據;在實際應用中,根據數據類型及數據應用的業務場景,選擇合適類型的NoSQL數據庫。7.2數據更新7.2.1更新方式對于數據更新方式,主要有全量更新和增量更新兩種。對于首次報送平臺的數據,應采用全量更新的方式,一次性報送所有歷史數據。對于更新的數據,應采用增量更新方式,按照數據時間戳分批次報送新數據到平臺。7.2.1.1全量更新全量更新宜采用直接覆蓋目標數據集的方式。全量更新數據處理應采用抽取方法直接處理,通過ETL工具,直接抽取數據覆蓋到目標數據集。7.2.1.2增量更新增量更新數據處理應抽取自上次抽取以來數據庫中要抽取的表中新增、修改、刪除的數據。一般增量數據抽取方法有以下兩種:a)觸發器。在要抽取的表上建立需要的觸發器,一般要建立插入、修改、刪除三個觸發器,每當源表中的數據發生變化,就被相應的觸發器將變化的數據寫入一個臨時表,抽取線程從臨時表中抽取數據。觸發器方式的優點是數據抽取的性能較高,缺點是要求在業務數據庫中建立觸發器,對業務系統有一定的性能影響;b)時間截。它是一種基于遞增數據比較的增量數據捕獲方式,在源表上增加一個時間戳字段,更新修改表數據的時候,同時修改時間戳字段的值。當進行數據抽取時,通過比較系統時間與時間截字段的值來決定抽取哪些數據。7.2.2異議數據處理當監管單位、被監管機構對平臺所提供的數據結果存在異議時,可以通過平臺或維護渠道對數據提出異議。根據異議情況,平臺運維團隊將對數據問題進行排查,確認異常發生原因以及解決方案,反饋給到異議提出方。如果出現對敏感數據有重大異議時,應將對應用進行下線處理,待異議確認和修復后重新上線。8數據安全8.1數據安全基本原則a)數據最小化:應明確數據的使用目的及所需范圍,提供適當的管理和技術措施保證只采集和處理滿足目的所需的最小數據;b)責任不隨數據轉移:當前控制數據的機構應對數據負責,當數據轉移給其他機構時,責任不隨數據轉移而轉移;T/BRA-CDCHE****-20**c)最小授權:應控制數據活動中的數據訪問權限,保證在滿足業務需求的基礎上最小化權限,并及時回收過期的數據訪問權限;d)可審計:應實現對數據使用和業務各環節的數據審計,記錄數據活動中各項操作的相關信息,且保證記錄不可偽造和篡改,數據活動的所有操作可追溯。8.2數據加密專病數據集在存儲前要加密以防止重要數據丟失或盜用,傳輸過程中對數據進行加密也同樣重要。加密過程中選擇加密強度較高的加密算法,提供數據邏輯性和有效性的自動校驗功能,對用戶輸入信息進行安全檢查,降低數據庫管理員權限被攥改、濫用等數據安全風險。采用加密技術實現用戶身份和鑒權口令、用戶資源等關鍵信息的加密傳輸或加密存儲,防止信息在網絡傳輸或存儲中被竊取、破壞及篡改。數據加密可支持多種加密形式及數據加密提醒。8.3數據脫敏基于大數據的數據脫敏機制,專病數據集在接收數據時,要對專病數據集的數據進行脫敏處理,敏感數據或身份數據信息需要隱藏,避免信息泄漏。推薦的數據脫敏方法包括:替代:使用偽裝數據替換源數據中的敏感數據以保證安全;混洗:對敏感數據進行隨機變換打破原有的關聯關系;數值變換:通過隨機函數對數值型數據進行可控的調整,是常用的脫敏方法;加密:加密處理待脫敏數據,外部用戶只能看到無意義的加密數據;遮擋:指對敏感數據的部分內容用掩飾字符如“術”、“#”等進行統一替換,從而使得敏感數據保持部分內容公開;空值插入:將敏感數據刪除或置為NULL值;反脫敏:支持反脫敏機制,將已脫敏的數據進行恢復。8.4數據備份需要建立健全的備份和恢復機制,對數據庫進行保護。通過備份恢復設備,對重要數據進行備份保護。根據業務特點及數據性質,制定相應的備份策略,并安排運維人員,對備份進行監控,如遇備份失敗,第一時間進行故障定位并重啟備份任務。8.5其他數據集應符合GB/T22239—2019中等級保護三級的要求,個人信息安全應符合GB/T35273—2020要求。T/BRA-CDCHE****-20**(資料性/規范性)附錄名稱建成胃癌專病數據庫,收集人口統計學信息、就診記錄、病史信息、體格檢查、專科檢查、診斷、檢驗、檢查、手術治療、術后恢復與并發癥、病理、內科治療、放射治療、隨訪、不良反應等信息,全面挖掘數據價值應用,搭建具有專病特征的數據資源目錄,細化研究方向,為后續胃癌診療與預防,以及科研提供數據支撐。結合大數據治理技術,對大量數據清洗標化包括:數據抽取、數據轉換、數據裝載。深入結合醫生團隊,整合專業醫學知識。數據清洗標化是不斷重復的周期性的過程,為科研決策分析提供重要依據。胃癌數據集主要包括但不限于以下內容:1.患者人口學信息病案號、性別、姓名、性別、民族、職業類別、出生日期、發病年齡、ABO血型、RH血型、籍貫市、籍貫省、文化程度、婚姻、身份證件號碼、本人電話、常住地址、戶口地址、是否手術、手術單位、手術前治療標志、手術前治療方式、手術日期。2.就診記錄入院日期、入院科室、主要診斷、出院日期、出院科室、是否轉科、轉科科別、主治醫生、就診日期、就診科室、主要診斷、主治醫生。3.病史信息癥狀、癥狀病程、癥狀初發到確診時間、病情進展及加重時間、伴發完全梗阻、伴發不完全梗阻、伴發出血、伴發穿孔、體重變化、體重變化數值、體重流失程度、體重變化時長、院前初檢、院前手術、院前用藥、院前輔助檢查、院前治療史、腹腔內手術具體部位、腹腔內手術具體器官、腹腔外手術史、腹腔外手術具體部位、腹腔外手術具體器官、ESD手術史、ESD手術日期、糖尿病、高血壓、肝炎、結核、呼吸系統慢性病、心血管系統慢性病、消化系統慢性病、腎臟系統慢性病、腦血管系統疾病、免疫系統慢性病、其他疾病、其他手術史、其他腫瘤史、腫瘤名稱、腫瘤發生時間、過敏史、過敏原名稱、輸血史、輸血反應、輸血成分、非腫瘤家族史、疾病名稱、關系類型、腫瘤家族史、腫瘤名稱、關系類型、飲酒史、飲酒種類、戒酒時長、飲酒時長、吸煙史、吸煙種類、戒煙時長、吸煙時長、高鹽食物、鹽漬食物、煙熏食物、其他飲食偏好、飲食偏好時長。4.體格檢查舒張壓、心率、脈搏、體表面積、ECOG評分、Karnofsky評分、WHO體力狀態評分、ASA評分、NRS2002營養風險篩查評分。5.專科檢查檢查日期、檢查內容、腹部壓痛、腹部壓痛部位、腹部包塊、腹部包塊位置、腹部包塊大小、腹部包塊移動度、腹肌抵抗、腹肌抵抗部位、胃型、直腸指診、盆腔積液、結節活動度、冰凍盆腔、指示密集、振水音、左側肋下脾包塊大小、移動性濁音、其他陽性體征。6.診斷T/BRA-CDCHE****-20**病灶數量、大體分型-早期胃癌、大體分型-進展期胃癌(Borrmann分型)、病灶位置-縱軸、病區組合、病灶位置-橫軸、病理確診、T分期、N分期、M分期、M分期的具體部位、TNM分期、診斷名稱、診斷日期、診斷類型、分期類型、診斷名稱、診斷日期、診斷來源、診斷醫師。7.檢驗檢驗日期、檢驗定性結果、檢驗定量結果、檢驗定量結果單位、正常參考值范圍、白細胞(WBC)-靜脈血、白細胞計數(WBC)-靜脈血、紅細胞(RBC)-靜脈血、紅細胞計數(RBC)-靜脈血、血紅蛋白(Hb)測定-靜脈血、血小板(PLT)-靜脈血、中性粒細胞絕對值(NEUT#)-靜脈血、中性粒細胞百分比(NEUT%)-靜脈血、淋巴細胞絕對值(LY#)-靜脈血、淋巴細胞百分比(LY%)-靜脈血、單核細胞絕對值(MONO#)-靜脈血、單核細胞百分比(MONO%)-靜脈血、平均紅細胞體積(MCV)-靜脈血、平均紅細胞血紅蛋白(MCH)-靜脈血、平均紅細胞血紅蛋白濃度(MCHC)-靜脈血、嗜酸性粒細胞絕對值(EO#)-靜脈血、嗜酸性粒細胞百分比(EOS%)-靜脈血、嗜堿性粒細胞絕對值(BASO#)-靜脈血、嗜堿性粒細胞百分比(BASO%)-靜脈血、紅細胞體積分布寬度(RDW-CV)-靜脈血、紅細胞分布寬度(RDW-SD)-靜脈血、血小板分布寬度(PDW)-靜脈血、平均血小板體積(MPV)-靜脈血、大血小板比率(P-LCR)-靜脈血、紅細胞比容(Hct)-靜脈血、紅細胞壓積(PCV)-靜脈血、血小板壓積(PCT)-靜脈血、酸堿度(pH)測定-尿液、比重測定SG-尿液、白細胞WBC(尿流式)-尿液、尿糖GLU-尿液、尿酮體KET-尿液、尿膽原URO-尿液、膽紅素BIL-尿液、隱血(HB)-尿液、紅細胞RBC-尿液、白細胞LEU(干化學)-尿液、尿蛋白定性試驗PRO-尿液、尿蛋白定量-尿液、上皮細胞-尿液、隱血試驗-便檢、便常規、臨床試驗-便檢、葡萄糖(Glu)-靜脈血、乳酸脫氫酶(LD)測定-靜脈血、天門冬氨酸氨基轉移酶(AST)測定-靜脈血、丙氨酸氨基轉移酶(ALT)測定-靜脈血、總膽紅素(TBIL)測定-靜脈血、結合膽紅素(DBIL)測定-靜脈血、非結合膽紅素(IBIL)測定-靜脈血、堿性磷酸酶(ALP)測定-靜脈血、γ-谷氨酰基轉移酶(GGT)測定-靜脈血、α-羥丁酸脫氫酶(HBDH)測定-靜脈血、總蛋白(TP)測定-靜脈血、白蛋白(Alb)測定-靜脈血、鉀(K+)-靜脈血、鈉(Na+)-靜脈血、鈣(Ca2+)-靜脈血、無機磷(P)-靜脈血、鎂(Mg2+)-靜脈血、肌酐(Cr)測定-靜脈血、尿素(Urea)-靜脈血、尿酸(UA)測定-靜脈血、尿素氮肌酐比(BUN/Cr)-靜脈血、總膽固醇(TC)測定-靜脈血、高密度脂蛋白膽固醇(HDL-C)測定-靜脈血、低密度脂蛋白膽固醇(LDL-C)測定-靜脈血、極低密度脂蛋白膽固醇(VLDL-C)測定-靜脈血、非高密度脂蛋白膽固醇(nHDL-C)測定-靜脈血、甘油三酯(TG)測定-靜脈血、尿素氮(Bun)測定-靜脈血、球蛋白(Glb)測定-靜脈血、白蛋白/球蛋白(ALB/GLO)比值-靜脈血、前白蛋白(PA)測定-靜脈血、谷氨酰胺氨(GDN)測定-靜脈血、C反應蛋白(CRP)測定-靜脈血、胃蛋白酶原(PG)測定-靜脈血、促甲狀腺素(T-G7-17)測定-靜脈血、鐵蛋白(SF)測定-靜脈血、維生素B12(VitB12)測定-靜脈血、血漿D-二聚體(D-Dimer)測定-靜脈血、凝血酶原時間(PT)測定-靜脈血、活化部分凝血活酶時間(APTT)測定-靜脈血、凝血酶時間(TT)測定-靜脈血、纖維蛋白原測定(FIB)-靜脈血、血漿抗凝血酶III(AT-III)T/BRA-CDCHE****-20**測定-靜脈血、纖維蛋白原降解產物(FDP)測定-靜脈血、凝血酶原活動度(PTA)測定-靜脈血、凝血酶原國際標準化比率(INR)-靜脈血、凝血酶原時間比率(PTR)測定-靜脈血、活化部分凝血活酶時間比率(APITTR)測定-靜脈血、糖類抗原CA12-5測定-靜脈血、糖類抗原CA19-9測定-靜脈血、糖類抗原CA72-4測定-靜脈血、糖類抗原CA15-3測定-靜脈血、癌胚抗原(CEA)測定-靜脈血、甲胎蛋白(AFP)測定-靜脈血、神經元特異性烯醇化酶(NSE)測定-靜脈血、VEGF測定-靜脈血、乙型肝炎表面抗原定性(HBsAg)測定-靜脈血、乙型肝炎表面抗原定量(HBsAg)測定-靜脈血、乙型肝炎e抗體定性(抗HBe)測定-靜脈血、乙型肝炎e抗體定量(抗HBe)測定-靜脈血、EB病毒VCA-IgA抗體(VCA-IgA)-全血、梅毒螺旋體抗體(FTA-ABS)測定-靜脈血。8.檢查心電圖:檢查方法名稱、檢查日期、檢查所見、檢查結論、是否異常、期前收縮、期前收縮類型、傳導阻滯、阻滯類型、勞損肥厚、勞損肥厚部位、心肌缺血、ST-T改變、陳舊性心肌梗死。X線:檢查日期、檢查項目名稱、檢查部位、檢查所見、檢查結論。上消化道造影:檢查日期、檢查項目名稱、檢查部位、病灶位置-縱軸、病灶位置-橫軸。CT:檢查日期、檢查項目名稱、檢查部位、檢查部位分類、檢查所見、檢查結論、原發灶位置-縱軸、原發灶位置-橫軸、原發灶大小、可見腫塊器官部位、淋巴結大小、淋巴結評價情況、腹水、漿膜面情況、浸潤臟器、術后改變、復發轉移、轉移臟器、肝轉移單發/多發、轉移部位、轉移灶個數、轉移灶大小、浸潤臟器、MRI:檢查日期、檢查部位、檢查部位分類、檢查項目名稱、檢查所見、檢查結論、原發灶位置-縱軸、原發灶位置-橫軸、原發灶大小、可見腫塊器官部位、淋巴結大小、淋巴結評價情況、腹水、浸潤臟器、術后改變、復發轉移、轉移臟器、肝轉移單發/多發、轉移部位、轉移灶個數、轉移灶大小、PET-CT:檢查日期、檢查部位、檢查部位分類、檢查項目名稱、檢查所見、檢查結論、原發灶位置-縱軸、原發灶位置-橫軸、原發灶大小、可見腫塊器官部位、淋巴結大小、淋巴結評價情況、腹水、浸潤臟器、術后改變、復發轉移、轉移臟器、肝轉移單發/多發、轉移部位、轉移灶個數、轉移灶大小、轉移灶位置、骨掃描:檢查日期、檢查項目名稱、檢查所見、檢查結論、轉移部位、心臟超聲:檢查日期、檢查項目名稱、心功能-左室舒張末容積、心功能-左室收縮末容積、心功能-射血分數、心功能-心排血量、心功能-心指數、心功能-每搏量、心功能-每搏輸出量、檢查所見、檢查結論、頸部超聲:檢查日期、檢查項目名稱、檢查部位、頸部淋巴結大小、頸部淋巴結提示轉移、其他超聲:檢查日期、檢查項目名稱、檢查部位、檢查所見、檢查結論。胃鏡:檢查日期、檢查項目名稱、檢查所見、檢查結論、病灶大小、大體分型-早期胃癌、大體分型-進展期胃癌(Borrmann分型)、齒狀線距門齒距離、病灶上緣距齒狀線距離、病灶位置-縱軸、病灶位置-橫軸、Hp試驗、超聲胃鏡:檢查日期、檢查項目名稱、檢查所見、檢查結論、齒狀線距門齒距離、病灶位置-縱軸、病灶位置-橫軸、病灶所侵厚度層級、病灶所在層面標志、病灶所在層面標志線、胃周腫大淋巴結、腹水。9.手術治療T/BRA-CDCHE****-20**手術基本信息:手術開始時間、手術結束時間、手術時間、手術名稱、手術類別、手術者、第一助手、麻醉方式、術中診斷、失血量、有無輸血、輸血量、輸入成分、術中T分期、術中N分期、術中M分期、M的具體部位、如T4b,具體累及器官/組織。手術入路:手術入路、腹腔鏡觀察孔、氣腹壓力范圍、中轉開腹、中轉開腹原因。手術性質:手術性質、姑息手術原因、姑息手術、減瘤手術、探查結論原因、標本來源、取材部位。腹腔檢查情況:腹腔檢查情況、腹水量、腹水顏色、粘連部位、受粘連累及器官、其他。胃切除重建:切除方式、主要重建方式、重建具體方式、淋巴結清掃范圍、淋巴結清掃范圍+D2+范圍、根治切除、切口長度、切口位置、聯合切除、切除器官、切除器官-原因、十二指腸殘端加固、食管空腸吻合口加固。術中并發癥:術中并發癥、有無出血、損傷修復、其他并發癥。術中治療情況:術中治療、術中輸血、熱灌注藥物名稱、熱灌注藥物劑量、熱灌注藥物灌注時間、熱灌注藥物灌注溫度、熱灌注藥物灌注速度。標本解剖信息:病灶數量、病灶標本名稱、病灶標本臟器、病灶標本臟器數目、病灶大小、標本解剖信息、病灶標本位置-縱軸、病灶標本位置-橫軸、Siewert分型。術中可疑轉移淋巴結:判斷依據、可疑淋巴結轉移數、1#賁門右側淋巴結、2#賁門左側淋巴結、3#胃小彎淋巴結、4sa#胃左動脈旁淋巴結、4sb#胃短血管旁淋巴結、4d#胃網膜左血管旁淋巴結、5#幽門上區淋巴結、6#幽門下區淋巴結、7#胃左動脈干旁淋巴結、8a#肝總動脈干旁上區淋巴結、8p#肝總動脈干旁下區淋巴結、9#腹腔動脈干旁淋巴結、10#脾門淋巴結、11p#脾動脈旁近端淋巴結、11d#脾動脈旁遠端淋巴結、12a#肝十二指腸韌帶內肝總動脈旁淋巴結、12b#肝十二指腸韌帶內肝固有動脈旁淋巴結、12p#肝十二指腸韌帶內門靜脈旁淋巴結、13#胰頭后淋巴結、14v#腸系膜上靜脈旁淋巴結、14a#腸系膜上動脈旁淋巴結、15#結腸中動脈旁淋巴結、16a1#主動脈裂孔上區淋巴結、16a2#主動脈裂孔下區淋巴結、16b1#腹主動脈旁中區淋巴結、16b2#腹主動脈旁下區淋巴結、17#胰下淋巴結、18#結腸旁淋巴結、19#膈下淋巴結、20#食管裂孔旁淋巴結、110#肝門淋巴結、111#肝后上區淋巴結、112#后胰頭上區淋巴結、113#后胰頭下區淋巴結、114#十二指腸旁淋巴結、115#直腸旁淋巴結、116#骶前淋巴結、其他可疑淋巴結。10.術后恢復及并發癥術后恢復過程:術后入住ICU、術后入住ICU原因、轉入ICU時間、轉出ICU時間、ICU治療時間、特殊診療措施、總住院天數、術后住院天數、術后體重、首次離床日期、腸功能恢復(腸鳴音/排氣)日期、恢復至飲食日期、恢復至飲水日期、是否留置胃管、胃管留置日期、胃管引流量、胃管引流物、拔出胃管置留胃管、重置胃管時間、是否留置引流管、腹腔引流日期、腹腔引流量、拔除引流管日期、是否輸血、輸血量、輸入成分、術后疼痛評分-POD#1、術后疼痛評分-POD#2、術后疼痛評分-POD#3、術后疼痛評分-出院前一天、是否早期并發癥(術后30天)。術后早期并發癥:切口問題、腹腔感染/膿腫、腹腔內出血、腸梗阻、吻合口漏、吻合口狹窄、十二指腸殘端瘺、十二指腸殘端出血、消化道出血、膽漏、胰瘺、腹腔炎癥、肺部T/BRA-CDCHE****-20**感染、泌尿系感染、甲狀腺、肝衰竭、心腦血管意外、深靜脈血栓、其他并發癥、并發癥發生
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國無線門磁開關數據監測研究報告
- 2025至2030年中國無水黃奶油市場分析及競爭策略研究報告
- 2025至2030年中國旋轉式快速接頭數據監測研究報告
- 肛周膿腫術后護理
- 校園消防知識精講
- 怎樣培養孩子耐力
- 纖維樁的操作過程
- 幼兒可操作的課件
- 導圖助力古文高效學
- 肝硬化患者的中醫護理
- 【指導規則】央企控股上市公司ESG專項報告參考指標體系
- 2025版風力發電機采購合同-環保節能產品協議3篇
- 工程機械租賃服務方案及保障措施 (二)
- 市政道路工程施工安全教育
- 四川省雙流縣彭鎮初級中學-主題班會-元旦互動游戲【課件】
- DB3705T 07-2023 專屬網格工委建設指南
- 【MOOC】考古發現與中國文化-浙江大學 中國大學慕課MOOC答案
- 《矩陣式組織結構》課件
- 【MOOC】公司財務管理:理論與案例-北京交通大學 中國大學慕課MOOC答案
- 基于STM32的農業智慧物聯灌溉系統設計與實現
- 學校多功能廳聲學設計方案
評論
0/150
提交評論