




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
ICS35.040CCSA14DB32/T4818.2—2024黨史資料數據規范第2部分數據采集DataspecificationforCommunistPartyofChinahistorymaterials—Part2Dataacquisition2024-07-08發布 2024-08-08實施江蘇省市場監督管理局 發 布中國標準出版社 出 版DB32/T4818.2—2024目 次前言 Ⅲ引言 Ⅳ范圍 1規范性引用文件 1術語和定義 1縮略語 2總體要求 2組織與管理 3黨史資料出庫 4數字化前處理 5目錄數據庫建立 6資料掃描與采集 6資料處理 10數據掛接 14數字化成果驗收與移交 14黨史資料歸還入庫 16附錄資料)黨史資料數字化安全管理制度 18附錄資料)黨史資料數字化加工保密管理制度 19附錄資料)黨史資料出庫申請單 20附錄資料)黨史資料數字化加工登記單 21附錄資料)報刊數據標引生成文件XML樣例 22附錄資料) 黨史資料數字化備份管理登記表 26ⅠDB32/T4818.2—2024前 言本文件按照GB/T1.1—202標準化工作導則 第1部分標準化文件的結構和起草規的規起草。本文件是DB32/T481《黨史資料數據規范》的第2部分。DB32/T4818已經發布了以下部分:——第1部分:數據編目;——第2部分:數據采集;——第3部分:數據標引。請注意本文件的某些內容可能涉及專利。本文件的發布機構不承擔識別專利的責任。本文件由中國共產黨江蘇省委員會黨史工作辦公室提出并歸口。本文件起草單位:中國共產黨江蘇省委員會黨史工作辦公室、中電鴻信信息科技有限公司、江蘇省質量和標準化研究院。ⅢDB32/T4818.2—2024引 言為貫徹落實黨史學習教育領導小組辦公室、國家檔案局印發的《關于做好黨史學習教育文件材料收為數字化文獻,并通過網絡信息實現資源共享,推動江蘇省黨史資料數字化建設高質量發展,特制定本文件。在黨史資料數據建設工作中但由于標準文件篇幅限制且數據編目DB32/T4818分為以下三個部分。——第1部分:數據編目。旨在明確黨史資料數據編目過程中的相關要求,包括編目項目的確定、編目主體分類、編目流程等,提高數據編目的科學性和準確性。——第2部分:數據采集。旨在明確黨史資料數據采集過程中的相關要求,包含了從黨史資料出庫到黨史資料歸還入庫的一系列采集流程和內容,提高數據采集的規范性和可操作性。——第3部分:數據標引。旨在明確黨史資料數據標引過程中的相關要求,包括不同類型、不同主題黨史資料數據的標引要求,提高數據標引的規范性和準確性。ⅣDB32/T4818.2—2024黨史資料數據規范第2部分數據采集范圍本文件確定了江蘇省黨史部門黨史資料數據采集的總體要求庫的相關內容。本文件適用于江蘇省黨史部門對各類黨史資料的采集與管理。規范性引用文件下列文件中的內容通過文中的規范性引用而構成本文件必不可少的條款。其中,注日期的引用文包括所有的修改單適用于本文件。GB/T20530 文獻檔案資料數字化工作導則GB/T23286.1—2009 文獻管理 長期保存的電子文檔文件格式 第1部分PDF1.PDF/A?)的使用DA/T31—2017 紙質檔案數字化規范DB32/T4818.1—2024 黨史資料數據規范 第1部分數據編目ISO/TR130282010 信息和文獻 記錄數字化實施指Informationanddocumentation—Imple?mentationguidelinesfordigitizationofrecords)術語和定義GB/T20530DA/T31—2017GB/T23286.1—2009界定的以及下列術語和定義適用于本文件。黨史資料數字化 digitizationofCommunistPartyofChinahistorymaterials對黨史資料進行數字化加工,使其轉化為存儲在光盤、硬盤等載體上的數字資源,并按照黨史資料的內在聯系,建立起目錄數據與數字資源關聯關系的處理過程。失真度 distortiondegree對資料進行數字化轉換后,數字圖像與原件在色彩、幾何等方面的偏離程度。國際標準書號 internationalstandardbooknumber國際上通用的出版物標識編碼的標識符。注:采用ISBN編碼系統的出版物有:圖書、小冊子、縮微出版物、盲文印刷品等。便攜式文檔格式 portabledocumentformat一種用獨立于應用程序、硬件、操作系統的方式呈現文檔的文件格式。1DB32/T4818.2—2024聯合圖像專家組 jointphotographicexpertsgroup一種常用的圖像有損壓縮格式,可設置壓縮率,壓縮率越高,文件越小,圖像品質越低。Matroska多媒體容器 Matroskamultimediacontainer能夠在一個文件中容納無限數量的視頻、音頻、圖片或字幕軌道的一種開放標準的自由的容器和文件格式,一種多媒體合并轉化格式。注Matroska.mkv,對于單一的純音頻文件是.mka。縮略語下列縮略語適用于本文件。AVIAudioVideoInterleave)BOMByteOrderMar)COMCommercia)DPIDotsPerInc)HTTPSHypertextTransferProtocolSecur)ISBNInternationalStandardBookNumbe)JPEG/JPGJointPhotographicExpertsGrou)MXFMaterialeXchangeForma)NTSCNationalTelevisionStandardsCommitte)OFDOpenFixed?layoutDocumen)PALPhaseAlterationLin)PCMPulse?CodeModulatio)PDFPortableDocumentForma)SECAMSequentielCouleurAMemoir)SRTSubRipTex)TIFFTagImageFileForma)XMLEXtensibleMarkupLanguag)總體要求基本要求各相關單位應根據黨史資料的珍貴程度素統籌規劃、科學開展黨史資料數字化。黨史資料數字化的開展應符合GB/T20530的相關要求。應采取有效的管理和技術手段,確保黨史資料數字化成果質量。黨史資料數字化應遵循黨史資料文件以PDF/A形式保存,文件的內容應以標記形式嵌入黨史資料,保留文字的邏輯結構,以便搜索引擎進行全文檢索。2DB32/T4818.2—2024基本環節黨史資料數字化的基本環節主要包括:數字化前處理;目錄數據庫建立;資料掃描與信息采集;資料處理;數據掛接;數字化成果驗收與移交等。黨史資料數字化過程中據,元數據元素的確定應符合ISO/TR130282010的相關要求。安全管理加強黨史資料數字化各環節的安全管理,建立黨史資料數字化安全管理制度見附錄實體和黨史資料信息的安全應符合安全管理制度要求。保密要求加工涉密黨史資料時,應按照黨史資料數字化加工保密管理制度見附錄開展工作。組織與管理機構及人員應建立黨史資料數字化組織應配備具有相應能力的工作人員熟悉黨史業務并具有較高的調查研究水平和良好的組織領導能力的管理人員;熟悉相關標準規范并能為黨史資料數字化各環節提供技術支持的技術人員;掌握一定數字化基礎知識并熟悉本職工作的操作人員等。應通過科學規范的管理制度,對工作人員進行規范化管理。應加強對外聘工作人員的審核,強化數字化的安全性。基礎設施應配備專用加工場地加工場地的選擇及溫濕度等環境的控制應利于黨史資料實體的保護。場地內應配備可覆蓋全部加工涉密音視頻黨史和文獻資料時,應由黨史部門提供場地和電腦、存儲設備等具備記憶功能的存儲與處理設備,音視頻讀取和轉換設備由制作單位自備。工作方案應在充分調研的基礎上3DB32/T4818.2—2024黨史資料數字化方案應包括數字化對象慮黨史資料的珍貴程度宜對黨史資料數字化方案進行專家論證黨史資料數字化方案應經審批后嚴格執行。工作方案審批結果應與數字化過程中形成的其他文件一并保存。管理制度化成果質量。黨史資料數字化管理制度應包含崗位管理體管理等方面的制度:崗位管理制度對各數字化崗位的工作目標和職責進行規范,形成明確的崗位業務流程規范、考核標準、獎懲辦法等;人員管理制度對人員的安全責任進行規范;場地管理制度對人員出入和工作場地內基礎設施理工作進行規范;設備管理制度對數字化各環節涉及的全部設備的管理工作進行規范;數據管理制度對數字化各環節所產生的數據的管理工作進行規范;黨史資料實體管理制度對黨史資料實體在數字化過程中的交接工作流程控制應制定黨史資料數字化流程和各環節操作規范,對黨史資料數字化全過程進行有效的控制,確保數字化成果質量。應加強對黨史資料數字化的全流程安全管理。應建立完善的問題反饋機制,對黨史資料數字化過程中后端環節發現前端環節中產生的問題進行及時反饋和修正。工作資料管理應根據情況制定符合實際要求的黨史資料數字化工作資料,加強對數字化的管理。工作資料主要包括:黨史資料數字化方案;黨史資料數字化審批書;黨史資料數字化流程單;數據驗收單;項目驗收報告;黨史資料數字化成果移交清單等。應加強對黨史資料數字化工作資料的管理等管理要求。黨史資料出庫黨史資料保管部門應按照黨史資料數字化方案確定的數字化對象開展黨史資料調取4DB32/T4818.2—2024見附錄,經相關責任人批準后,按照各地黨史資料庫房管理要求為數字化對象辦理出庫手續黨史資料數字化過程中,應設置距離數字化加工場所較近的保管庫以臨時存放黨史資料,對黨史資料的領取與歸還進行嚴格管理黨史資料按介質可分為以下幾類。的擁有ISBN的圖書、各公開發表的報紙雜志等;開盤帶等。數字化前處理確定掃描頁宜將確定為數字化對象的黨史資料全部掃描。如有不需要掃描的頁面應加以標注。編制頁號應對沒有頁號或頁號不正確的黨史資料重新編制頁號。書寫頁號所使用的筆、墨等不應破壞黨史資料原件或對黨史資料長期保存造成影響。應將破損頁面、缺頁等特殊情況進行登記。目錄數據準備按照目錄數據庫建立時制定的數據規則應對需要在目錄數據庫中進行標記的情況進行標記。拆除裝訂應以對黨史資料的保護為原則確定是否拆除裝訂。如需拆除裝訂物,應注意保護黨史資料不受損害,并對排列順序不準確的黨史資料進行重排。特殊裝訂且拆除裝訂后需恢復的黨史資料,在拆除裝訂物時應采用拍照等方式記錄黨史資料原技術修復紙質資料件進行相應處理5DB32/T4818.2—2024圖像資料對殘缺、褪色、偏色的進行補充和校色。如需提供原片,應補充相關資料。音視頻資料對音視頻黨史和文獻資料載體進行外觀檢查,如出現以下情況,應對音視頻黨史和文獻資料載體進行適度清潔或修復等技術處理:資料載體物理形態出現卷曲資料載體出現可見性微斑影響音視頻資料數字化的其他情況。檢查資料載體是否存在已經損毀無法數字化的情況,對于認定為不能數字化的資料載體,送到省級黨史部門做進一步檢查認定。如遇恢復率較低的情況,應與提供單位協商解決。實物資料對實物資料進行拍照,標注實物的尺寸大小質地,體現實物資料的形狀和內容。資料登記按照DB32/T4818.1—2024第67章的要求,制作并填寫《黨史資料數字化加工登記單見附錄,詳細記錄資料相關信息。恢復裝訂掃描工作完成后,拆除裝訂物的資料應重新進行裝訂。恢復裝訂時,應注意保持資料的排列順序不變,案卷左邊和底邊整齊,做到完整、準確、無遺漏。目錄數據庫建立應制定包括數據字段長度、字段類型、字段內容要求等的目錄數據庫數據規則,其制定應符合DB32/T4818.1—2024對黨史資料編目的要求。應選擇可轉換為通用數據格式的數據庫,數據庫結構設計時應注意保持黨史資料的內在聯系。將黨史資料數字化前工作中對黨史資料目錄進行修改目錄數據。可采用計算機自動校對與人工校對相結合的方式,對目錄數據的質量進行檢查,檢查內容包括編目項目的完整性、編目內容的規范性和準確性等。發現不合格的數據應及時進行修改。資料掃描與采集基本要求黨史資料掃描應根據黨史資料原件實際情況等選擇相應的掃描設備,進行相關參數的設置和調整。參數的設置和調整應保證掃描后數字圖像清晰、6DB32/T4818.2—2024個以上文件時,應分別掃描。若后期采用軟件自動拼接的方式,重疊尺寸應不小于單幅圖像對應原件尺寸的1/3。利用專業的讀取設備采集音視頻信息術處理。掃描設備宜選擇對黨史資料實體破壞性小的掃描設備進行數字化,保護黨史資料實體。應采用平板掃描儀、專業不拆卷非接觸光源掃描儀及高分辨率的拍攝機進行掃描,不應采用滾筒式掃描儀。超出所使用掃描儀掃描尺寸的黨史資料可采用更大幅面掃描儀進行掃描,也可采用小幅面掃描儀分幅掃描后進行圖像拼接的方式處理。應遵循相關設備的使用規律掃描色彩模式宜全部采用彩色模式進行掃描,最大限度保留黨史資料原件信息。頁面中有紅頭、印章或插有照片、彩色插圖、多色彩文字等的黨史資料,應采用彩色模式進行掃描。頁面為黑白兩色,但字跡清晰度差或帶有插圖的黨史資料,可采用灰度模式進行掃描。掃描分辨率應綜合考慮掃描后圖像的清晰度、完整度和數字圖像后期利用方式等因素進行掃描分辨率的選擇。掃描分辨率不應小于300dpi600dpi。如有COM進行COM輸出的黨史資料,掃描分辨率不應小于300dpi;進行高精度仿真復制的黨史資料600dpi;進行印刷出版的黨史資料辨率。存儲格式黨史資料數字圖像長期保存格式為JPG格式保存任一方向上的尺寸誤差不應超過3 水平斜角度不應超過1°。圖像壓縮率的選擇可根據實際應用的需求而定。黨史資料數字圖像利用時將圖像轉換為OFDPDF等其他格式。若轉化則所有JPG圖片應合并轉化成PDF文件。同一批黨史資料應采用相同的存儲格式。掃描圖像命名應在資料編號為主文件名的基礎上對數字圖像命名。應將數字圖像存儲為單頁文件,并按主文件名與圖像流水號的組合對圖像命名。例如:命名為×××××××××××.jpg。數字圖像確需存儲為多頁文件時,可采用該黨史資料的資料編號+4位序號對圖像命名。示例197875118960870001.jpg97875118960870002.jpg97875118960870003.jpg示例2320000_01_02_01_03_00000010001.jpg320000_01_02_01_03_00000010002.jpg7DB32/T4818.2—2024紙質資料掃描常規紙質資料掃描按照10.2.2要求的掃描設備和掃描方式進行掃描,彩色模式下掃描精度不應低于300dpi照10.5要求進行存儲,主文件名采取8位格式,文件名按約定的命名方法,命名為×××××××××.jpg。所有JPG圖片合并轉化成PDF文件。應在未改變原掃描圖像的色彩應保證圖像信息與原資料圖像內容完全一致寫注釋和印鑒等。應清除干凈掃描留下的所有黑線、指印或陰影,圖像剪裁應保留到該頁文獻的外邊緣不包括書本疊頁部分。掃描圖像整體傾斜不應超過1°;不應出現圖像一部分傾斜或扭曲而影響閱讀的情況。圖片頁面存在部分傾斜的,以頁面中的文字糾正為準。方向不正確的圖像應進行旋轉還原,以符合閱讀習慣。紙張質量造成的頁面上零星的污點,若在頁面視圖下看不清楚,或該污點嵌在文本行中無法清特殊紙質資料掃描高進行拍照掃描,后將掃描文件組織成PDF文件。圖像資料掃描傳統沖洗的圖像資料掃描精度不應低于600dpi2寸以下的照片用600~1200dpi以上精度掃描,掃描后應對圖片進行題PDF文件。圖像格式可采用JPEG,應保證掃描精度。幻燈片可通過幻燈機等設備進行數字化,在原有圖像精度下轉換為JPEG格式的文件,而后以專題形式集結成冊,附上標題和說明,轉換為PDF文件。數字化的圖像數碼設備拍攝的,應在原有圖像精度下轉換為JPEG格式的文件;數字化矢量圖像文件,應在600dpi下進行柵格化,保存為JPEG文件,而后以專題形式集結成冊,附上標題和說明,轉換為PDF文件,不應改變內嵌圖像的格式與精度,圖像容量不受限制。圖像存儲所有資料形成的圖像文件均應采用JPG格式存儲。轉存一套雙層PDF格式。圖像文件以文件夾命名,文件夾命名應與文件級目錄中的ISBN命名相一致,文件夾內單頁圖像以8位流水號命名。8DB32/T4818.2—2024到100 。應科學建立黨史資料數字圖像的存儲路徑,確保數據掛接的準確性。圖像檢查數字化單位應在掃描完成后立即進行質檢,檢查各級別圖像數據的質量。數據檢查的內容和要求如下。圖像文件各種格式放大到1馬賽克等或圖像內容不完整等現象。若不符合圖像質量要求應進行圖像校正或重新掃描。發現文件漏掃時,應及時補掃并正確插入圖像。拼接圖像接縫處無錯位是否符合掃描規格要求和技術參數。所有文件保存位置正確,可有效打開和顯示。資料一致。等文檔是否齊全。報紙資料掃描掃描版面圖像,按400dpi精度對報紙整版掃描,確保版面文件的完整性。保留400dpi精度的原始掃描版面圖像文件,修圖后版面圖不低于400dpiPDF版面數據不低于400dpi。圖片數據庫資料格式采用JPG壓縮格式。黑白版面及圖片采用灰度技術片采用彩色技術。糾正掃描圖像的傾斜度,糾正后傾斜度不超過2°。全部圖片均應裁切,標引后以原掃描大小原色彩交付。音視頻資料采集模擬信號的音視頻資料載體信息采集后字幕文件,實現文字搜索定位。應按照11.3音視頻資料處理中的技術參數要求進行數字化轉換形成數字副本,并建立目錄數據庫。數字信號的音視頻資料拷貝采集后,按原格式保留一份資料后進行降噪、建立字幕文件等數字化處理。有多件錄音錄像電子文件反映相同場景或主題內容的原始的錄音錄像文件素材和后期編輯制作的錄音錄像文件都應收集保存,并對檔案實體進行系實物資料掃描對實物資料進行數碼拍照。一個角度無法反映實物形狀的,應多個角度進行拍照。印章等實物,應將印章內容體現出來。拍照后的實物資料數字化制作過程同圖片資料類處理方法。9DB32/T4818.2—2024珍貴且尺寸不規則的黨史資料大小。掃描后圖像處理圖像拼接對分幅掃描形成的多幅數字圖像,應進行拼接處理,合并為一個完整的圖像,保證黨史資料數字圖像的整體性。拼接時應確保拼接處平滑地融合,拼接后整幅圖像無明顯拼接痕跡。旋轉及糾偏對不符合閱讀方向的數字圖像應進行旋轉還原。對出現偏斜的圖像應進行糾偏處理基本不感覺偏斜為準。裁邊如需對數字圖像進行裁邊處理,應在距頁邊最外延至少2mm~3mm處裁剪圖像。去污去除在掃描過程中產生的污點、污線、黑邊等影響圖像質量的雜質,應遵循展現黨史資料原貌的原則,處理過程中不應去除黨史資料頁面原有的紙張褪變斑點、水漬、污點、裝訂孔等痕跡。圖像質量檢查應進行圖像質量檢查,發現質量問題及時進行整改:數字圖像不完整、無法清晰識別或圖像失真度較大時,應重新掃描;數字圖像的排列順序與黨史資料原件不一致時,應及時進行調整;重新進行圖像處理。資料處理除報紙外的文字及圖像資料處理OCR識別依據數字化加工登記單OCR的資料進行OCR逐頁識別校對,差錯率應保持在千分之一以內。PDF文件應根據圖像尺寸間至最小。手寫文檔等不適宜OCR識別的資料,應將每份資料的標題、目錄等通過人工干預方式進行識別標注。PDF合并轉化成冊裝訂的資料,一冊資料合并轉化為一個多頁的PDF文件;按卷歸檔的資料由多個成冊資料按照順序進行編號組成。PDF文件的命名即該資料的加工編號。目錄導航編輯成冊裝訂的資料,應將輸出后的雙層PDF進行目錄標簽提取,提取級別上限為三級。提取過程中應10DB32/T4818.2—2024按照原書頁面順序進行提取,不應出現章節丟失或級別劃分錯誤等情況,若書本目錄缺失,則由人工編制兩級目錄進行編目。報紙資料處理文字處理應按照以下要求進行文字處理。全文數字化部分的文字處理差錯率應在萬分之一以下。標引文字差錯率應在萬分之一以下。轉版文章應連成一篇文章特定文章的差錯標準如下:政治人物——歷屆黨和國家領導人名單,歷屆省/市委和省/市政府領導人名單,全國人大、政協領導人名單,省/國家及本省領導人的講話含公告版面文件制作將紙質報紙制作生成雙層PDF格式文件版面數據完整性應達到100 。文件夾命名及存放文件夾命名應遵循以下要求。以報紙為單位組織成文件的第一層目錄jsrb。)在報名簡稱的目錄下,以年月日為組織單位形成第二層目錄,目錄名為YYYY?MM?DDMM和DD表示22022年12月122022?12?12。單位數的日期表示為0+2022年9月92022?09?09。在年月日形成的目錄下,以各版版名形成第三層目錄:0101;若為字母加數字命名的版面A02A02;010203版;A2A3A02;01;A01B01。文件夾存放應遵循以下要求:除分類規則文件外均存放在年月日表示的第四層目錄下XMLPDF版JPG版面文件,新聞圖文件;表格、公式可作圖片處理;去掉版面上筆記、公章等痕跡。有排版生成的報刊電子數據,宜使用對應的標引工具進行反解。沒有排版報刊數據或不使用推薦標引系統的E生成XML文件。11DB32/T4818.2—2024交付成果標引好的XMLPDFJPGJPG插圖文件,彩色版面的色彩模式為RGB色彩模式為Grayscale。11.3 音視頻資料處理基本要求采集完成后的原始音視頻文件在提供利用前,可針對原始音視頻文件的拷貝文件進行文件轉用于長期保存的音視頻文件應是原始音視頻文件,而非處理后的文件。信息處理音頻資料數字化的技術參數應滿足以下要求。a)采樣率:不低于44.1kHz。對于珍貴或有特別用途的音頻資料,采樣率不低于96kHz。b)量化位數:24位。聲道:以原始聲道數記錄。文件格式:模擬信號原始檔案資料采用WAVE格式,數字資料按原格式數據采集與保存。數字化處理:所有采集到的資料采用MPEG?4AAC編碼處理,應采用可變碼率壓縮,平均碼率為160kbps。數字化成果資料用Matroska多媒體容器合并轉化音頻文件和字幕文件,音頻文件是MKA格式,字幕文件是SRT格式,背景可配上相關人物相片或相關圖片。對于配套的字幕數據,字符編碼采用UTF?8BOM。視頻資料數字化的技術參數應滿足以下要求。H.264標準編碼。特別珍貴和特殊用途的錄像資料,可采用無壓縮的方式。幀率:與原錄像資料相同。畫面寬高比:與原錄像資料相同。分辨率:采集為標清視頻時為720×57原資料為PAL制式和SECAM制式或720×48原資料為NTSC;采集為高清視頻時分辨率不低于1920×1080。色彩采樣率:采集為標清視頻時不低于0,采集為高清視頻時不低于2。視頻量化位數:不低于8bit。對于特別珍貴的資料應不低于10bit。視頻比特率:采集為標清視頻時不低于8Mbit/s,采集為高清視頻時不低于16Mbit/s。)音頻編碼格式:PCM。48kHz。音頻量化位數:不低于16bit。對于特別珍貴的資料應不低于24bit。聲道:以原始聲道數記錄。AVI或MXF格式。數字化成果:以Matroska格式合并轉化,視頻文件的擴展名為.mkv;字幕文件采用SRT格式,字符編碼采用UTF?8BOM。11.4 資料存儲存儲要求文字及圖像資料所有經過識別和標注的資料內容,文字差錯率應控制在千分之一以內。元數據編目差錯率在12DB32/T4818.2—2024千分之一以內。雙層PDFPDF文件的圖像層和文字層的文字對位準確。整本PDF應制作書簽。書簽是電子書的目錄,內容和紙質書的目錄一致。書簽的功能是用戶點擊書簽的某一章節,電子書會自動顯示為相應頁。打開PDF文件時,自動顯示書簽,書簽只展開到第一級目錄。成冊資料的PDF目錄導航文字內容差錯率千分之一以內,鏈接要求100準確。打開一本電子文獻閱覽并對文字放大時,應保證在放大到200的時候,字跡清晰,筆畫連音視頻資料音視頻數據最終都應以Matroska格式合并轉化為文件形式3D內容使用左右格式編碼在其中合并轉化相關的章節信息與圖片文件,圖片文件精度應不低于300dpiJPEG格式編碼。Matroska容器的標簽中循Matroska可擴展的開放標準音視頻容器中的定義。存儲格式所有文字及圖像數字化資料以PDF/A?1a格式存儲;視頻數字化資料以MKV格式存儲;音頻數字化資料以MKA格式存儲;配套字幕數據以SRT格式存儲。文件命名規則數字化資料命名數字化資料按照命名規則進行命名6位當地行政區劃代碼+2位資料大類區分碼+2位出版內外區分碼+2位資料時期區分碼+2位資料細類區分碼+7位順序區分碼。具體見圖1。圖1 數字化資料命名規則行政區劃代碼、大類區分碼等編制說明見表1。表1 數字化資料命名說明序號名稱長度說明1行政區劃代碼6位參考國家行政區劃代碼2大類區分碼2位0102030405069913DB32/T4818.2—2024表1 數字化資料命名說明(續)序號名稱長度說明3出版內外區分碼2位0102994資料時期區分碼2位01:新民主主義革命時期02:社會主義革命和建設時期03:改革開放和社會主義現代化建設新時期04:中國特色社會主義新時代05995資料細類區分碼2位0102030405060708996順序區分碼7位按順序編碼“320000_01_02_01_03_0000001時間為新民主主義革命時期0000001實物資料標簽命名實物資料應加貼標簽。標簽的命名和數字化資料命名一致。數據掛接數字化轉換過程中形成的目錄數據庫與圖像數據庫,通過質檢環節確認為合格后,應借助相關軟逐條對掛接結果進行檢查,發現錯誤及時進行糾正,編目條目與對應圖像文件掛接正確率應達到100 。檢查內容包括:a)目錄數據與黨史資料數字圖像對應的準確性;b)已掛接數字圖像與實際掃描數量的一致性;c)數字圖像是否能正常打開等。數字化成果驗收與移交驗收方式黨史部門應成立專門的驗收組,采用系統自動檢驗與人工檢驗相結合的方式對黨史資料數字化成果14DB32/T4818.2—2024進行驗收檢驗。驗收內容黨史資料數字化成果包括黨史資料目錄數據載體等。應對目錄數據進行驗收,主要包括數據庫中各條目的內容、格式等的準確程度,必填項是否填寫等。應對元數據進行驗收,主要包括元數據元素的完整性和賦值規范性等。應對數字圖像進行驗收序的準確性、圖像質量等。應對音視頻文件進行驗收應對數據掛接進行驗收,主要包括目錄數據與其對應的數字圖像的掛接的準確性等。應對工作文件進行驗收應對存儲載體進行驗收,主要包括載體的可用性、有無病毒等。驗收指標總體要求能采用計算機自動檢驗的項目應采用計算機自動檢驗的方式進行100檢驗,檢驗合格率應為100。不能用計算機自動檢驗的項目,可根據情況以件或卷為單位采用抽檢的方式進行人工檢驗,抽檢比率不應低于5,對于數據庫條目與數字圖像內容對應的準確性,抽檢合格率應為100,其他內容的抽檢合格率應不低于95。圖像掃描和目錄建庫數據驗收經數字化單位自檢符合要求后,在數字化單位無償提供的客戶質檢管理終端上,每批以抽檢50的方式進行圖像掃描和目錄建庫數據的驗收,其中:黨史資料號、文件夾命名、掃描無漏頁、掃描圖像完整性的準確率應達到100。如發現一條錯誤應退回重檢,且檢查驗收方不提供錯誤數據。其他數據項允許差錯率控制在1以內。文件完整性檢查對PDF文件的清晰度、傾斜度、失真度等進行檢查。如發現不符合質量要求的文件,應重新進行掃描處理。由于操作不當導致掃描文件不完整或無法清晰識別時,應重新掃描。檢查驗收方不提供錯誤信息。資料數據掛接驗收數字化單位自檢符合規定要求后,每批以抽檢50的方式進行數據驗收。數據掛接準確率應達到100 資料實體驗收資料實體驗收應逐卷清點98以上予以驗收通過。15DB32/T4818.2—2024驗收結論黨史資料數字化成果質量檢驗達到13.213.3“通過。驗收未通過應視情況進行返工或修改,后重新進行驗收。驗收完成后應經驗收組成員簽字。驗“通過的結論,應經相關項目負責人和質檢人員審查簽字,并提交黨史部門審核確認后方有效。移交數字化成果資料驗收合格后,制作單位應按照應標黨史資料數字化方案完善各種文件資料,連同省級黨史部門將統一對各市采集處理完成的原始資料和數字化資料進行專業存儲和開放應用。黨史資料歸還入庫原始資料歸還入庫資料裝訂黨史資料數字化完成后,拆除過裝訂物的黨史資料如需裝訂,應保持黨史資料原貌,做到安全、準確、無遺漏。資料歸還入庫對黨史資料進行處理和清點,并履行黨史資料入庫手續。數字化資料備份備份范圍經驗收合格的完整數據。備份方式每完成一個類別的數據驗收后,保存未經壓縮的單頁TIFF格式硬盤兩套,另轉存兩套雙層PDF格式硬盤。存儲數據的硬盤由數字化單位無償提供。為保證數據安全性,備份可選擇多樣化的載體,可采用在線、離線等多種方式相結合進行多套備份,并注意異地保存。備份數據檢驗檢驗內容主要包括備份數據能否打開對移交的硬盤進行質量檢查,檢查硬盤外觀及硬盤質量,目錄完整性、圖像是否可以打開等情數據重新進行備份。備份標簽離線備份,如移動硬盤、光盤、磁帶存儲等,應做好介質上的標簽,以便查找和管理。16DB32/T4818.2—2024備份登記應進行備份登記,填寫《黨史資料數字化備份管理登記表見附錄17DB32/T4818.2—2024附 錄 A資料性)黨史資料數字化安全管理制度工作區域應安裝無死角監控探頭全天監控。工作人員應佩戴工牌,非工作人員不應進入作業區。工作人員應簽訂保密協議。在作業區不應攜帶及使用電子設備U盤等。工作電腦只提供內網,不應開通因特網權限。不應攜帶任何火源、食品、飲料等進入加工場所。在省市縣之間通過網絡傳輸數據時HTTPS協議。傳輸前應根據省級黨史部門規定的統一加解密方法和密鑰,對內容進行加密。通過物理介質傳遞電子資料時,也應對內容進行加密。數字化竣工移交后應格式化本地存儲。18DB32/T4818.2—2024附 錄 B資料性)黨史資料數字化加工保密管理制度黨史資料管理人員和數字化加工單位均應樹立保密觀念,共同保守黨史資料機密。對各類黨史資料均應按合同規定的范圍進行出入庫、掃描,并嚴格履行手續。不應對不在掃描范圍應嚴格管理掃描的黨史資料或復制。凡涉及黨史機密的人員一律不準許在家庭、子女及無關人員面前談論有關黨史機密內容,不應在普通電話、明碼電報和私人通信中暴露黨史機密。數字化加工單位對所掃描黨史資料應妥善保管訪友、出入公共場所等。對目錄有錯誤、失去保存價值的黨史資料文件應及時溝通處理,不應以廢紙出售。發生失密、泄密和資料被盜事件時,應立即報告主管領導。當事者應寫出書面報告。對違反保密規對電子化掃描的黨史資料在掃描后宜按原順序入庫;對需要作出調整的黨史資料,應及時向領導報告,協商出對問題資料的處理辦法。不應私自處理解決。在黨史資料加工場所不應攜帶手機U盤、相機等可存儲設備。在加工期間所需要的電子設備、存儲裝置不應攜帶出加工場所。出入庫的黨史資料應做好出入庫登記,并且做好每日掃描進度的登記。黨史資料加工場所工作人員上下班及中午休息時間應嚴格簽到。在黨史資料數字化加工工作結束后交黨史部門接收,不準許帶出。在加工期間產生的廢棄的資料應統一交由黨史部門處理。19DB32/T4818.2—2024黨史資料出庫申請單見表C.1。
附 錄 C資料性)黨史資料出庫申請單表C.1 黨史資料出庫申請單交接事由注意事項序號資料名稱資料內容數量備注1234審批人日期移交人日期接收人日期20附 錄 D資料性)黨史資料數字化加工登記單表附 錄 D資料性)黨史資料數字化加工登記單表D.1 黨史資料數字化加工登記單下載權限*禁止“*字段為必填字段。是否上架*是所屬地區多個編號用空格)32103212保密等級*項目數據內容簡介*XXXXXX出版單位*新華日報出版時間*2022?08?02作者*張三相關事件*(多個用空格隔開)七七事變盧溝橋事變相關人物多個用空格隔開鄧小平周恩來文獻標簽*多個用空格隔開)南京無錫上海文件分類*(多個用空格隔開)10010002000200021001000200020003isbn編號*XXXXXX文件名稱樣例數據黨史資料數字化加工登記單見表D.1。*21黨史資料數字化加工登記單見表D.1。*DB32/T4818.2—2024附 錄 E資料性)報刊數據標引生成文件XML樣例以下為報刊數據標引生成文件XML樣例。<?xmlversion="1.0"encoding="utf?8"?><版面><大樣><日期>2022?04?25</日期><版次>01</版次><版名>要聞</版名><組版人/><報名>人民日報</報名><版面真名/><文件名>rb01RBXW1C425.fit</文件名><簽發部門/><簽發人/><版面編輯>鞠鵬</版面編輯><版面高>14605</版面高><版面寬>9384</版面寬><文本篇數>8</文本篇數><圖片篇數>3</圖片篇數><PDF><文件名>rb01RBXW1C425.pdf</文件名></PDF><版面圖><文件名>rb01RBXW1C425b.jpg</文件名><高>544</高><寬>350</寬><真圖><文件名>rb01RBXW1C425.jpg</文件名><高>5905</高><寬>3795</寬></真圖><簡圖><文件名>rb01RBXW1C425b.jpg</文件名><高>544</高><寬>350</寬></簡圖>22<圖標><文件名>rb01RBXW1C425i.jpg</文件名><高>100</高><寬>64</寬></圖標></版面圖></大樣><小樣><發布類型>發布類型</發布類型><發布>1</發布><信息ID>人民日報012021?04?2500033</信息ID><來源/><引題><![CDATA[]]></引題><標題><![CDATA[國家主席發表二〇二一年新年賀詞]]></標題><副題><![CDATA[]]></副題><摘要><![CDATA[]]></摘要><作者>鞠鵬</作者><通訊員/><欄目/><圖片說明/><下轉/><上接/><序號>1</序號><分類/><體裁/><轉載/><文件名>zll7465.txt</文件名><字數>1244</字數><版面圖映射><頂點個數>10</頂點個數><頂點>0.01 11.81 </頂點><頂點>70.59 11.81 </頂點><頂點>70.59 38.58 </頂點><頂點>0.01 38.58 </頂點><頂點>0.01 11.81 </頂點><頂點>-0.01 11.81 </頂點><頂點>0.01 11.81 </頂點><頂點>0.01 24.41 </頂點><頂點>-0.01 24.41 </頂點><頂點>-0.01 11.81 </頂點></版面圖映射>
DB32/T4818.2—202423DB32/T4818.2—2024<內容><![CDATA[ ■記
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《變形計》觀后感15篇
- 民俗博物館改造實施方案
- 2022年愛護地球倡議書
- 《青銅葵花》讀書心得(63篇)
- 快遞柜標準化布局實施方案(參考)
- 焦爐余熱利用裝置改造項目初步設計
- 共享單車電子圍欄規劃設計方案(范文模板)
- 供熱一次管網更新改造項目實施方案(模板)
- 口部操訓練課件
- 室內設計師核心能力與工作流程
- 2024-2025學年河南省天一大聯考高二下學期4月期中測試數學試卷(含答案)
- 2025-2030中國學生校服行業市場發展分析及前景趨勢與投資研究報告
- 全球化背景下的超大城市治理創新
- 202503寶鋼大廈BA系統改造方案圖文
- 《雙碳管理基礎與實務》課件-第六章 ESG管理
- 靜脈用藥混合調配操作
- 2025工廠員工安全培訓考試試題及一套答案
- DB11 T 411.8-2007 體育場館等級劃分及評定 第8部分:籃球館
- 貨車掛靠協議合同
- 防爆機器人知識培訓課件
- 規模化養豬場非洲豬瘟生物安全防控策略研究
評論
0/150
提交評論