紙質檔案數字化基本流程及技術要求_第1頁
紙質檔案數字化基本流程及技術要求_第2頁
紙質檔案數字化基本流程及技術要求_第3頁
紙質檔案數字化基本流程及技術要求_第4頁
紙質檔案數字化基本流程及技術要求_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、紙質檔案數字化基本流程及技術要求紙質檔案數字化的基本環節主要包括:檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數據掛接、數據驗收、數據備份等。具體流程如下:(一)檔案整理在掃描之前,根據檔案管理情況,按下述步驟對檔案進行適當整理,并視需要作出標識,確保檔案數字化質量。1、目錄數據準備按照檔案著錄規則(DA/T18)等的要求,規范檔案中的目錄內容。包括確定檔案目錄的著錄項、字段長度和內容要求。如有錯誤或不規范的案卷題名、文件名、責任者、起止頁號和頁數等,應進行修改。(詳見附件)2、拆除裝訂在不去除裝訂物情況下,影響掃描工作進行的檔案,應拆除裝訂物;將檔案原件的裝訂線拆除,排好順序,不得出現

2、任何漏缺頁及順序差錯,更不能對檔案原件有任何損壞。3、區分掃描件和非掃描件按要求把同一案卷中的掃描件和非掃描件區分開。普發性文件區分的原則是:無關的重份的文件要剔除,有正式件的文件可以不掃描原稿。4、頁面修整?對破損嚴重、無法直接進行掃描的檔案,應先進行技術修復、裱糊;?折皺不平影響掃描質量的原件應先進行相應處理(壓平或燙平等)后再進行掃描。5、檔案整理登記制作并填寫紙質檔案數字化加工過程登記表,詳細記錄檔案整理后每份文件的起始頁號和頁數。(二)檔案掃描1、掃描方式(掃描前必須準備一臺專業的高速掃描儀,并帶平板)?根據檔案幅面的大小(A4、A3、AO等)選擇相應規格的掃描儀或專業擔描儀,如工程

3、圖紙可采用0號圖紙掃描儀進行掃描。?普通A4紙質文件,采用高速掃描儀的自動進紙方式掃描;?紙質過薄、透明的(如信紙、便簽紙)采用高速掃描儀的平板掃描;?紙質過厚、照片等檔案采用高速掃描儀的平板掃描;?對文件頁面貼有附屬小頁面、紙張時,將大小頁面單獨在平板中掃描;2、掃描模式(紙質檔案掃描一般采用黑白、灰度和彩色三種模式)?頁面為黑白兩色,字跡清晰的、不帶圖片的檔案材料,采用黑白方式;?頁面為黑白兩色,清晰度較差或者帶有圖片的檔案材料,以及頁面多為彩色文字的檔案,采用彩色或灰度模式(因情況而定);?頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,采用彩色模式掃描。3、分辨率選擇?采用

4、黑白、256級灰度模式掃描的文件,其分辨率選擇為不小于200DPI;?采用24位為彩色模式掃描的文件,其分辨率選擇為不小于100DPI。(以上模式分辨率的設定以A4紙張為標準,其他規格紙張酌情處理)?掃描的線數、閥值、亮度、灰度、對比度等值可根據所掃描文件材料的清晰度進行適當的調整;?需要時可根據原件的清晰度適當調整掃描分辨率。如原件質量較差且尺寸較小,可適當提高分辨率;反之也可相應減少分辨率,增減的多少以掃描后圖像按原尺寸顯示后是否清晰為準;?粘貼折頁與表格,對于粘貼折頁,可用大幅面掃描儀掃描,或先部分掃描后拼接;對部分字體很小、字跡密集的情況,可適當提高掃描分辨率,選擇灰度掃描或彩色掃描,

5、采用局部深化技術解決;對字跡與表格顏色深度不同的,采用局部淡化技術解決。4、掃描登記填寫交接登記表,登記掃描的頁數。核對每份文件的實際掃描頁數與檔案整理時填寫的文件頁數是否一致,不一致時應注明具體原因和處理方法。(三)圖像處理對圖像進行處理,以獲得最好的圖像質量,保證圖像完整、端正、無扭區、版面無暗影、無干擾信息,主要完成圖像處理包括:去黑邊、去污點、糾偏等,處理完的圖像保存格式為PDF。?糾偏:對掃描過程中出現的偏斜圖像進行整體糾正,包括自校和手校,保證數字圖像的偏斜角度小于1度(圖像偏斜不超過頁面內半個文字);?旋轉:按方字方向將圖片旋轉至正確方向,沒有文字的圖片,判斷其方向后進行左旋、右

6、旋、翻轉、旋轉等工具;?去污:對圖像頁面中出現的影響圖像質量的雜質,去除數字圖像中影響可懂度的雜質,如去除黑邊、多余邊、污點;?裁邊:采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節省存儲空間。?刪除空白頁:將掃描后頁面之間的空白頁進行刪除;?斷字修補:對部分文字不清楚可進行修補;?反白字修正:將部分反白文字可進行描述;?分割:將A3幅面的文件分割為兩份A4幅面的文件;?拼接:對大幅面檔案進行分區掃描形成的多幅圖像,應進行拼接處理,合并為一個完整的圖像,以保證檔案數字化圖像的整體性。(四)圖像處理質檢主要對完成圖像深處理的檢查,不合要求的返回上一環節重新處理,

7、如以下問題:?由于操作不當,造成掃描的圖像文件不完整或無法清晰識別時,應重新掃描;?對圖像偏斜度、清晰度、失真度等進行檢查。發現不符合圖像質量要求時,應重新進行圖像的處理;?圖像處理的是否得當,嚴重的應重掃,處理不當的應重新處理;?掃描圖像頁碼順序是否與原文件一致,有無漏掃、多掃(重復)、紙張倒置等情況;?順序:如果頁碼不連續,與原文不一致,需對頁面進行排序;?漏掃:將漏掃的頁面重新掃描,并插入到正確的位置;?多掃:將多掃頁面刪除;?倒置:不符合要求的需進行調整,保持與原文一致。(五)圖像存儲紙質檔案目錄數據庫中的每一份文件,都有一個與之相對應的唯一檔號,以該檔號為這份文件掃描后的圖像文件命名

8、。多頁文件要合并為一個PDF,保存到指定的路徑,便于準確掛接入庫,與檔案管理軟件中的目錄建立一一對應的關系。再將所有文檔批量轉換為可以復制、檢索利用的雙層PDF格式,然后進行光盤刻錄,確保刻錄好的光盤能正確地讀出,并做好標識標簽。注:禁止用Word文檔保存掃描圖像。(六)目錄建庫按照檔案著錄規則(DA/T18)的要求進行著錄,建立檔案目錄數據庫。目錄建庫應選擇通用的數據格式。所選定的數據格式應能直接或間接通過XML文檔進行數據交換。注:采用人工校對或軟件自動校對的方式,對目錄數據庫的建庫質量進行檢查。核對著錄項目是否完整、著錄內容是否規范、準確,發現不合格的數據應要求進行修改或重錄。(七)數據

9、掛接1、掛接前的數據關聯檢查以紙質檔案目錄數據庫為依據,將每一份紙質檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應文件夾時,要認真核查每一份圖像文件的名稱與檔案目錄數據庫中該份文件的檔號是否相同,圖像文件的頁數與檔案目錄數據庫中該份文件的頁數是否一致,圖像文件的總數與目錄數據庫中文件的總數是否相同等。通過每一份圖像文件的文件名與檔案目錄數據庫中該份文件的檔號的一致性和唯一性,建立起一一對應的關聯關系,為實現檔案目錄數據庫與圖像文件的批量掛接提供條件。2、匯總掛接檔案數字化轉換過程中形成的目錄數據庫與圖像數據庫,通過質檢環節確認為"合格"后,通過網絡

10、及時加載到數據服務器端匯總。通過編制程序或借助相應軟件,可實現目錄數據對相關聯的數字圖像的自動搜索、加入對應的電子地址信息等,實現批量、快速掛接。(八)數據驗收一個全宗的檔案,數字化轉換質量抽檢的合格率達到95%以上(含95%)時,給予以驗收“通過”。目錄數據庫與圖像文件掛接錯誤,或目錄數據庫、圖像文件之一出現不完整、不清晰、有錯誤等質量問題時,抽檢標記為"不合格"。驗收"通過"的結論,必須經分管領導審核、簽字后方有效。填寫紙質檔案數字化交接登記表。(九)數據備份經驗收合格的完整數據應及時進行備份。著錄條目和全文數據進行一式兩份DVD光盤刻錄。移交前檢測

11、光盤讀取性能,抽查刻錄好的光盤影像質量,主要包括備份數據能否打開、數據信息是否完整、文件數量是否準確等。不合格的需重新刻錄。數據備份后應在備份介質上標注好盤內文件內容、類別、存入日期及光盤編號等,以便查找和管理。對保密的需標明密級。(十)裝訂?掃描工作完成后,拆除過裝訂物的檔案應按檔案保管的要求重新裝訂。恢復裝訂時,應注意保持檔案的排列順序不變,做到安全、準確、無遺漏。?裝訂不能損害檔案原件。裝訂時應按原有順序裝訂,案卷不掉頁、左邊和底邊整齊,保持拆卷前的原貌,并認真做好檔案頁碼、頁數的檢查對較。(十一)掃描注意事項?掃描前必需對文檔進行拆除裝訂物,并檢查文檔內是否藏有干擾物(如釘書釘、碎紙等

12、),以免產生卡紙、損壞掃描儀,務必保持文檔干凈送入掃描儀中;?對破損嚴重、無法進行掃描的原件要先進行修復、裱糊;?褶皺不平影響掃描質量的原件應先壓平再進行掃描;?對紙質過薄、透明的(如信紙、便簽紙)、紙質過厚、照片等采用高速掃描儀的平板掃描;?對文件頁面貼有附屬小頁面、紙張時,將大小頁面單獨在平板中掃描;?掃描完每一份文件,要對照原文仔細檢查掃描是否清晰、完整;?按要求使用掃描儀、清洗,并對每次使用完掃描儀進行保潔,檢查是否關閉電源;?紙質檔案數字化成果提供網上檢索利用時,應有制作單位的電子標識,并根據具體情況分別采用可下載或不可下載的數據格式。附件檔案整理須知目錄數據修改人員,嚴肅認真,逐條

13、核對,在檔案局管理人員的指導、監督下,進行更正。根據整理核對人員的差錯報告,是目錄室的目錄錯誤,在檔案局目錄管理人員指導下,進行更正,確保目錄室目錄準確無誤;對照檔案原件,檢查卷內文件目錄的所有項(包括案卷號、順序號、文號、責任者、題名、日期、頁號、保管期限),保證其正確、完整,并與實體文件一一對應,仔細檢查每份文件,一份文件對應一條目錄,如有漏編目錄,應補編目錄。(1)檢查檔案實體的編頁碼檔案實體的頁碼按順序連續排列,但如有漏頁碼則可視具體情況處理。 中間任意兩頁之間有需補編頁碼的,如P7與P8頁之間有4頁沒有編頁碼,則依次編為“007-1,007-2,007-3,007-4”。如沒有頁碼的

14、是一份文件的首頁,則將該頁編為正碼,其它依次編為副碼,如P7與P8之間有一頁未編碼,而該頁正好是P8所在文件的首頁,則將該頁編為008,而原P8編為008-1。 出現跳號,如文件內容完整連貫,編碼時把第一頁編為001,第二頁編為004,則需在備注注明P2、P3為跳號,無實際內容。 檢查檔案目錄,使檔案目錄內的案卷和卷內目錄與每卷檔案查改后的目錄一致。(2)文件題名,一般照實抄錄;若文件沒有標題或原標題不具體,不能反映文件內容(如“通知”),則須重新擬定題名,加擬或重擬的題名附于原題名之后,外加“”,以示區別;“任免”、“表彰”等文件題名通常只標注一個或部分人名,應在原題名之后加上涉及立檔單位的其他有關人員名字,并外加“”。(3)文件編號,一般照實抄錄,不能隨意刪減、省略、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論