




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
標準草案文化館數字資源采集規范(草案稿)目 次目 .....................................................................1前言.......................................................................2文化館數字資源采集規范.......................................................31范圍......................................................................32規范性引用文件.............................................................33術語和定義.................................................................33.1數字資源...............................................................34數字資源采集技術要求.......................................................34.1梳理采集數據...........................................................34.2清洗采集數據...........................................................54.3轉換數據格式...........................................................54.4傳輸數據文件...........................................................64.5設置調度計劃...........................................................65數字資源采集運維要求.......................................................6前言本文件根據GB/T1.1-2009本文件由全國文化館標準化技術委員會(SAC/TC390)歸口。本文件起草單位:文化部全國公共文化發展中心本文件主要起草人:課題組文化館數字資源采集規范范圍下列文件對于本文件的應用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。本文引用:《基層公共文化數據采集及文化館基礎數據分析研究課題報告》下列術語和定義適用于本文件。資源建設信息序號字段備注1.資源ID資源編碼,資源在系統內的唯一標識例如:404861e5-baf8-4e9d-bddb-8f0dddb2fe632.資源類型(3.資源題名例如:北京曲劇藝術賞析4.系列題名例如:中華戲曲薈萃5.分集總數例如:996.分集次數例如:837.資源URL資源訪問的URL8.廣電分類例如:J8戲劇藝術9.中圖分類例如:J22戲曲10.關鍵詞例如:戲曲|地方戲曲|北京曲劇11.節目類型例如:中國戲劇12.節目形態例如:專題13.時長時長,單位:分鐘14.文件格式文件名后綴,例如:MP415.文件大小文件大小,單位:兆16.受眾受眾,例如:戲曲愛好者17.資源獲得方式資源獲得方式18.資源提供者資源制作人或單位等19.資源發布時間資源發布的時間,格式:2016-09-0118:23:19用戶檢索信息序號字段備注20.訪問終端類型參見終端設備類型編碼表,例如:PC21.用戶ID用戶ID22.訪問地址訪問地址23.檢索時間用戶執行檢索的時間,格式:2016-09-0118:23:1924.檢索條件用戶檢索時輸入的檢索條件25.檢索用時用戶檢索用時,單位:毫秒26.檢索結果數量用戶執行檢索操作后,系統返回結果的數量27.用戶IP用戶訪問來源IP,例如:1528.瀏覽器類型參見瀏覽器類型編碼表,例如:IE用戶訪問信息序號字段備注29.訪問終端類型參見終端設備類型編碼表,例如:PC30.用戶ID用戶ID31.資源ID用戶訪問的資源ID32.資源訪問地址資源訪問地址33.用戶瀏覽資源時間用戶瀏覽資源的時間,格式:2016-09-0118:23:1934.用戶IP用戶訪問來源IP,例如:1535.瀏覽器類型參見瀏覽器類型編碼表,例如:IE用戶評價信息序號字段備注36.訪問終端類型參見終端設備類型編碼表,例如:PC37.用戶ID用戶ID38.資源ID資源唯一ID39.訪問地址訪問地址40.評價用戶打分41.評價時間評價操作時間,格式:2016-09-0118:23:1942.用戶IP用戶訪問來源IP,例如:1543.瀏覽器類型參見瀏覽器類型編碼表,例如:IE訪問用戶信息序號字段備注44.用戶ID用戶ID45.用戶姓名用戶的姓名46.用戶學歷用戶的學歷,例如:本科47.用戶出生日期用戶出生日期48.用戶性別用戶的性別,例如:男49.用戶民族用戶的民族,例如:漢族50.用戶職業用戶的職業,例如:教師51.政治面貌用戶的政治面貌,例如:黨員52.用戶職稱用戶的職稱,例如:教授53.注冊時間用戶的注冊時間,格式:2016-09-0118:23:19為了實現采集數據的匯聚與共享,采集的數據格式需要統一,遵守如下規則:1)內容編碼格式內容編碼統一設置為UTF-8;2)日期類型YY--DDYY-M-DYYYYMM(01-12)對于不符合日期約束規則的日期值,處理方式存在以下兩種情況:(1“17-1-0充;(2)接口中的“失效日期”在表示“未失效”含義時,一律以“2999-12-31”填充。3)時間類型統一采用HH:MM:SS格式:HH(00-23),24MM(00-59);SS(00-59)。4)日期時間類型統一采用YYYY-MM-DDHH:MM:SS格式,格式要求見日期類型和時間類型。注意,日期與時間中間有一個半角空格符。5)內容字段內容字段中不可以包含回車換行符(0x0D0A),如果包含,需要替換成半角空格符號。SFTP(SecureFileTransferProtocol)接口文件中數據分隔符要求如下:1)記錄間分隔符:回車換行符(0x0D0A);2)ACI0x0“03)為了保證數據的準確性以及接口文件中的記錄各值域在有效的取值范圍內,數據中均不能包含0x0D0A(回車換行符)、0x0D(回車符)、0x0A(換行符)和字段間分隔符。4)字段數量及順序應該絕對固定,接口數據中不可省略,無值就留空。1)準實時方式:將產生的數據在5分鐘延遲內完成傳輸;2)每小時方式:每個小
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 租地遞增合同協議
- 砂石股份合同協議
- 物資托管合同協議
- 種植農業合同協議
- 研發設計合同協議
- 討債方法合同協議
- 盛大金禧合同協議
- 賬期協議合同協議
- 賬簿轉讓合同協議
- 遺囑變賣合同協議
- 毛澤東詩詞賞析
- 車輛油箱蓋產品入市調查研究報告
- 《我國中小企業融資的現狀、問題及完善對策研究-S高科技公司為例》12000字(論文)
- 灼口綜合征護理
- 實驗室氣體泄漏應急預案
- 【碳足跡報告】山東金拓熱能科技有限公司產品碳足跡報告
- 小孩進入廠區安全免責協議書(2篇)
- 動火作業安全指導手冊
- 讀書分享讀書交流會《基督山伯爵》課件
- T-CECS120-2021套接緊定式鋼導管施工及驗收規程
- 延安精神概論智慧樹知到答案2024年延安大學
評論
0/150
提交評論