




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四講元數據12/6/20231信息管理系元數據(MetaData),就是“描述數據的數據”或“關于數據的結構化數據”。哈佛大學數字圖書館項目定義:元數據是幫助查找、存取、使用和管理信息資源的信息。一、元數據概念12/6/20232信息管理系具體:元數據是用來描述數據本身的內容特征和其它特征的數據,目地是加強對網絡信息資源的發現、識別、開發、組織和評價,而且對相關的信息資源進行選擇、定位、調用,追蹤資源在使用過程中的變化,實現信息資源的整合、有效管理和長期保存。12/6/20233信息管理系例如:文獻信息資源,元數據可以是目錄、索引、摘要及主題等文獻特征和屬性。從元數據的提供者角度來看,元數據能改進針對文檔的檢索能力,特別是搜索的精確度、以及對資源的控制和管理問題。對于電子文檔所存在的格式和控制方法多樣性問題,元數據能支持用戶決策過程。12/6/20234信息管理系DL信息體系結構12/6/20235信息管理系元數據是關于數據的數據(dataaboutdata),此術語指任何用于幫助網絡電子資源的識別、描述和定位的數據。元數據是關于數據的結構化的數據(structureddataaboutdata)。12/6/20236信息管理系元數據是與對象相關的數據,此數據使其潛在的用戶不必預先具備對這些對象的存在或特征的完整認識。元數據是對信息包(Informationpackage)的編碼描述,其目的在于提供一個中間級別的描述,使得人們據此就可以做出選擇而無需檢索大量不相關的全文文本。12/6/20237信息管理系?元數據,即代表性的數據,通常被定義為數據之數據。它包含用于描述信息對象的內容和位置的數據元素集,促進了網絡環境中信息對象的發展和檢索。12/6/20238信息管理系應用于不同領域的Metadata格式
網絡資源:DublicCore、ROADSTemplate、CDF(ChannelDefinitionFormat)、WebCollections文獻資料:MARC(with856Field),DublicCore人文科學:TEIHeader(TextEncodingInitiativeHeader)社會科學數據集:ICPSRSGMLCodebook(Inter-universityConsortiumforPoliticalandSocialResearch)博物館與藝術作品:CIMI(ComputerInterchangeofMuseumInformation)、CDWA(CategoriesfortheDescriptionofWorksofArts)、RLGREACHElementSet.12/6/20239信息管理系視覺資料:VRA(VisualResourcesAssociation)CoreCategoriesforVisualResources音樂資料:SMDL(StandardMusicDescriptionLanguage)政府信息:GILS(GovernmentInformationLocatorService)地理空間信息:FGDC/CSDGM(FederalGeographicDataCommittee/ContentStandardsforDigitalGeospatialMetadata)12/6/202310信息管理系數字圖像:MOA2metadata、CDLmetadata、OpenArchivesFormat、VRACore、NISO/CLIR/RLGTechnicalMetadataforImages檔案庫與資源集合:EAD(EncodingArchivalDescription)技術報告:RFC1807:AformatforBibliographicRecordsFTP文件和FTP文件庫:IAFATemplates(InternetAnonymousFTPArchivesTemplates)連續圖像:MPEG-712/6/202311信息管理系二、元數據的目的12/6/202312信息管理系12/6/202313信息管理系12/6/202314信息管理系12/6/202315信息管理系三、元數據結構12/6/202316信息管理系12/6/202317信息管理系12/6/202318信息管理系12/6/202319信息管理系12/6/202320信息管理系3語義結構:12/6/202321信息管理系12/6/202322信息管理系12/6/202323信息管理系12/6/202324信息管理系12/6/202325信息管理系12/6/202326信息管理系12/6/202327信息管理系12/6/202328信息管理系12/6/202329信息管理系資源描述框架(ResourceDescriptionFramework)數據描述模式而且采用基于XML的句法提供語義、結構、句法三個層次的互操作能力模塊化的互操作能力有些數據化信息需要不同的元數據描述,RDF對集成這些元數據非常有用。四、元數據描述框架RDF12/6/202330信息管理系RDF是一個與任何特定語法無關的抽象的資源表達模式,用來反映資源(Resource)、屬性(Property)與屬性值(Value)資源resource屬性property屬性值value語句statement12/6/202331信息管理系換言之…“張三是由以下網址所標識的資源的作者:/tsgzz/99-3/p22.htm”/tsgzz/99-3/p22.htm作者author張三12/6/202332信息管理系/tsgzz/99-3/p22.htm作者author張三<rdf:RDF><rdf:Descriptionabout=”/tsgzz/99-3/p22.htm”><作者>張三</作者></rdf:Description></rdf:RDF>RDF基于XML的描述實例:RDF描述實例12/6/202333信息管理系/tsgzz/99-3/p22.htmDC:Creator張三DublinCore基于RDF的描述:<rdf:RDFxmlns:rdf="/1999/02/22-rdf-syntax-ns#"xmlns:dc="/dc/elements/1.0/">
<rdf:Descriptionabout=”/tsgzz/99-3/p22.htm”><dc:Creator>張三</dc:Creator></rdf:Description></rdf:RDF>基于RDF的DC描述實例12/6/202334信息管理系1)/1999/02/22-rdf-syntax-ns#RDF標準申明2)dc="/dc/elements/1.0/DC標準申明Notes:12/6/202335信息管理系五、元數據種類由于網上數字資源的形態各異,既有論文、會議錄等普通電子文本,也有圖像、聲音、網頁等,不同形式的數字資源對數據格式的要求也不一樣,因此現在有多種描述網絡數字資源的元數據格式,到目前為止還沒有出現成熟的統一格式。
兩種:Marc、DC12/6/202336信息管理系1MARC(Machine-ReadableCatalogue)元數據
機讀目錄格式MARC是圖書情報領域廣泛應用的標準格式,國際通用的MARC標準為USMARC和UNIMARC標準。我國的MARC標準(CNMARC)是在UNIMARC標準的基礎上加以補充規定形成的。由于多語種圖書文獻的存在,目前我國的機讀書目數據實際上是以CNMARC和US-MARC為主,其他MARC格式為輔的現狀。12/6/202337信息管理系MARC格式可由四個部分組成,其中記錄頭標區固定為24個字符長,為記錄處理提供基本參數。地址目次區由若干目次項組成,每個目次項為定長12個字符,標識某MARC字段在整個MARC流中的位置。數據字段區由一些可變長的數據字段組成,除了001字段和005字段由數據和一個字段分隔符組成外,其余每個字段都有兩個指示符,后接若干子字段。12/6/202338信息管理系整個MARC數據流經檢測有效才能成為書目數據庫的正式書目數據。MARC元數據格式——主要用于描述圖書文獻資源。12/6/202339信息管理系MARC局限性:
(1)MARC描述手段往往只適用于圖書館;(2)MARC需要在專門的軟件系統中使用,而且不太適應互聯網的環境;(3)修訂程序相當復雜,而且非常緩慢;(4)適用于完整的、靜止的信息內容的處理,不易處理動態的多媒體信息;(5)編制一條機讀目錄不僅需要經過嚴格的專門訓練,而且需要花一定的時間。12/6/202340信息管理系
2、DC元數據簡介
1995年3月,在美國俄亥俄州的都柏林召開的第一屆元數據研討會上,52位來自圖書館界、電腦網絡界專家共同研究產生。目的是希望建立一套描述網絡電子文獻的方法,以便網上信息檢索。其中心議題是如何用一個簡單的元數據記錄來描述種類繁多的電子資源,使非圖書館專業人員都能夠了解和使用著錄格式,來描述網上資源。經過與會代表的商討和辯論,產生了一個精簡的元數據集——都柏林核心元素集(DublinCoreElementSet),簡稱都柏林核心(DC)。
12/6/202341信息管理系DC由15個基本元素構成。由于它具有簡練、易于理解、可擴展、能與其他元數據形式進行橋接等性能,能較好地解決網絡資源的發現、控制和管理問題,使它成為一個較好的網絡資源描述元數據集,已經成為美國國家標準,并正在逐步成為世界公認的標準。12/6/202342信息管理系DC產生與發展屆次舉辦時間主辦國舉辦地主辦組織DC-11995.3美國Dublin,OhioOCLC、NCSADC-21996.4英國WarwickOCLC、UKOLNDC-31996.9美國Dublin,OhioOCLC、CNIDC-41997.3澳大利亞CanberraOCLC、DSTC、NLADC-51997.10芬蘭HelsinkiOCLC、NLFDC-61998.11美國WashingtonD.C.OCLC、TLCDC-71999.10德國FrankfurtOCLCDC-82000.10加拿大OttawaOCLC、CNI、IFLADC-92001.10日本TokyoOCLC、NII、JSTDC20022002.10意大利FlorenceOCLCDC20032003.9美國西雅圖OCLC12/6/202343信息管理系1)、DC元數據的類型12/6/202344信息管理系2)詳細描述12/6/202345信息管理系12/6/202346信息管理系12/6/202347信息管理系12/6/202348信息管理系12/6/202349信息管理系12/6/202350信息管理系12/6/202351信息管理系12/6/202352信息管理系3)DC修飾詞(分為兩類):(1)元素的進一步限制該類修飾詞使元素的含義更為狹窄或專指,進一步限定的元素繼承了未限定元素的外延,便具有更為嚴格的內涵。如果使用者不明白經過進一步限定的術語的特指含義,可以忽略修飾詞,直接將它作為未修飾的元數據元素來理解。用于修飾元素的進一步限定的定義應該可以方便的得到。12/6/202353信息管理系元素限定屬性說明TitleAlternative替代標題Creater暫無限制屬性12/6/202354信息管理系12/6/202355信息管理系元素限定屬性說明SubjectLCSH國會圖書館主題詞表*MeSH國家醫學圖書館主題詞表*DDC杜威十進分類表*LCC國會圖書館分類表*UDC國際十進分類表*12/6/202356信息管理系12/6/202357信息管理系元素限定屬性說明DescriptiontableOfContents目次Abstract文摘Publisher暫無限制屬性12/6/202358信息管理系12/6/202359信息管理系12/6/202360信息管理系12/6/202361信息管理系12/6/202362信息管理系元素限定屬性說明Contributor暫無限制詞DateCreated制作日期Valid有效日期Available可獲得日期Issued發表日期Modified修改日期DCMIPeriodDCMI日期編碼*W3C-DTFW3C-DTF日期編碼*12/6/202363信息管理系12/6/202364信息管理系元素限定屬性說明TypeDCMITypeDCMI資源類別編碼*12/6/202365信息管理系12/6/202366信息管理系元素限定屬性說明FormatExtent資源范圍Medium物理載體IMTinternet資源格式*12/6/202367信息管理系12/6/202368信息管理系12/6/202369信息管理系12/6/202370信息管理系12/6/202371信息管理系12/6/202372信息管理系12/6/202373信息管理系12/6/202374信息管理系元素限定屬性說明IdentifierURI資源唯一標識符號*12/6/202375信息管理系12/6/202376信息管理系12/6/202377信息管理系元素限定屬性說明Source暫無限制詞LanguageISO639-2ISO639-2語種代碼*RFC1766RFC1766語種代碼*12/6/202378信息管理系12/6/202379信息管理系12/6/202380信息管理系元素限定屬性說明RelationIsVersionOf是另一種資源的一個版本HasVersion有其他資源作為其他版本IsreplacedBy被另一資源取代RePlaces取代另一資源IsRequiredBy被另一資源所需要Requires需要一資源IsPartOf是另一資源的一部分HasPart有另一資源作為一部分IsReferencedBy被另一資源所參見12/6/202381信息管理系元素限定屬性說明RelationReferences參見另一資源IsFormatOf是另一資源的另一格式HasFormat有另外格式URI使用URI描述關聯資源*12/6/202382信息管理系12/6/202383信息管理系12/6/202384信息管理系12/6/202385信息管理系12/6/202386信息管理系12/6/202387信息管理系12/6/202388信息管理系12/6/202389信息管理系12/6/202390信息管理系12/6/202391信息管理系12/6/202392信息管理系12/6/202393信息管理系12/6/202394信息管理系12/6/202395信息管理系12/6/202396信息管理系12/6/202397信息管理系12/6/202398信息管理系12/6/202399信息管理系12/6/2023100信息管理系12/6/2023101信息管理系12/6/2023102信息管理系12/6/2023103信息管理系12/6/2023104信息管理系12/6/2023105信息管理系12/6/2023106信息管理系元素限定屬性說明Rights暫無限制詞12/6/2023107信息管理系元素限定屬性說明CoverageSpatial空間范圍DCMIPointDCMI空間坐標系統*ISO3166ISO3166國家名稱代碼*DCMIBoxDCMI地理區限描述體系*TGNGetty地理名稱敘詞表*temporal時間范圍DCMIPeriodDCMI時期體系*W3C-DTFW3C-DTF時間編碼體系*12/6/2023108信息管理系12/6/2023109信息管理系12/6/2023110信息管理系12/6/2023111信息管理系12/6/2023112信息管理系12/6/2023113信息管理系(2)編碼體系該類修飾詞說明元素值所屬的編碼體系,以幫助理解值的含義。采用來自控制詞表的表征符號(例如分類法主題詞標中的術語)具有特定意義,或以一定形式組成的字符串表示正規的符號。如果一種編碼體系無法被客戶機或代理所理解,它的值仍能被人類所理解。用于修飾的編碼體系必須有清晰明確的說明,并能夠方便的得到.12/6/2023114信息管理系DCMI自己的編碼規則:12/6/2023115信息管理系12/6/2023116信息管理系12/6/2023117信息管理系12/6/2023118信息管理系12/6/2023119信息管理系4)、DC的作用是:
(1)支持簡單而含有信息量的元數據,以滿足廣大用戶和群體的需要。(2)提供一個共享語義學標準,使得用各種不同規則編目的元數據可以直接交換。12/6/2023120信息管理系1)簡單性。DC是非專業層面提出來的,其目的是為網頁制作者提供一種網絡信息的著錄格式,以供用戶查找與定位所需信息。與傳統的目錄卡片及MARC格式相比,DC簡單。2)靈活性。DC的每一著錄項目都是可以選擇的,也是可以重復的。網絡制作人員可以根據網頁的內容與特征選擇需要項目,允許不同專業團體根據專業要求對其進行調整。5)DC
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司收購合同協議書
- 全程服務委托合同協議書
- 建筑安裝工程勞務合同
- 招標文件中合同條款
- 《假如》教學課件-
- 人民數據:數據資產入表解決方案2024
- 敲墻合同范本
- 托盤加工制作合同范本
- 大慶個人租房合同范本
- 2025年度合作方試銷標準版合同
- 保安上墻制度
- T-KTSDN 2401-2024 地面供暖系統清洗維保操作技術服務規范
- 2025年建投國電準格爾旗能源有限公司招聘筆試參考題庫含答案解析
- 2025念珠菌病診斷和管理全球指南解讀課件
- 碘對比劑應用護理安全性
- 水電站安全生產培訓
- 2025年國家藥品監督管理局特殊藥品檢查中心招聘6人歷年高頻重點提升(共500題)附帶答案詳解
- 《礦井提升設備》課件2
- 被迫解除勞動合同通知書電子郵件
- 工具表單-崗位價值評估表(海氏)
- DB33T 2515-2022 公共機構“零碳”管理與評價規范
評論
0/150
提交評論