信息資源組織方法元數(shù)據(jù)方法課件_第1頁
信息資源組織方法元數(shù)據(jù)方法課件_第2頁
信息資源組織方法元數(shù)據(jù)方法課件_第3頁
信息資源組織方法元數(shù)據(jù)方法課件_第4頁
信息資源組織方法元數(shù)據(jù)方法課件_第5頁
已閱讀5頁,還剩193頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第二講信息資源組織方法

第六章元數(shù)據(jù)方法劉煒wliu@北京大學(xué)研究生課程進修班2005上海第二講信息資源組織方法

第六章元數(shù)據(jù)方法劉煒北京大學(xué)1目錄元數(shù)據(jù)一般概念國外元數(shù)據(jù)研究與應(yīng)用的歷史與現(xiàn)狀國內(nèi)元數(shù)據(jù)研究與應(yīng)用的歷史與現(xiàn)狀趨勢與問題DC元數(shù)據(jù)方法北京大學(xué)研究生課程進修班2005上海目錄元數(shù)據(jù)一般概念北京大學(xué)研究生課程進修班20052元數(shù)據(jù)一般概念定義來源作用分類模型思考:元數(shù)據(jù)概念早已有之,為什么現(xiàn)在會非常熱門?固然MARC是一種元數(shù)據(jù)格式,但是它與“現(xiàn)代”元數(shù)據(jù)究竟又什么大的區(qū)別?北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)一般概念定義思考:北京大學(xué)研究生課程進修班2003元數(shù)據(jù)定義“meta”來自古希臘語,意思是更高層次或更基本的概念關(guān)于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata)關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)(structureddataaboutdata)用于描述數(shù)據(jù)的內(nèi)容(what)、覆蓋范圍(where,when)、質(zhì)量、管理方式、數(shù)據(jù)的所有者(who)、數(shù)據(jù)的提供方式(how)等信息的數(shù)據(jù),是數(shù)據(jù)與數(shù)據(jù)用戶之間的橋梁資源的信息(Informationaboutaresource)編目信息(Cataloguinginformation)管理、控制信息(Administrativeinformation)是一組獨立的關(guān)于資源的說明(metadataisasetofindependentassertionsaboutaresource)定義和描述其它數(shù)據(jù)的數(shù)據(jù)(datathatdefinesanddescribesotherdata(ISO/IEC11179-3:2003(E))Metadata在臺灣被譯作“元資料”、“詮釋資料”、“后設(shè)資料”、“文后資料”、“超資料”等多種名稱。北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)定義“meta”來自古希臘語,意思是更高層次或更基本的4來源計算機/數(shù)據(jù)庫領(lǐng)域網(wǎng)絡(luò)信息標(biāo)注/檢索進一步發(fā)展:機器對于語義的理解和處理(語義萬維網(wǎng))北京大學(xué)研究生課程進修班2005上海來源計算機/數(shù)據(jù)庫領(lǐng)域北京大學(xué)研究生課程進修班20055元數(shù)據(jù)的作用元數(shù)據(jù)的主要功能是定位(location)、尋找或發(fā)掘(discovery)、存檔(documentation)、評價(evaluation)與選擇(selection)等五大功能*;其他作用:鏈接與交互關(guān)系的體現(xiàn)(linkageandinteractiverelationshipmanagement)、整合XML、RDF與Z39.50不同協(xié)議的應(yīng)用等;描述、檢索、選擇、定位、管理、評估與交互等功能**。*來自于歐洲D(zhuǎn)ESIRE(DevelopmentofaEuropeanServiceforInformationonResearchandEducation)計劃的元數(shù)據(jù)分析報告**北大數(shù)字圖書館研究所的研究報告北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)的作用元數(shù)據(jù)的主要功能是定位(location)、尋找6Metadatasupportsoperationsonresources….…and

relieves

theuserofhavingtohaveadvanceknowledgeofthecharacteristicsorexistenceoftheresource.KnowwhatresourcesareavailableKnowhowtoplayaresourceKnowprovenanceofaresourceKnowwhatusepolicygovernsaresourceKnowhowtoingestaresourceKnowhowtointeractwitharesourceKnowhowtocompose/decomposeresources…

北京大學(xué)研究生課程進修班2005上海Metadatasupportsoperationso7A‘portal’turnedinsideout…CommonservicesContentservicesApplicationservicesPresentationservicesIneedafewreferencesFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海A‘portal’turnedinsideout…8CommonservicesContentservicesApplicationservicesPresentationservicesauthenticationFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice9CommonservicesContentservicesApplicationservicesPresentationservicesDirectory:userprofileFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice10CommonservicesContentservicesApplicationservicesPresentationservicesQuerybrokerFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice11CommonservicesContentservicesApplicationservicesPresentationservicesDirectory:service/collectiondescriptionFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice12CommonservicesContentservicesApplicationservicesPresentationservicesContent:resultslistFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice13I’dliketogetthisbook.CommonservicesContentservicesApplicationservicesPresentationservicesRequestbrokerFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海I’dliketogetthisbook.Comm14CommonservicesContentservicesApplicationservicesPresentationservicesDirectory:ILLpolicyFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice15CommonservicesContentservicesApplicationservicesPresentationservicesDirectory:service/collectiondescriptionFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice16CommonservicesContentservicesApplicationservicesPresentationservicesContent:circ/ILLsystemFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice17Ineedthisarticletoo.CommonservicesContentservicesApplicationservicesPresentationservicesRequestbrokerFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海Ineedthisarticletoo.Comm18CommonservicesContentservicesApplicationservicesPresentationservicesopenURLresolverFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice19CommonservicesContentservicesApplicationservicesPresentationservicesDirectory:localknowledgebaseFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice20Nearlythere…CommonservicesContentservicesApplicationservicesPresentationservicesDirectory:service/collectiondescriptionFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海Nearlythere…CommonservicesC21CommonservicesContentservicesApplicationservicesPresentationservicesContent:articleFromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海CommonservicesContentservice22Directory:ILLpolicyCommonservicesContentservicesApplicationservicesPresentationservicesAuthenticationDirectory:userprofileQuerybrokerDirectory:service/collectiondescriptionReferencedbRequestbrokerCirc/ILLsystemOpenURLresolverDirectory:localknowledgebaseArticledbMetadataformultipleentitiesrequiredtosupportoperations.Thispicturecouldbeextendedinmultipleways.FromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海Directory:ILLpolicyCommonse23元數(shù)據(jù)大家庭Cultural

heritageMedia

industryWeb/

InternetLibraryInstructional

technologyE-govResearch

communitiesBook

industryEAD,MARCAMC,..MARC,MODS,

DC,RSLP,..Onix,…XML,RDF,OWL,…CSDGM,DDI,NBII,IVOA,…EGMS,AGLS,GILS,…GEM,DC-ED,IEEE-LOM,SCORM,…MPEG,JPEG,TIAA-CREF…****FromslidesbyLorcanDempsey北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)大家庭Cultural

heritageMedia

24元數(shù)據(jù)的分類Assetmetadata–Who,Where&When:Title,Creator,Publisher,Contributor,Date,Type,Format,Identifier,Source,LanguageSubjectmetadata–What&Why:

Subject,Description,CoverageRelationalmetadata–Linksbetweenandto:RelationUsemetadata–Howcanitbeused:Rights&PermissionsEnabledFunctionalityComplexity/documents/dces/MoreefficienteditorialprocessBetternavigation&discovery北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)的分類Assetmetadata–Who,Wh25元數(shù)據(jù)的分類元數(shù)據(jù)類型定義描述型元數(shù)據(jù)內(nèi)容描述描述資源對象內(nèi)容或外觀信息。結(jié)構(gòu)描述描述資源對象各組件的結(jié)構(gòu)信息。管理型元數(shù)據(jù)技術(shù)描述資源對象的技術(shù)要求的元數(shù)據(jù)信息。權(quán)限描述資源對象的權(quán)限管理與合法取用的元數(shù)據(jù)信息。來源描述資源對象的產(chǎn)生、發(fā)展與環(huán)境等方面的元數(shù)據(jù)信息。一般管理用來管理信息資源的元數(shù)據(jù)信息。根據(jù)元數(shù)據(jù)中的元素所描述、揭示的語義來劃分的:北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)的分類元數(shù)據(jù)類型定義描述型內(nèi)容描述描述資源對象內(nèi)容或外26元數(shù)據(jù)分類北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)分類北京大學(xué)研究生課程進修班2005上海27描述性元數(shù)據(jù)的分類描述能力低高北京大學(xué)研究生課程進修班2005上海描述性元數(shù)據(jù)的分類描述能力低高北京大學(xué)研究生課程進修班28國外情況概況項目情況標(biāo)準(zhǔn)化情況研究與應(yīng)用特點值得借鑒之處北京大學(xué)研究生課程進修班2005上海國外情況概況北京大學(xué)研究生課程進修班2005上海29元數(shù)據(jù)標(biāo)準(zhǔn)舉例按元數(shù)據(jù)應(yīng)用的學(xué)科領(lǐng)域,則可以進行如下劃分:傳統(tǒng)圖書期刊,如:MARC等。網(wǎng)絡(luò)資源,如DublinCore、IAFA/WHOIS++Templates、LDIF(LDAPDataInterchangeFormat)、SOIF(SummaryObjectInterchangeFormat)、URCs(UniformResourceCharacteristics/Citations)等。政府信息,如:GILS(GovernmentInformationLocatorService,政府信息定位服務(wù))、DC-Gov(DC-GovernmentApplicationProfile,DC政府應(yīng)用綱要)等。科技文獻,如:ibTEX、EELS(TheEngineeringElectronicLibrary,工程電子圖書館元數(shù)據(jù))、EEVL(TheEdinburghEngineeringVirtualLibrary,愛丁堡虛擬電子圖書館元數(shù)據(jù))、RFC1807等[28]。人文及社會科學(xué)資源,如:TEIHeader、ICPSRSGMLCodebookInitiative等[29]。教育資源:IEEELOM(LearnObjectMedle,學(xué)習(xí)對象模型)、GEM(GEMElementList,GEM元數(shù)據(jù))、DC-Ed(DC-Education元數(shù)據(jù))等。博物館藏品或特藏,如:CDWA(CategoriesfortheDescriptionofWorksofArt,藝術(shù)作品描述目錄)、CIMI(ComputerInterchangeofMuseumInformation)CIMI、VRACore(VisualResourcesAssociationCore,可視資源核心類目)、REACH元素集等。保存型元數(shù)據(jù)方案:CEDARS、NLA、NEDLIB地理空間資源,如:FGDC/CSDGM等手稿檔案保存類,如:EAD等網(wǎng)絡(luò)多媒體及版權(quán)管理:INDECS北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)標(biāo)準(zhǔn)舉例按元數(shù)據(jù)應(yīng)用的學(xué)科領(lǐng)域,則可以進行如下劃分:30簡介1.CDWA(藝術(shù)作品描述目錄)2.CDF(頻道定義格式)3.BibTex(科技文獻書目資源格式)4.CIMI(博物館信息計算機交換標(biāo)準(zhǔn)框架)5.DC(都柏林核心元數(shù)據(jù))6.EAD(編碼文檔描述)7.EELS(工程電子化圖書館)8.EEVL(愛丁堡工程虛擬圖書館)9.FGDC(聯(lián)邦地理數(shù)據(jù)委員會)10.GILS(政府信息定位服務(wù))11.IAFA/WHIOS++Templates(因特網(wǎng)匿名FTP文件庫版式)12.ICPSRSGMLCodebook(政治和社會研究方面的校際聯(lián)盟)13.LDAPDIF(輕便型目錄獲取協(xié)議)14.MARC(機讀目錄格式)15.MCF(元內(nèi)容框架)16.PICA+(荷蘭圖書館自動化中心)17.PICS(網(wǎng)絡(luò)內(nèi)容選擇平臺)18.RDF(資源描述框架)19.RFC(書目記錄格式)20.SGML(通用標(biāo)準(zhǔn)標(biāo)記語言)21.SOIF(概略對象交換格式)22.TELHeader(文本編碼計劃)23.URCs(統(tǒng)一資源特征)24.WarwickFramework(Warwick框架)25.WebCollections(網(wǎng)站集合)北京大學(xué)研究生課程進修班2005上海簡介1.CDWA(藝術(shù)作品描述目錄)13.LDAPDIF(31IFLA推薦方案應(yīng)包含的核心元素?主題Subject?日期Date?使用條件Conditionsofuse?出版者Publisher?資源名Nameassignedtotheresource?語種/表達方式Language/modeofexpression?資源標(biāo)識符Resourceidentifier?資源類型Resourcetype(i.e.,whattheresourceis,ratherthanwhatitisabout)?作者/創(chuàng)建者Author/creator?版本Version見:GuidanceontheStructure,Content,andApplicationofMetadataRecordsforDigitalResourcesandCollections:ReportoftheIFLACataloguingSection

WorkingGroupontheUseofMetadataSchemas(2003Oct27)北京大學(xué)研究生課程進修班2005上海IFLA推薦方案應(yīng)包含的核心元素見:Guidanceon32國內(nèi)情況概況歷史項目與研究應(yīng)用情況趨勢與展望值得關(guān)注的課題圖書館員的角色北京大學(xué)研究生課程進修班2005上海國內(nèi)情況概況北京大學(xué)研究生課程進修班2005上海33國內(nèi)元數(shù)據(jù)研究與應(yīng)用概況國內(nèi)的研究與應(yīng)用:數(shù)字化項目的需要,例如國家圖書館、中山圖書館等;數(shù)字圖書館開發(fā)與建設(shè)的需要,如有關(guān)數(shù)字圖書館項目、國家863項目等;國外元數(shù)據(jù)跟蹤研究和應(yīng)用的成果近來新呈現(xiàn)的特點注重體系化的研究,通過對系統(tǒng)架構(gòu)的研究,建立信息系統(tǒng)模型(生命周期模型、數(shù)據(jù)流模型、應(yīng)用相關(guān)模型等)。注重具體應(yīng)用環(huán)境和實現(xiàn)的研究。注重標(biāo)準(zhǔn)體系的建立(一整套標(biāo)準(zhǔn)規(guī)范和可操作的文檔)。北京大學(xué)研究生課程進修班2005上海國內(nèi)元數(shù)據(jù)研究與應(yīng)用概況國內(nèi)的研究與應(yīng)用:北京大學(xué)研究生課程34歷史1997年“試驗型數(shù)字圖書館”項目OCLC的引介、推動國圖及中山圖書館元數(shù)據(jù)方案北大元數(shù)據(jù)方法論上海圖書館“第一屆國際元數(shù)據(jù)研討會”上圖的元數(shù)據(jù)跟蹤及應(yīng)用北京大學(xué)研究生課程進修班2005上海歷史1997年“試驗型數(shù)字圖書館”項目北京大學(xué)研究生課程進修35國內(nèi)元數(shù)據(jù)項目與應(yīng)用研究情況國家圖書館《中文元數(shù)據(jù)方案》北京大學(xué)圖書館(拓片和敦煌古卷)清華大學(xué)(建筑)中科院文獻情報中心《我國數(shù)字圖書館標(biāo)準(zhǔn)與規(guī)范建設(shè)》項目(CDLS)中山圖書館“數(shù)字式中文全文文獻通用格式”中國可持續(xù)發(fā)展信息共享示范系統(tǒng)*教育信息源數(shù)據(jù)標(biāo)準(zhǔn)**上海圖書館應(yīng)用研究情況*參見:/sdinfo/download.asp**參見:/

全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會教育技術(shù)分技術(shù)委員會發(fā)布的有關(guān)教育信息元數(shù)據(jù)標(biāo)準(zhǔn)北京大學(xué)研究生課程進修班2005上海國內(nèi)元數(shù)據(jù)項目與應(yīng)用研究情況國家圖書館《中文元數(shù)據(jù)方案》*參36國家圖書館國家圖書館(NLCN)于1991年3月成立了文獻數(shù)字化中心,主要從事國家圖書館內(nèi)部文獻的加工生產(chǎn),2000年10月劃入中國數(shù)字圖書館有限責(zé)任公司范圍,承擔(dān)中國數(shù)字圖書館工程中的資源建設(shè)任務(wù),現(xiàn)已經(jīng)為中國數(shù)字圖書館提供中文圖書20萬冊,7000萬頁、縮微膠片200萬拍、金石拓片6000張等數(shù)字資源。另有:甲骨影像及拓片資源庫;西夏文獻數(shù)字資源庫;中文拓片資源庫;國際敦煌項目(敦煌及其他遺址出的十萬余件寫卷,可以在互聯(lián)網(wǎng)上免費獲得高清晰度的數(shù)碼圖像,與之相聯(lián)的有書目,地圖,照片,遺址圖等其他有關(guān)歷史,現(xiàn)狀等信息,使學(xué)者,學(xué)生,平常老百姓能由此深入了解公元一千年絲綢之路上的社會生活狀況)。2002年12月,“國家圖書館二期工程暨國家數(shù)字圖書館工程”項目立項申請書通過國務(wù)院批準(zhǔn),程總投資123,500萬元;基于OAIS參考模型的保存性元數(shù)據(jù)方案“中文元數(shù)據(jù)方案”北京大學(xué)研究生課程進修班2005上海國家圖書館國家圖書館(NLCN)于1991年3月成立了文獻數(shù)37中文元數(shù)據(jù)方案1名稱Title2主題Subject3版本Edition4內(nèi)容摘要Abstract5內(nèi)容類型ContentType6語種Language7內(nèi)容覆蓋范圍Coverage8內(nèi)容創(chuàng)建者Creator9其它責(zé)任者Contributor10內(nèi)容創(chuàng)建日期DateofCreation11出版Publisher12版權(quán)所有者CopyrightHolder13資源標(biāo)識符Identifier14關(guān)聯(lián)資源RelatedObjects15數(shù)字資源制作者DigitalPublisherName16數(shù)字資源制日期DigitalPublisherDate17數(shù)字資源制作地DigitalPublisherPlace18權(quán)限聲明RightsWarning19公開對象Actors20操作許可Actions21原始技術(shù)環(huán)境OriginalTechnicalEnvironments22加工處理歷史IngestProcessHistory23維護歷史AdministrationHistory24認(rèn)證指示符AuthenticationIndicator25基本抽象格式描述UAF-Description北京大學(xué)研究生課程進修班2005上海中文元數(shù)據(jù)方案1名稱Title2主題Subject3版本Ed38中國高校系統(tǒng):以北京大學(xué)為代表基于專門數(shù)字對象的元數(shù)據(jù)標(biāo)準(zhǔn)古籍元數(shù)據(jù)標(biāo)準(zhǔn)(第4版)拓片元數(shù)據(jù)標(biāo)準(zhǔn)(第6版)輿圖元數(shù)據(jù)標(biāo)準(zhǔn)(第1版)學(xué)位論文元數(shù)據(jù)標(biāo)準(zhǔn)(第2版)人物元數(shù)據(jù)標(biāo)準(zhǔn)(第1版)電子圖書元數(shù)據(jù)標(biāo)準(zhǔn)(教學(xué)參考書)(第1版)網(wǎng)絡(luò)資源元數(shù)據(jù)標(biāo)準(zhǔn)(第1版)其它參見示例北京大學(xué)研究生課程進修班2005上海中國高校系統(tǒng):以北京大學(xué)為代表基于專門數(shù)字對象的元數(shù)據(jù)標(biāo)準(zhǔn)參39北京大學(xué)研究生課程進修班2005上海北京大學(xué)研究生課程進修班2005上海40中國科學(xué)院文獻情報中心國家科學(xué)數(shù)字圖書館預(yù)研項目后續(xù)項目:“科技基礎(chǔ)性工作專項資金重點項目《我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)》”北京大學(xué)研究生課程進修班2005上海中國科學(xué)院文獻情報中心國家科學(xué)數(shù)字圖書館預(yù)研項目北京大學(xué)研究41完整的框架體系Works/ObjectsCollectionsofWorks/ObjectsDatabasesofdiscriptionsDigital

ObjectsCollectionsofDigitalObjectsIdentification/NamingMetadataDescriptionsRetrievalMechanismsLocationResolutionStorageandArchivingFormattingOrganizingMechanisms格式化識別與命名元數(shù)據(jù)描述組織機制檢索機制地址解析長期保存注:本頁內(nèi)容來自張曉林教授有關(guān)元數(shù)據(jù)的演示稿北京大學(xué)研究生課程進修班2005上海完整的框架體系Works/CollectionsofDa42基于生命周期的元數(shù)據(jù)開發(fā)應(yīng)用框架互操作機制檢索機制長期保存應(yīng)用領(lǐng)域應(yīng)用目標(biāo)內(nèi)容結(jié)構(gòu)句法結(jié)構(gòu)語義結(jié)構(gòu)編碼語言制作機制組織與存儲北京大學(xué)研究生課程進修班2005上海基于生命周期的元數(shù)據(jù)開發(fā)應(yīng)用框架互操作機制檢索機制長期保存應(yīng)43回目錄中國可持續(xù)發(fā)展信息共享示范系統(tǒng)北京大學(xué)研究生課程進修班2005上海回目錄中國可持續(xù)發(fā)展信息共享示范系統(tǒng)北京大學(xué)研究生課程進修班44基礎(chǔ)教育教學(xué)資源元數(shù)據(jù)規(guī)范編入《教育信息化技術(shù)標(biāo)準(zhǔn)》CELTS-42;與IEEELOM和IMS相一致;與DC聯(lián)系密切(以DC為核心)體系完整,元數(shù)據(jù)方面已包括三個規(guī)范:CELTS-3.1(CD1.6)學(xué)習(xí)對象元數(shù)據(jù)2002-09-05CELTS-3.3(CD1.6)學(xué)習(xí)對象元數(shù)據(jù)實踐指南2003-01-07CELTS-3.4(WD1.0)學(xué)習(xí)對象元數(shù)據(jù)測試規(guī)范2003-01-07建立了運作機制和認(rèn)證體系參見示例北京大學(xué)研究生課程進修班2005上海基礎(chǔ)教育教學(xué)資源元數(shù)據(jù)規(guī)范編入《教育信息化技術(shù)標(biāo)準(zhǔn)》CELT45上海圖書館上海圖書館于1997年啟動了古籍?dāng)?shù)字化項目(數(shù)字化數(shù)量共計3223種一、二級藏品130萬頁)。,1998年開始進行歷史文獻和特色館藏的搶救性整理和數(shù)字化工作。1999年是上海圖書館進行大規(guī)模數(shù)字化的一年,這一年一共進行了7個數(shù)字化項目。上海數(shù)字圖書館是一個綜合了七個資源庫的網(wǎng)上圖書館,擁有數(shù)據(jù)近200GB,主要是掃描的影像數(shù)據(jù)。系統(tǒng)采用IBMDigitalLibraryversion2.4作為主要開發(fā)工具應(yīng)用平臺。元數(shù)據(jù)方案采用以DCMES作為核心集、多種元數(shù)據(jù)方案并存的“元數(shù)據(jù)應(yīng)用綱要”形式,以基于XML的RDF為基礎(chǔ)的編碼方式封裝在一起,保證了原始素材內(nèi)容管理中元數(shù)據(jù)的完整性與互操作能力。目前正在修改完善一整套元數(shù)據(jù)規(guī)范、方案和方法。上圖德元數(shù)據(jù)規(guī)范和方法正在應(yīng)用于上海圖書館正在建設(shè)的古籍?dāng)?shù)字圖書館、拓片資源的數(shù)字化、家譜數(shù)字圖書館、名人手稿數(shù)字圖書館等。北京大學(xué)研究生課程進修班2005上海上海圖書館上海圖書館于1997年啟動了古籍?dāng)?shù)字化項目(數(shù)字化46元數(shù)據(jù)實踐北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)實踐北京大學(xué)研究生課程進修班2005上海47值得關(guān)注的課題流程與方法模型幾個重點和趨勢:元數(shù)據(jù)注冊體系應(yīng)用方案(AP)的概念和形式化保存性元數(shù)據(jù)權(quán)限管理元數(shù)據(jù)北京大學(xué)研究生課程進修班2005上海值得關(guān)注的課題流程與方法北京大學(xué)研究生課程進修班20048上圖元數(shù)據(jù)方案設(shè)計流程建立模型詳細列出相關(guān)實體,標(biāo)明其相互之間的關(guān)系。資源分析分析應(yīng)用領(lǐng)域資源特點和文獻利用方式屬性提取內(nèi)容專家從資源利用的角度提出屬性要求文獻調(diào)研元數(shù)據(jù)專家從現(xiàn)有標(biāo)準(zhǔn)和相關(guān)項目中獲得參考元素精煉分析應(yīng)用領(lǐng)域資源特點和文獻利用方式限定規(guī)則規(guī)定屬性限定原則(子字段,修飾詞和編碼)規(guī)范控制考察需要進行規(guī)范控制的屬性,制定辦法著錄規(guī)則制定詳細的著錄規(guī)則,指導(dǎo)數(shù)據(jù)加工置標(biāo)方案通常選擇XML/RDF或單純XML置標(biāo)檢索要求提出元素對應(yīng)屬性字段的具體檢索要求系統(tǒng)需求元數(shù)據(jù)需求作為應(yīng)用系統(tǒng)需求的一個部分驗收要求元數(shù)據(jù)部分在系統(tǒng)中所要達到的功能未來擴展預(yù)留未來發(fā)展的可能性,即可擴展性元數(shù)據(jù)方案設(shè)計流程圖示北京大學(xué)研究生課程進修班2005上海上圖元數(shù)據(jù)方案設(shè)計流程建立模型詳細列出相關(guān)實體,標(biāo)明其相互之49圖書館員的角色領(lǐng)域內(nèi)容專家/信息組織專家/計算機專家三位一體;技術(shù)與應(yīng)用的橋梁;完善知識體系結(jié)構(gòu)——構(gòu)建元數(shù)據(jù)方案和知識本體北京大學(xué)研究生課程進修班2005上海圖書館員的角色領(lǐng)域內(nèi)容專家/信息組織專家/計算機專家三位一體50元數(shù)據(jù)模型RDF數(shù)據(jù)模型(及Warwick框架)OAIS參考模型FRBR功能/生命周期模型DCMI抽象模型(DCMI元數(shù)據(jù)方案抽象模型)數(shù)字圖書館體系結(jié)構(gòu)模型北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)模型RDF數(shù)據(jù)模型(及Warwick框架)北京大學(xué)研究51元數(shù)據(jù)模型:三位一體在語義、結(jié)構(gòu)和句法三方面分別達成一致語義通過屬性元素(部分通過編碼/置標(biāo)方式)表達結(jié)構(gòu)語義的抽象載體,通過框架/容器來表達,要求做到人類與機器均可讀句法/語法具體的置標(biāo)/編碼方案(如XML/METS/MODS/RDF/XMLS/RDFS/OWL等),傳達語義和結(jié)構(gòu)北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)模型:三位一體在語義、結(jié)構(gòu)和句法三方面分別達成一致北京52FRBR模型FunctionalRequirementsforBibliographicRecords北京大學(xué)研究生課程進修班2005上海FRBR模型FunctionalRequirements53元數(shù)據(jù)生命周期北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)生命周期北京大學(xué)研究生課程進修班2005上海54數(shù)字圖書館體系結(jié)構(gòu)模型資源創(chuàng)建者數(shù)字對象數(shù)據(jù)句柄倉儲RAP(倉儲存取協(xié)議)句柄服務(wù)器創(chuàng)建包含由句柄系統(tǒng)創(chuàng)建包含在被存取句柄注冊于北京大學(xué)研究生課程進修班2005上海數(shù)字圖書館體系結(jié)構(gòu)模型資源創(chuàng)建者數(shù)字對象數(shù)據(jù)句柄倉儲RAP(55元數(shù)據(jù)與數(shù)字圖書館元數(shù)據(jù)決定了數(shù)字圖書館的體系結(jié)構(gòu),主要解決兩個問題:定義數(shù)字圖書館中數(shù)字對象的信息結(jié)構(gòu)定義由數(shù)字對象構(gòu)成的資源庫的組織結(jié)構(gòu)數(shù)字對象是數(shù)字圖書館中存儲信息的基本邏輯單位,它進一步?jīng)Q定著的信息組織處理和利用方式、資源庫的組織結(jié)構(gòu),提供了統(tǒng)一的互操作。元數(shù)據(jù)方案是數(shù)字圖書館建設(shè)的重要組成部分,體現(xiàn)在數(shù)字圖書館開發(fā)的各個環(huán)節(jié)中存儲檢索發(fā)布管理北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)與數(shù)字圖書館元數(shù)據(jù)決定了數(shù)字圖書館的體系結(jié)構(gòu),主要解決56DC元數(shù)據(jù)北京大學(xué)研究生課程進修班2005上海DC元數(shù)據(jù)北京大學(xué)研究生課程進修班2005上海57DCMI

(DublinCoreMetadataInitiativeDublinCoreMetadataInitiative(DCMI)AnorganizationdedicatedtofosteringthewidespreadadoptionofinteroperablemetadatastandardsandpromotingthedevelopmentofspecializedmetadatavocabulariesfordescribingresourcestoenablemoreintelligentresourcediscoverysystemsMissionMakeiteasiertofindresourcesusingtheInternetthroughthefollowingactivities:DevelopingmetadatastandardsfordiscoveryacrossdomainsDefiningframeworksfortheinteroperationofmetadatasetsFacilitatingthedevelopmentofcommunity-ordisciplinary-specificmetadatasetsthatareconsistentwithitems1and2北京大學(xué)研究生課程進修班2005上海DCMI

(DublinCoreMetadataIni58DublinCoreMetadataElementSetDublinCoreMetadataElementSet(DCMES)Asetof15descriptivesemanticdefinitionsAcoresetofelementsthatcouldbesharedacrossdisciplinesorwithinanytypeoforganizationneedingtoorganizeandclassifyinformationThreeformallyendorsedversionstheDublinCoreMetadataElementSet,version1.1:ISOStandard15836-2003(February2003)NISOStandardZ39.85-2001(September2001)CENWorkshopAgreementCWA13874(March2000)InternetRFC2413(September1998):firstpublishedversionoftheDublinCore;supersededbytheabovethreestandards北京大學(xué)研究生課程進修班2005上海DublinCoreMetadataElementS59DesigngoalsforDCMESSimplicityofcreationandmaintenanceDefineasmallandsimplemetadataelementsettoallowanon-specialisttocreatesimpledescriptiverecordsforinformationresourceseasilyandinexpensivelywhileprovidingforeffectiveretrievalofthoseresourcesinthenetworkedenvironment.CommonlyunderstoodsemanticsProvideacommonsetofelements,thesemanticsofwhichareuniversallyunderstoodandsupported.InternationalscopeInvolverepresentativesfromvirtuallyeverycontinenttoensurethedevelopmentofthestandardconsidersthemultilingualandmulticulturalnatureoftheelectronicinformationuniverse.ExtensibilityProvidemechanismsforextendingtheDCelementsetforadditionalresourcediscoveryneeds.北京大學(xué)研究生課程進修班2005上海DesigngoalsforDCMESSimplici60The15elementsType(ResourceType)Format(Format)

Identifier(ResourceIdentifier)

Source(Source)Language(Language)

Relation(Relation)

Coverage(Coverage)

Rights(RightsManagement)Title(Title):Creator(Creator)Subject(SubjectandKeywords)

Description(Description):Publisher(Publisher)

Contributor(Contributor)

Date(Date)Allelementsareoptionalandrepeatable北京大學(xué)研究生課程進修班2005上海The15elementsType(Resource61ThreecomponentsformetadataElements&SemanticsDefinitionsforthecontentoftheelements,e.g.,whatisatitle,creator,etc.FocusofDCMESContentRules–

Guidelinesanddirectionforinputtingthecontent,e.g.,whattocapitalize,orderofelements,etc.DCMESguidelinesavailableSyntaxRulesforstructuringandexpressingtheelementsformachineprocessingDCMESissyntaxindependent北京大學(xué)研究生課程進修班2005上海ThreecomponentsformetadataE62ElementnameandsemanticsElementName:TitleLabel:TitleSemantics:Anamegiventotheresource.Comment:Typically,Titlewillbeanamebywhichtheresourceisformallyknown.ElementName:CreatorLabel:CreatorSemantics:Anentityprimarilyresponsibleformakingthecontentoftheresource.Comment:ExamplesofCreatorincludeaperson,anorganization,oraservice.Typically,thenameofaCreatorshouldbeusedtoindicatetheentity.北京大學(xué)研究生課程進修班2005上海ElementnameandsemanticsElem63DCqualifiersToextendandrefinethe15elementsTwocategoriesofqualifiers:ElementRefinement–Thesequalifiersmakethemeaningofanelementnarrowerormorespecific.Arefinedelementsharesthemeaningoftheunqualifiedelement,butwithamorerestrictedscope.EncodingScheme–Thesequalifiersidentifyschemesthataidintheinterpretationofanelementvalue.Theseschemesincludecontrolledvocabulariesandformalnotationsorparsingrules.北京大學(xué)研究生課程進修班2005上海DCqualifiersToextendandref64DCMITermsAuthoritativespecificationofallmetadatatermsrelatedtoDC,includingelements,elementrefinements,encodingschemes,vocabularytermsMaintainedbytheDCUsageBoardContainedintheDCMIMetadataRegistryDCElementElementRefinementsElementEncodingSchemesDateDateCreated

Valid

Available

Issued

Modified

DateCopyrighted

DateSubmittedDCMIPeriod

W3C-DTF北京大學(xué)研究生課程進修班2005上海DCMITermsAuthoritativespecif65SyntaxDCMIavoidedthesyntaxwarsButinteroperability?NowprovidesspecificationsforencodingDCsimpleandDCqualifiedin:HTML<meta>elementsXMLaccordingtoDCMESXMLschemasRDFaccordingtoDCMESRDFschemas北京大學(xué)研究生課程進修班2005上海SyntaxDCMIavoidedthesyntax66ApplicationprofilesConsistofdataelementsdrawnfromoneormorenamespaceschemascombinedtogetherbyimplementorsandoptimisedforaparticularlocalapplication.ApplicationprofilesareusefulastheyallowtheimplementortodeclarehowtheyareusingstandardschemasCharacteristics:MaydrawononeormoreexistingnamespacesIntroducenonewdataelementsMayspecifypermittedschemesandvaluesCanrefinestandarddefinitionsApplicationprofilesenableimplementors“toshareinformationabouttheirschemasinordertointer-workwithwidergroupings….Communitiescanstarttoalignpracticeanddevelopcommonapproachesbysharingtheirapplicationprofiles.”FromHeeryandPatel,2000北京大學(xué)研究生課程進修班2005上海ApplicationprofilesConsistof67ImplementationsandapplicationsGatewaytoEducationalMaterialsimprovetheorganizationandaccessibilityofcollectionsofeducationalmaterialsMonticelloElectronicLibrary/preservation/preservation_templ.cfm?doc_id=1062DCusedtoprovidesemanticinteroperabilitybetweenseveraldatabasesofelectronicmediaandrecordtypes.uk.ukFirstentrypointtoUKpublicsectorinformationontheinternet,usestheDublinCoreRDFvocabularytodescribeeachoftheresourcesavailableonthesiteEnvironmentAustralia.au/UtilizesDCforitsWebmetadataandinternalsearches北京大學(xué)研究生課程進修班2005上海Implementationsandapplicatio68ImplementationsandapplicationsLibraryApplicationProfile/documents/2002/09/24/library-application-profile/ClarifiestheuseofDCinlibrariesandlibrary-relatedapplicationsandprojectsOpenArchivesInitiativeProtocolforMetadataHarvesting/UsesDCsimpleforexposingmetadataforharvestingSearchandRetrieveWebService

/srwAnXML-basedprotocolthatusesDCasoneoftheXMLschemastotransferinformationfromdatabasetoclient北京大學(xué)研究生課程進修班2005上海Implementationsandapplicatio69MetadatapackagesandMETSMetadataEncodingandTransmissionStandard(METS)Adigitallibrarystandardforencodingdescriptive,administrative,andstructuralmetadataExpressedusingtheXMLschemalanguage

DublinCoreisnotintendedtodisplaceanyothermetadatastandard.Ratheritisintendedtoco-exist—ofteninthesameresourcedescription—withmetadatastandardsthatofferothersemantics.Itisfullyexpectedthatdescriptiverecordswillcontainamixofelementsdrawnfromvariousmetadatastandards,bothsimpleandcomplex.fromANSI/NISOZ39.85北京大學(xué)研究生課程進修班2005上海MetadatapackagesandMETSMeta70METSstructureMETSHeader:ContainsmetadatadescribingtheMETSdocumentitselfDescriptiveMetadata:MaypointtodescriptivemetadataexternaltotheMETSdocumentorcontaininternallyembeddeddescriptivemetadata,orboth.AdministrativeMetadata:Providesinformationregardinghowthefileswerecreatedandstored,intellectualpropertyrights,etc.FileSection:Listsallfilescontainingcontentwhichcomprisetheelectronicversionsofthedigitalobject.

StructuralMap:Outlinesahierarchicalstructureforthedigitallibraryobject,andlinkstheelementsofthatstructuretocontentfilesandmetadatathatpertaintoeachelement.StructuralLinks:RecordstheexistenceofhyperlinksbetweennodesinthehierarchyoutlinedintheStructuralMap.Behavior:AbehaviorsectioncanbeusedtoassociateexecutablebehaviorswithcontentintheMETSobject北京大學(xué)研究生課程進修班2005上海METSstructureMETSHeader:Con71DC&AdminMDinMETSdocument<dmdSecID="dmd002">

<mdWrapMIMETYPE="text/xml"

MDTYPE="DC"LABEL="DublinCoreMetadata"><xmlData>

<dc:title>Alice'sAdventuresinWonderland</dc:title>

<dc:creator>LewisCarroll</dc:creator>

<dc:date>between1872and1890</dc:date><dc:publisher>McCloughlinBrothers</dc:publisher>

<dc:type>text</dc:type>

</xmlData></mdWrap>

</dmdSec><techMDID="AMD001"><mdWrapMIMETYPE="text/xml"

MDTYPE="NISOIMG"LABEL="NISOImg.Data">

<xmlData><niso:MIMEtype>image/tiff</niso:MIMEtype><niso:Compression>LZW</niso:Compression><niso:ScanningAgency>NYUPress</niso:ScanningAgency></xmlData></mdWrap></techMD>北京大學(xué)研究生課程進修班2005上海DC&AdminMDinMETSdocument72SummaryMetadataiscriticalfor:ResourcedescriptionResourcediscoveryManagementofinformationresourcesDCMIprovidesinternationalforumforidentifyingproblems,developingunderstanding,andproposingsolutions.DCMESprovidesmetadatasolutionsForsimpleresourcedescriptionthatcanbeextendedforricherresourcerepresentationsForinteroperabilityofmetadatathroughasystemofcommonsemanticsandprescribedsyntaxesForexpressingqueriesusingcommonsearchconceptsacrossdomains北京大學(xué)研究生課程進修班2005上海SummaryMetadataiscriticalfo73ReferencesDublinCoreMetadataInitiativeANSI/NISOZ39.85-2001:TheDublinCoreMetadataElementSet/standards/resources/Z39-85.pdfDCMIFrequentlyAskedQuestions/resources/faq/UsingDublinCore(D.Hillmann)/documents/usageguide/

DCMISchemas(XMLandRDF)/schemas/ApplicationProfiles:MixingandMatchingMetadataSchemas

(R.HeeryandM.Patel)http://www.ariadne.ac.uk/issue25/app-profiles/DublinCoreProjects/projects/北京大學(xué)研究生課程進修班2005上海ReferencesDublinCoreMetadata74DCMetadataAbstractModel

DC元數(shù)據(jù)抽象模型元數(shù)據(jù)方案設(shè)計原則完整的元數(shù)據(jù)方案組成什么是DC元數(shù)據(jù)抽象模型?為什么要有這個抽象模型?DC元數(shù)據(jù)抽象模型包含哪些內(nèi)容?如何應(yīng)用該抽象模型?北京大學(xué)研究生課程進修班2005上海DCMetadataAbstractModel

DC元75名人手稿元數(shù)據(jù)方案的設(shè)計-通用原則簡單性與適用性原則專指度與通用性原則互操作性與易轉(zhuǎn)換性原則靈活性與可擴展性原則用戶需求原則遵循現(xiàn)有標(biāo)準(zhǔn)原則北京大學(xué)研究生課程進修班2005上海名人手稿元數(shù)據(jù)方案的設(shè)計-通用原則簡單性與適用性原則北京大學(xué)76名人手稿元數(shù)據(jù)方案的設(shè)計-具體原則資源分析原則擴展原則包括元素擴展原則和修飾限定原則元素定義原則置標(biāo)原則系統(tǒng)實現(xiàn)和其他應(yīng)用原則北京大學(xué)研究生課程進修班2005上海名人手稿元數(shù)據(jù)方案的設(shè)計-具體原則資源分析原則北京大學(xué)研究生77元數(shù)據(jù)完整體系設(shè)計(數(shù)字化項目)資源對象的描述方案;管理元數(shù)據(jù)方案;元數(shù)據(jù)置標(biāo)方案;資源集合元數(shù)據(jù)方案;元數(shù)據(jù)體系映射方案;資源的著錄方案;技術(shù)實現(xiàn)方案。

上海圖書館名人手稿元數(shù)據(jù)方案的設(shè)計可詳見2004年第4期的《圖書館雜志》或上海圖書館“數(shù)字圖書館研究資源網(wǎng)站”2004年的研究報告北京大學(xué)研究生課程進修班2005上海元數(shù)據(jù)完整體系設(shè)計(數(shù)字化項目)資源對象的描述方案;北京大學(xué)78DC元數(shù)據(jù)的描述對象:資源的抽象模型每個資源(resource)具有零個或多個屬性(properties);每個屬性(property)具有一個或多個值(values);每個值(value)本身是一個資源(resource)(即:用來描述資源,與屬性相關(guān)的物理或概念實體。);每個資源(resource)可以是一個或多個類(classes)中的成員;(注:作為屬性值的資源所在的類(class)常被稱為編碼體系詞表(vocabularyencodingscheme));每個屬性(property)和類(class)均具有其被聲明的語義;每個類(class)通過限定(子類)關(guān)系與一個或多個其它類相關(guān)(當(dāng)兩個類共享部分語義(semantics)時,所有屬于子類(sub-class)的資源(resource)同時也是另一個相關(guān)類(class)的成員;每個屬性只能與一個其它屬性通過限定關(guān)系(子屬性)相關(guān)(當(dāng)兩種屬性共享部分語義時,子屬性的的有效值也就是相關(guān)屬性的有效值)。北京大學(xué)研究生課程進修班2005上海DC元數(shù)據(jù)的描述對象:資源的抽象模型每個資源(resour79DC元數(shù)據(jù)描述的抽象模型一個條描述(description)是由一個或多個陳述(statements)(該陳述僅與一個且唯一一個資源有關(guān)),以及零個或一個資源的URI組成(URI用來標(biāo)識所描述的資源);每個陳述由一個屬性URI(這里的URI用于標(biāo)識一個屬性),零個或一個值URI(這里的URI用于標(biāo)識屬性的值),零個或一個編碼體系URI(這里的URI標(biāo)識值的類),零個或多個值的表述(representations)組成;每個屬性都是被描述資源的一項特性;每個屬性URI可以在多個陳述中重復(fù);值的表述(valuerepresentation)可以是字串值(valuestring)、復(fù)合值(richvalue)或相關(guān)描述(relateddescription)等形式;每個字串值都是一個簡單的、人類可讀的字符串,用以表示屬性的值;每個字串值可以有相應(yīng)的編碼體系URI(encodingschemeURI),用來標(biāo)識一個語法編碼體系;每個字串值可以有相應(yīng)的字串語種(valuestringlanguage),它是一個ISO語種標(biāo)記(例如,en-GB);每個復(fù)合值(richvalue)是一些標(biāo)記文本、圖像、視頻、音頻等,或者它們的組合,表示作為屬性值的資源;每條相關(guān)資源描述都是一個用來描述屬性值的資源。北京大學(xué)研究生課程進修班2005上海DC元數(shù)據(jù)描述的抽象模型一個條描述(description)80補充說明:DC元數(shù)據(jù)描述的抽象模型一條“相關(guān)描述”描述一個相關(guān)的資源,因此并非是“描述”的一部分,例如,當(dāng)一個人是所描述資源的創(chuàng)建者時,一條相關(guān)描述可以提供關(guān)于這個“人”的元數(shù)據(jù)。在某些語境(Context)中,語法編碼體系也可以認(rèn)為是某種“數(shù)據(jù)類型”在DCMI元數(shù)據(jù)描述中,所描述資源的類通常由DC類型屬性的值來描述。北京大學(xué)研究生課程進修班2005上海補充說明:DC元數(shù)據(jù)描述的抽象模型一條“相關(guān)描

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論