美國數字圖書館發展現況.ppt_第1頁
美國數字圖書館發展現況.ppt_第2頁
美國數字圖書館發展現況.ppt_第3頁
美國數字圖書館發展現況.ppt_第4頁
美國數字圖書館發展現況.ppt_第5頁
已閱讀5頁,還剩63頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、美國數字圖書館發展現況以及元數據方面的問題,2004年12月 復旦大學,NSF Post Digital Library Futures Workshop 國家自然科學基金會(NSF) 后數字圖書館未來研討班, 2003,6月 麻省,/%7Edlwkshop/JISC/NSFreport.pdf/%7Edlwkshop/JISC/NSFreport.pdf/,總結報告:,加拿大數字圖書館的未來開拓研討班 2004年3月,溫哥華,The Future of Digital Libraries in Canad

2、a Exploratory Workshop 探討在數字化環境中和個人及團體跨學科合作中分享知識的模式 加拿大國內外最新發展和最高成績 為加拿大以及其它大型項目(如美國國家科學數字圖書館)的合作播下種子 鑒定聚焦在國家研究項目上的興趣的可能性, 并可能撰寫這樣一個研究課題表, 在此基礎上準備一份提交給加拿大政府的優秀中心網絡項目的課題申請報告 http:/www.ece.ubc.ca/leei/fdlc/index.php,網絡信息建設方面的幾大工程,數字圖書館工程 DLI-1 (1994-1998 數字圖書館第一期工程) 2400多萬美元、六所大學及其工業合作伙伴, 面向技術、以試驗為目的

3、DLI-2 (1999 - 數字圖書館第二期工程) 投資翻倍,面向用戶、全方位發展、以實用為目的縮小技術研究注意力 國家科學教育數字圖書館 (NSDL) 電子政府工程 文本檢索會議(TREC),DLI2的研究空間 (1),1. 以人為中心的研究 試圖進一步了解數字圖書館在增強人類在創造、尋求、使用信息方面的活動中的影響和潛力,并促進為這些活動設計的技術的研究。 引導更廣泛范圍的信息發掘、查詢、檢索、操作、表達的能力的方法、算法、軟件, 智能用戶界面, 合作技術與工具, 用戶和可使用性研究,包括人-機交互、以人為中介的交流、 有特殊需求的用戶和機構, 在教育、學習、能力建設方面的使用,特別是新的

4、和生手很多的用戶群體, 與經濟和社會相關的問題。,2. 以內容和收藏為基礎的研究 注重于更好理解并完善獲取新的電子內容和收藏的途徑,鼓勵跨學科研究,鼓勵所有學科領域的參與。 有效的數據捕獲、呈現、保存、和存檔, 元數據, 內容與收藏的相互合作能力, 特定領域的信息物體, 強調與生產和使用數字收藏有關的社會經濟法律問題的技術、方法、過程, 對應與新電子媒體的新的經濟與商務模型, 教育資料的發展及獲取途徑。,DLI2的研究空間 (2),3. 以系統為中心的研究 注重于技術的部件與整合,因為社會環境是千變萬化的、靈活的。這方面的成果應能在個人、團體、機構等各種層次上起作用,能夠將龐大的、不定型的、不

5、斷增長的數據體改成用戶定義的結構和規模。 適應與信息環境的開放式的網絡化的結構,能支持復雜的信息途徑和信息分析以及合作工作方式, 智能代理商軟件, 可互相合作能力, 與數字圖書館有關的網絡、通訊、中間軟件研究, 高級多媒體信息捕獲、呈現、數字化, 系統評價和表現研究。,DLI2的研究空間 (3),DLI-2項目涉及許多領域和學科,考古,生物學, 文學經典, 計算機科學,經濟,英語,藝術,地理,地質學,政府, 電子工程,環境科學,歷史,信息管理,信息科學,語言技術,圖書館情報學,語言學,管理信息系統,醫學情報學,政治學,心理學,宗教研究,機器人,社會學,西班牙語,課堂教育等。,DLI-2項目涉及

6、的內容形式多樣,書目記錄,工程教育物件, 電子印刷物,民間文學,地理參考信息,健康數據,古典文學經典,圖書館咨詢服務,醫療圖像,混合媒體,病人材料,樂譜,骨骼,模擬,社會科學數據,演講,錄相,萬維網,X-射線CT掃描數據等。,DLI-2項目涉及多種技術,三維模型,途徑控制,代理人軟件,存檔/文件保存,視聽檢索,分類與聚類,數據途徑服務技術,數字錄相,經濟模型,電子筆記,聯邦結構,地理信息系統,圖像,信息過濾,信息圖示化,學習環境,聯接,追蹤數據分析,移動計算,多媒體融合,自然語言處理,光學圖像識別,并行處理,協議,個人化,起源,手稿再使用,演說文件處理,自動總結,文本分析,錄相編輯等。,技術t

7、echnologies,內容 contents,用戶群體communities,服務services,十年進展狀況,從數字圖書館研究空間看,技術和內容方面的發展十年中占主導地位。Image adopted from Gary Marchioninis presentation, 03/2004 UBC,技術technologies,內容 contents,用戶群體communities,服務services,文化遺產 (如美國國家、州、縣、區、市的 記憶 (memories) 數字圖書館和數字館藏) 大中小學教育數字圖書館和大型投放庫 (repository) 科技領域特殊數據的數字圖書館,從

8、存儲到檢索,可視化,用戶操縱的多界面 使用記錄和用戶檔案的自動生成和管理 產權保護的技術方法 大規模集成和轉換等,面向教學 殘疾人服務 合作空間等,高科技用戶 政府部門 數字圖書館研究群體 教育群體,十年進展狀況,美國數字圖書館主要項目,針對美國本土文化財富的項目 如美國國家、州、縣、區、市的 記憶 (memories) 數字圖書館和數字館藏 特殊媒體歷史材料數字圖書館項目 針對教育的數字圖書館項目 大中小學教育數字圖書館 大型投放庫 (repository) 圍繞大學教學建立的服務設施和工具 科技領域特殊數據的數字圖書館,美國記憶 (國家數字圖書館歷史館藏)-100多個數字館藏參與,聯合目錄

9、查找 American Memory /ammem/collections/finder.html,美國俄亥俄州歷史數字館藏 “俄亥俄記憶” Ohio Memory /,美國 俄亥俄州 沃興屯市歷史數字館藏 Worthington Memory /,哈佛福大學法學院圖書館的紐倫堡庭審項目數字文獻館藏 The Nuremberg Trials collection ,Word Spott

10、ing: Indexing Handwritten Manuscripts /trath/prj/hw_retr/demo_intro.html (手稿檢索數字圖書館項目),歷史之聲 Historical Voices /,面向教育的數字圖書館項目,獨立的數字圖書館 例:Perseus 人文科學數字圖書館 碩士博士學位論文數字圖書館 綜合了100多個項目成果的數字圖書館和元數據投放庫 國家科學數字圖書館 (NSDL) 在已建數字圖書館基礎上建成的數字化學習環境 加州大學圣芭芭拉分校 亞歷山

11、大數字地球模型系統 (ADEPT)數字化的學習環境 (DLE),Perseus 人文科學數字圖書館 9million pages/month A Digital Library for the Humanities /,瀏覽經典,電子館藏包括: 經典 古代寫在紙莎草紙上的文稿 文藝復新 倫敦 加州 上中西部 莎士比亞 波義耳作品 Tufts歷史,語言統計,地圖,年代,同樣數據,多種看的方法,多種探索開發的方向,經典文獻的地域分布圖,波義耳作品的時間分布圖(1),碩士博士學位論文圖書館,從計算機科學開始,組建推廣到其它學科和國家 學生學會出版

12、 自己的成果 上交時必須填寫元數據記錄 (現在很多學術會議錄也要求這樣) 作者和讀者/用人者的更好接觸 由用戶團體參與、不斷擴充資源的數字圖書館,成功的可持續模式,National SMETE Digital Library,Science Mathematics Engineering Education Technology,科學、數學、工程、技術教育,國家科學數字圖書館 NSDL,科學教育數字圖書館(NSDL)的研究空間,收藏 collections 服務設施 services 特殊問題研究 Targeted research 專業化的路徑 Pathways 一體化核心 Core Int

13、egration 這是與各個國家(包括美國)DL項目不同之處,是綜合的關鍵。,至2004年6月: 共165項目,建起的數字館藏達 118,綜合是當前的關鍵步驟,單個數字圖書館館藏或技術服務可以做到小而全,不成問題,也不影響太大。 問題在于: 怎樣把若干個分散的資源綜合起來,有機的形成一個大的數字圖書館 怎樣能讓資源和數據(包括元數據)能被重復使用 怎樣做到在綜合起來的數字圖書館中原來的語義依然清楚,不失去意義,NSDL中側重于建立數字化資源的相+ 側重于服務機制和手段的項目,至2004年6月: 共165項目,建起的數字館藏達 118,,NSDL 數字館藏一覽,http:

14、/,地理學科:,數學:,NSDL 一體化核心項目,NSDL信息結構,nsdl,查尋:,元數據記錄:,將數字圖書館用于數字環境下的教學,實例: 加州大學圣芭芭拉分校 亞歷山大數字地球模型系統 (ADEPT - Alexandria Digital Earth Prototype)) 數字化的學習環境 Digital Learning Environment (DLE),ADEPT 項目的數字館藏:,1. 學習物件(LO)館藏,2000多件,全部做了詳細的元數據記錄 (屬于著名的亞歷山大數字圖書館) 2. 科學概念知識庫 (KB),現有1200余個概念,每個根據概念的特征和

15、關系理論模型作入知識庫 3. 教學材料館藏,根據每堂課要講的概念準備的講義,1. 學習物件館藏 Collections of learning objects (LO), over 2000 items,2. 科學概念知識庫 Knowledge bases (KB) containing collections of SSM of relevant scientific concepts; (about 1200 concepts),SSM for Scientific Concepts (1),SSM for Scientific Concepts (2),SSM for Scientifi

16、c Concepts (3),3. 教學材料館藏 Collections of instructional materials organized by concepts,左邊是本堂課的總的大綱 (結構) 右邊是課程內容 ADL 本身的通用像標顯示符將概念連接到概念屬性顯示窗。其它顯示符連接到物件窗。,將這三種數字館藏應用到學習環境中,所用和不斷生產的館藏 科學概念知識庫(KBs) 結構化的教學材料館藏 學習物件(LO)館藏,做有詳細的ADN元數據記錄 +概念標引,為此建造的服務設施 概念 網上概念輸入和編輯工具 圖示和文字式顯示工具 教學材料 網上講義編制工具 “概念形象化”圖示工具“Con

17、ceptualization” 學習物件 元數據輸入工具,Introductory Physical Geography (F2002, S2003),數字化學習環境的課堂 (1),知識窗 Knowledge window :顯示概念和相關關系,課程講義窗Lecture window:講義、實驗、或自習材料的顯示,學習物件窗 Collection window:顯示數字圖書館的具體物件(圖像、地圖、文字、動畫、錄像等),數字化學習環境的課堂(2),知識窗Knowledge window,講義窗 Lecture window,學習物件窗 Collection window,課堂講義的模式,對科學

18、現象的辨識: 主要題目,分題目,子題目等 觀察過程 實例 對科學現象的表達: 事實 概念 理論,對科學現象的理解: 提問 回答 問題 解決方法 假設 評價 陳述 衍生 預言 測試 看法,對科學現象的辨識表達理解,課程講義窗 Lecture window,物件(館藏)窗:學習物件 Collection Window: Learning Objects,知識窗 Knowledge window 根據概念來看所學內容,坐井觀天:我看NSDL的經驗教訓,NSDL搜集元數據記錄已有2.5年 網站從2002年12月起正式運行 是不是只是“又一個網站”? 用戶在哪里? 會不會像VASA那樣

19、翻船?17世紀瑞典船,建造8年,下水后很快就沉了 哪些問題? 技術、館藏資源、新的服務設施都不成問題 元數據方面的問題 互操作方面的問題 可持續性問題,Evolution of the Men,元數據方面的問題,元數據 傳統的圖書館編目,元數據標準太多,沒有哪個能完全滿足特定DL需要 投放庫 (repository) 沒有整套標準 各家自有一套,照搬的或有修改的 目前按簡單的都柏林核心元素集來整合 失去很多細節 由于DC不反映所用schemes, 集中起來后的元數據失去上下文 已有些理論上很吸引人的模型,但難以在實踐中應用推廣(如METS, RDF),元數據方面的問題 (1),元數據方面的問題

20、 (2),元數據庫是建立在自愿基礎上的 不能強行推行任何標準 存在各種質量問題: 完整性、準確性、一致性問題 重復的數據 給用戶查找帶來麻煩 影響以后用戶加注過程,/NSDLMetadataQuality/,缺乏各種控制詞匯 (schemes) 和標準 如:描述時間的標準格式,描述語言、名稱、事物、用戶對象、物件類型等的統一的控制詞匯 有的根本不采用標準 有的采用了自己的控制詞匯 在合并后,由于沒有辦法知道采用的什么詞匯,失去上下文,元數據方面的問題 (3),元數據方面的問題 (4),以什么為單位? 如:每個圖片一條記錄,還是2000個圖片歸為一組做

21、一條記錄 (想想NASA衛星每天發回的成百上千的圖像) 元數據的自動生成 減少人工投入,增加產量 現存的資源比DL人功能描述的多得多 能否在capture 時就能自動抓取的數據 自動生產的元數據的質量控制,元數據措施 (1)(討論中),對元數據的管理單位從記錄改變成元素 對每個元素增加來源和日期修飾項 重新合并元數據 不同來源的記錄有不同的詳盡程度,合并后可以生成內容更加豐富的記錄,元數據措施 (2)(討論中),為下一個浪潮-加注做好準備 在元數據后面加注: 正式的評論 非正式的個人經驗等,馬上制定一套控制詞匯, 主要是以下方面: NSDL的重點順序 難度 Educational level1

22、R E Audience3H Mediator3+M Pedagogy4H Resource type2M Interactivity level5M+,元數據措施 (3)(討論中),元數據質量管理,單條數據 單個數字圖書館 聯合數據庫 合并后的原數據庫,Completeness (完整性) Correctness (正確性) Consistency (一致性) Duplication (重復率),互操作方面的問題,互操作方面的問題(1),硬件/網絡 軟件 包括中間軟件、JAVA、開放標準、應用程序界面,插件、個人化的用戶界面 信息 元數據、元數據的對照表、綜合、翻譯等 打破語詞、特征的局限,走向概念,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論