第八講計算機檢索_第1頁
第八講計算機檢索_第2頁
第八講計算機檢索_第3頁
第八講計算機檢索_第4頁
第八講計算機檢索_第5頁
已閱讀5頁,還剩62頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第八講 計算機檢索第一節 計算機檢索簡介第二節 計算機檢索系統的構成第三節 計算機檢索的途徑和方法第四節 聯機檢索系統第五節 應用圖書館網站檢索第一節 計算機檢索簡介一、計算機檢索1、定義 簡稱機檢,指利用計算機查找文獻信息的過程。2、原理計算機將輸入機檢系統的檢索提問特征標識(檢索詞)或用布爾邏輯運算符(and、or、not)聯結起來的檢索提問式與己存儲在系統中的文獻特征標識(標引詞如:主題詞、分類號和類目名稱等)進行機械性匹配比較,凡符合給定的比較原則和邏輯運算條件者即為命中文獻。3、優點: 速度快,效率高(CA、BA等尚在印刷中就已輸入數據庫了); 檢索途徑多(除了主題、著者、分類外,還

2、有出版年、著者單位、文獻類型、特征詞等); 用戶界面友好,使用方便(可對任意個檢索詞進行邏輯組配,并且進行自動擴檢); 資源更新快(網上資源可以每日更新); 直接輸出檢索結果(打印或拷貝); 信息內容的廣泛、訪問快速且搜索具有網絡型4、缺點 檢索費用較高; 缺乏思維能力和靈活性; 文獻回溯檢索能力不強; 網上檢索,線路緊張是速度慢。二、計算機信息檢索的發展歷程 脫機檢索階段 聯機檢索階段 光盤檢索階段 網絡化檢索階段1、脫機檢索階段 脫機檢索是指利用本機數據庫中存儲的數據信息進行檢索 時間:20世紀50年代-60年代 檢索人員檢索策略成批檢索用戶 不足: 地理上的障礙;時間上的遲滯;封閉式的檢

3、索。2、聯機檢索階段 聯機檢索是指利用檢索終端,通過通信網絡和檢索系統聯機,從檢索系統中的數據庫中進行檢索。 時間:20世紀60年代-80年代 用戶檢索策略“人機對話”獲取所需信息 著名的國際練級檢索系統有美國的DIALOG系統、ORBIT系統、BRS系統以及IBM公司的“文獻處理系統”。聯機檢索的優缺點優點檢索速度快,效率高檢索范圍廣泛、全面檢索途徑多,方便,靈活檢索內容新,實時性強檢索輔助功能完善(人機對話、檢索結果輸出方式靈活,輸出格式多樣等)。缺點檢索費用高;對檢索系統及其文檔(數據庫)的收錄、標引、特點等問題較難了解、熟悉;檢索技術和技巧不易掌握。3、光盤檢索階段 時間:20世紀80

4、年代以來 儲量極大而體積微小,要求設備簡單,可隨地安裝,使用方便、易于操作,檢索費用低(不需要昂貴的聯機檢索通訊費用),可隨時修改檢索策略而具有很高的查全率和查準率等有點。光盤檢索階段 單機光盤檢索 聯機光盤檢索 光盤庫(2-6光驅,多達500光盤)/光盤塔(8-64個光驅)4、網絡化檢索階段 利用INTERNET,對網絡上各種資源進行檢索 時間:20世紀90年代以來 INTERNET是結合一百多個國家、幾萬個信息網絡、幾百萬臺主機、幾千萬個終端用戶,并能夠跨越時空,進行實時信息檢索、資源共享的國際性超級性超級計算機網絡。目前,90%的國際聯機檢索系統進入INTERNET,世界上許多國家(包括

5、中國)都從INTERNET上獲取重要的科技和經濟信息資源。第二節 計算機檢索系統的構成 計算機檢索系統利用計算機的有效存貯和快速查找能力來進行信息的分析、組織、存貯和查找的系統。包括硬件部分、軟件部分、數據庫和通信網絡。1、硬件部分:主機:計算機的核心部件。外圍設備: 外部存貯器:磁帶、磁盤、光盤等 輸入輸出設備:數據庫入設備、鍵盤、鼠標器、光學字符識別裝置、光筆、縮微掃描器、掃描儀、顯示終端等。其他:運算器、控制器。系統軟件 主要用語簡化設計,簡化使用方法,管理計算機資源,提高計算機的使用效率,發揮和擴大計算機的功能及用途。包括各種系統服務程序、各種語言處理程序、操作系統和數據庫管理系統。應

6、用軟件: 是用戶利用計算機來解決某一問題而編制的程序,如文件管理程序、檢索程序、記賬統計程序等。3、數據庫(系統): 數據庫 以特定的組織方式將計算機的相互關聯的數據集合存儲的總匯,將各種數據中的信息單元經過有序處理、組織,可以按 通常的方法進行檢索。數據庫的種類從存貯信息內容的種類,可分為:參考數據庫、源數據庫、混合數據庫。(1)參考數據庫 指引用戶到另一信息源以獲得原文或其他細節的數據庫。它本身不直接提供用戶所需情報,而是起著一種牽線搭橋的作用。包括書目數據庫和指南數據庫(如人物傳記數據庫、機構名錄數據庫、產品數據庫等)。(2)源數據庫 能直接提供具體數據或原始資料的數據庫,用戶不必再查閱

7、其他信息源。包括數值數據庫、文本-數值數據庫,全文數據庫,術語數據庫、圖像數據庫。如科學數據庫、期刊全文庫、法律全文庫、照片數據庫、圖案數據庫等。(3)混合型數據庫 兼具以上兩類數據庫的特點,能同時存貯多種不同類型數據的數據庫。如指南數據庫、光盤數據庫、多媒體數據庫、超文本數據庫。4、通信網絡 計算機信息傳輸網絡,各網絡節點之間通過電信線路、通信衛星或光纜電視技術等進行連接,構成龐大的信息檢索網絡,保證信息之間的暢通傳輸。第三節 計算機檢索的途徑和方法一、檢索途徑 計算機檢索的方法從使用方式上可分為3種類型: 命令檢索、菜單檢索和超文本檢索。1)命令檢索 使用特定操作命令來實施檢索。 適用于有

8、經驗的檢索人員,終端用戶使用錢要經過專門的學習和培訓。 不同的系統一般有不同的檢索命令表示方式,各命令綜合應用,可得到理想的檢索效果。 一些大型的檢索系統都用命令檢索方式。2)菜單檢索 一種簡單易用的檢索方式。 普通用戶只需要根據菜單的指引,通過適當的選項和功能鍵就能一步步完成。 缺點是操作步驟多,檢索時間耗費較多,精確度也不如命令方式。 光盤檢索大多采用菜單檢索。二、基本檢索方法 1、布爾檢索 2、截詞檢索 3、字段檢索 4、加權檢索 5、擴檢與縮檢1、布爾檢索法 利用布爾邏輯運算符進行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種方法。 常用的布爾邏輯運算符有是那種,分別是邏輯或

9、OR、邏輯與AND、邏輯非NOT。 用這些邏輯運算符將檢索詞組組合成檢索提問式,計算機將根據提問式與數據庫中的記錄進行匹配,當兩者一致時則命中,并自動輸出改文獻記錄。(1)邏輯或 OR: 也可寫成“+”、檢索詞A和檢索詞B若用“OR”組配,則提問式可寫成“A OR B”或者“A+B”,表示要檢索含有A、B詞之一或同時包含AB兩詞的文獻。(2)邏輯與AND 也可寫成“”,檢索詞A與檢索詞B若用“AND”組配。則提問式可寫為“A AND B”或者“AB”,表示要找出含有這兩個詞的文獻集合。2、截詞檢索法截詞是指檢索這將檢索詞在他認為比較合適的地方截斷,也稱模糊檢索,又稱詞干檢索法。截詞符號一般為“

10、?”,也常用“$”,*。截詞檢索 是用截斷的詞的一個局部進行的檢索,也就是利用檢索詞的詞干加上截詞符號去數據庫中進行檢索。截詞檢索的種類 按截斷的位置來分:包括前截詞檢索、后截詞檢索和中截詞檢索。前截斷 例如:*computer,可檢minicomputer,microcomputer。 使用很少。中截斷 例如:?comput?可檢 minicomputer,microcomputers 查找英美不同拼法最有效。后截斷 例如:comput?,可檢computer,computers,computing 主要用于: 詞的單復數,company 、companies 年代檢索,199?; 詞根檢索

11、,socio*,可檢sociobiology、socioecology、sociolinguistics、sociology等20多個詞匯。3、字段檢索法 字段是數據庫中記錄的下級單位,一個字段即是一個著錄項目。字段檢索是一種限定檢索詞在數據庫記錄中出現的字段范圍的一種檢索方法。字段檢索法分為兩種: 主題字段(題名、主題詞、文摘等) 非主題字段(作者、文獻類型、語種、出版年份等)。4、加權檢索 是一種定量檢索的技術 在每個提問詞后面給定一個數值表示其重要程度,這個數值稱為權,在檢索時,先查找這些檢索詞在數據庫記錄中是否存在,然后計算存在的檢索詞的權值總和。權值之和吵過閾(YU)值,該記錄為命中

12、文獻。 縮小檢索范圍提供檢索準確率的有效方法。5、擴檢與縮檢 擴檢檢索 初始設定的檢索范圍太小,命中文獻不多,需要擴大檢索范圍的方法,主要有:概念的擴大,增加同義詞,年代的擴大。縮小檢索 又稱二次檢索,指開始的范圍臺太大,命中文獻太多,或查準率太低,需要增加查準率的一種方法。主要有:概念的縮小,增加檢索詞,特定期刊的限定等。聯機檢索系統組成:主機系統:服務器,存有大量數據信息數據庫:由一個或多個文檔組成的大量書庫的有序集合。通訊線路:電話線、光纖、光纜、衛星、微波檢索終端:用戶直接使用的終端機器。DIALOG DIOLOG目前擁有600多個數據庫,文獻信息總量在6億條以上,占全世界聯機數據庫總

13、量的50%以上。 數據庫的類型主要有四種:文摘型、數值型、名錄字典型、全文型。 涉及40多個語言和占世界發型總量60%的期刊,專業覆蓋面廣,包括綜合學科、自然科學、應用科學和工藝學、社會科學和人文學、時事報道和商業經濟等。 Dialog的優勢更在于具有很高的權威性。diolog數據庫的供應者均為世界各國著名專業信息機構、出版社和新聞媒體,如美國化學文摘社、D&B公司、路透社、道瓊斯、標準普爾等。Dialog系統作為世界最受推崇和最權威的科技和商務信息資源,正在為150多個國家的20多萬專業用戶提供服務。 Dialog信息有很強的延伸性,它不僅提供即時信息,而且可以迅速回溯查找一、兩年前,甚至二

14、十多年前的歷史累積數據,有利用了解真個個事件的來龍去脈,以及行業、技術和公司發展的各階段的狀況。 在Dialog檢索系統中,一般情況下一個數據庫就構成一個文檔,并給與一個文檔號,大的數據庫可按年代劃分為若干個文檔,如化學文摘(CA)399文檔(1967-現在)、308文檔(1967-1971年)、309文檔(1972-1976年)、310文檔(1977-1981年)、311文檔(1981-1987年)、312文檔(1987-現在)。每個文檔可單獨檢索,也可同時檢索多個文檔。 DIALOG公司站點的網址是: http:/二、STN國際聯機檢索系統 STN系統全稱是國際科技信息網絡。 該系統創建于

15、1983年,由美國化學文摘服務社(CAS)、德國卡爾斯魯厄信息中心(FIZ-Karlsruhe)和如本科技情報中心(JICST)三家共同開發創建的。 這三個機構作為STN的服務中心,其主機通過海底電纜相聯,用戶只需與其中一個服務中心的主機聯機,就可現實對三臺主機同時訪問。它支持多文檔檢索,全天24小時提供服務。 STN系統目前有200多個數據庫,主要涉及各學科領域及綜合性科學技術方面的論文和專利,同時提供眾多公司、供應商等方面的商情信息(如生物商情、化工產品等方面)。 STN系統采用Messenger軟件,可用英、德、法三種文字進行檢索。該軟件有如下優點: 跨文檔檢索,可以一次同時檢索多個數據

16、庫文檔; 檢索指令簡單易用,即使沒有很多聯機經驗的用戶也可以很快掌握; 可以使用后綴代碼在指定字段檢索; 提供化學結構式檢索,用戶可以通過菜單、鼠標或命令輸入結構式。三、OCLC的Firstsearch聯機系統 OCLC(聯機計算機圖書館中心-Online Computer Library Center)始建于1967年,總部設在美國俄亥俄州都伯林,為全世界80多個國家和地區的4萬多家圖書館服務,是世界上最大的聯機文獻信息服務機構之一。它是一個面向圖書館的非營利組織。 早在1971年,OCLC建立了一個聯機共享目錄系統Worldcat。1979年引入了國際性的館際互借,在近7000個圖書館之間

17、辦理了1億多件業務。 OCLC聯機系統主要通過由OCLC設計運行的聯機通訊網向成員館及其他組織提供各種處理過程、產品和參考服務、也接收來自Internet遠程通訊網的訪問。 OCLC提供兩種檢索系統:FPIC和FirstSearch,它們的內容是一致的。EPIC系統采用的是命令方式的聯機檢索。 FirstSeach(第一檢索)用Web訪問。 1999年8月,OCLC完成了新版FirstSearch目前通過該系統可檢索70多個數據庫,其中有30多個庫可檢索到全文,總計包括11660多種期刊的聯機全文和4500多種期刊的聯機電子映像,有10000多萬篇全文和全圖文章。第五節 應用圖書館網站檢索1、

18、圖書館網站檢索隨著網絡的發展,大多數圖書館都建立了網上平臺,通過圖書館的網站可以了解圖書館的各種相關信息,并進行圖書的檢索。2、檢索步驟1)在瀏覽器中輸入圖書館的網址,并通過導航鏈接進入具體的書目檢索版塊。2)按照需要單擊不同的書目庫進入詳細的檢索頁面。3)在詳細頁面種選擇不同的檢索途徑,在檢索文本框中輸入檢索關鍵詞,單擊檢索按鈕即可獲得詳細信息。4)在檢索獲得的目錄中單擊相關條目可以進入該書的詳細頁面,包括簡介及流通情況,根據系統提供的功能可以進行書目的預定等操作。 小 結(一)計算機檢索簡介1、計算機檢索定義、原理、優點、缺點2、計算機信息檢索的發展歷程(1)脫機檢索階段(2)聯機檢索階段(3)光盤檢索階段(4)網絡化檢索階段(二)計算機檢索系統的構成1、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論