第二章 信息檢索基_第1頁
第二章 信息檢索基_第2頁
第二章 信息檢索基_第3頁
第二章 信息檢索基_第4頁
第二章 信息檢索基_第5頁
已閱讀5頁,還剩57頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章信息檢索基本知識主要內容第一節信息檢索概論第二節信息檢索語言第三節計算機信息檢索技術第四節文獻檢索的方法與途徑第五節信息檢索的基本步驟第六節信息檢索效果評價第一節信息檢索概論信息檢索狹義:依據一定的方法,從已經組織好的大量有關文獻集合中,查找并獲取特定的相關文獻的過程。廣義:包括信息的存儲和檢索(storageandretrieval)2個過程第一節信息檢索概論信息存儲的步驟信息的選擇與收集信息的標引形成大量有序可檢的信息集合第一節信息檢索概論信息檢索的發展手工檢索:是一種傳統的檢索方法,即以手工翻檢的方式,利用工具書(包括圖書、期刊、目錄卡片等)來檢索信息的一種檢索手段計算機檢索:指人們在計算機或計算機檢索網絡的終端機上,使用特定的檢索指令、檢索詞和檢索策略,從計算機檢索系統的數據庫中檢索出需要的信息,繼而再由終端設備顯示或打印的過程第一節信息檢索概論手工檢索的特點優點:簡單、靈活,容易掌握缺點:費時、費力,容易造成誤檢和漏檢計算機檢索的特點檢索速度快檢索功能強大,具有多種檢索途徑獲得信息類型多檢索范圍大資源共享第一節信息檢索概論信息檢索的基本原理通過對大量的、分散無序的文獻信息進行搜集、加工、組織、存儲,建立各種各樣的檢索系統,并采用一定的方法和手段使存儲與檢索這兩個過程所采用的特征標識達到一致,以便有效地獲得和利用信息資源。第一節信息檢索概論第一節信息檢索概論信息檢索工具含義:根據檢索語言,將無序列文獻按一定方式系統組織起來,用于報道、存儲和檢索文獻的工具。構成要素:文獻、檢索語言及文獻條目第一節信息檢索概論信息檢索工具的特征必須詳細描述文獻的內容特征(也稱內部特征)和外部特征(也稱外表特征)。每條用于描述文獻的記錄或款目都必須具有各種檢索標識。全部文獻條目按一定順序科學地組成一個有機的整體。能夠提供多種檢索途徑。第一節信息檢索概論信息檢索工具的職能報道職能存儲職能檢索職能第一節信息檢索概論信息檢索的類型根據檢索對象的形式劃分:文獻檢索、事實檢索和數據檢索根據檢索方式劃分:手工檢索和計算機檢索其他分類方法:目錄、題錄、文摘、索引、參考工具書、搜索引擎第一節信息檢索概論信息檢索的意義和作用信息檢索是信息素質教育的主要內容信息檢索是創新型人才應具備的基本技能信息檢索是科學研究的重要環節信息檢索是開發信息資源的有效途徑信息檢索是科學決策的前提第一節信息檢索概論大學生學習信息檢索知識的意義信息檢索是獲取知識的捷徑信息檢索是科學研究的向導信息檢索是終身學習的基礎第二節信息檢索語言檢索語言含義:是應文獻信息的加工、存儲和檢索的共同需要而編制的,用于描述信息系統中文獻信息的內容特征和外部特征、表達用戶信息檢索提問的一種專用語言,是表達一系列概括文獻信息內容和檢索課題內容的概念及其相互關系的一種概念標識系統。第二節信息檢索語言檢索語言的作用標引文獻信息內容及其外部特征,保證不同標引人員表征文獻的一致性;對內容相同及相關的文獻信息加以集中或揭示其相關性;使文獻信息的存儲集中化、系統化、組織化,便于檢索者按一定的排列次序進行有序化檢索;便于將標引用語和檢索用語進行相符性比較,保證不同檢索人員表述相同文獻內容的一致性,以及檢索人員與標引人員對相同文獻內容表述的一致性;保證檢索者按不同需要檢索文獻時,都能獲得最高查全率和查準率。第二節信息檢索語言檢索語言的類型表達文獻外部特征的檢索語言表達文獻內容特征的檢索語言分類語言主題語言代碼語言第二節信息檢索語言第二節信息檢索語言分類語言含義:是用分類號和相應的分類款目名稱來表達信息內容的主題概念,并按學科體系的邏輯次序將信息資源系統地加以劃分和組織的語言特點具有按學科或專業集中、系統地揭示文獻內容的功能,具有較高的查全率,能夠較好地滿足族性檢索的要求;具有良好的等級結構,便于擴大和縮小檢索范圍;既能用于組織檢索工具和檢索系統,又能用于組織文獻的分類排架;用分類號檢索,可不受文種限制。第二節信息檢索語言第二節信息檢索語言《中圖法》的標記符號采用字母與阿拉伯數字相結合的混合制標記符號(標記符號也稱分類號,是類目的代號),字母代表基本大類,阿拉伯數字代表各級類目,并可根據大類的實際配號需要再展開一位字母第二節信息檢索語言主題語言和主題詞表主題:即文獻論述或涉及的主要事物或問題。主題詞:是用于描述、存儲、查找文獻主題的受控詞匯,是主題表中能表達一定意義的最基本的詞匯單元。主題詞一般劃分為標題詞、單元詞、敘詞和關鍵詞。主題詞表:是把主題詞按一定方式組織與展示的詞匯表。按照類型不同的主題詞的特點,主題詞表可劃分為標題詞表、單元詞表和敘詞表第二節信息檢索語言主題語言的要素語詞標識字順系統參照系統主題檢索工具第二節信息檢索語言自然語言自然語言是相對于受控語言而言的。它在本質上是未經加工和規范化處理的非受控語言優點:直接抽取信息的原詞,直觀性與專指性強全面反映信息的外部特征和全文內容,檢索途徑多利用計算機自動抽詞、標引,省時而且標引速度快可以隨時增補新詞,以反映科學的最新發展動態對使用者的要求不高,檢索方便,容易被掌握進行標引和檢索的方法:關鍵詞法、自然語言檢索等第二節信息檢索語言關鍵詞法能夠用做文獻的主題檢索標識的原因:文獻題名,尤其是科技文獻的題名通常都具有報道性,大多能基本表達文獻的主題以文獻題名中抽取的關鍵詞作為檢索入口,能夠有效地將用戶指向可能包含相關情報的信息資保留關鍵詞前后的上下文有助于解釋關鍵詞的含義,因而可以將其用做限定標目的說明語第二節信息檢索語言關鍵詞法關鍵詞索引的優點:標引時無需查看詞表,直接根據題名、文摘中的語詞進行標引,簡便易行,可以降低對標引人員的要求,節省標引時間易于使用計算機進行編制,實現檢索工具編制過程的計算機化,保證通報文獻的及時性,以及生產過程的高效率和低成本能夠及時更新詞匯,出現在題名、文摘中具有檢索意義的詞匯均可立即用于標引和檢索第二節信息檢索語言關鍵詞法關鍵詞語言的不足包括:用關鍵詞語言建立的檢索工具,質量往往不穩定,會導致漏檢、誤檢會增加用戶負擔,影響檢全率題名中的不少語詞為通用概念,它們為檢索入口建立的檢索款目沒有實際檢索意義漢語由于存在分詞難題,應用計算機進行漢語關鍵詞抽詞標引仍需要解決詞匯切分問題第二節信息檢索語言自然語言檢索定義:自然語言檢索亦稱為文本檢索,指不對文獻進行任何標引,直接通過計算機以自然語言中的語詞匹配查找文本檢索進行匹配的對象:既可以是整個出版的文本,也可以是它的部分常用的文本檢索技術:

布爾檢索、截詞檢索、精確檢索、限定范圍檢索、相關檢索等第二節信息檢索語言網絡環境下信息檢索語言的發展趨勢自然語言成為網絡信息檢索語言的主流傳統情報檢索語言大量應用于網絡信息環境下自然語言需要人工語言的支持第二節信息檢索語言自然語言成為網絡信息檢索語言主流的原因在全文檢索技術的支撐下,自然語言作為全面反映網絡信息特征的原詞,比人工語言更能有效地對網絡信息進行揭示和標引大量社會終端用戶的介入使具有受控語言背景知識的專業用戶比例急劇減少第二節信息檢索語言傳統情報檢索語言大量應用于網絡信息環境下傳統情報檢索語言在網絡環境下的直接應用傳統情報檢索語言在網絡環境下的間接應用分類法和主題法原理的應用分類-主題一體化思想的應用實現了體系分類法和組配分類法的結合第二節信息檢索語言自然語言需要人工語言的支持自然語言檢索的缺點冗余信息太多,準確率不高在一定程度上會造成漏檢計算機對自然語言的理解力影響檢索效率存在它能否最準確、充分地表達信息中有價值內容的詞,以及這些詞與檢索課題是否能有效匹配的問題第三節計算機信息檢索技術布爾邏輯檢索定義:布爾邏輯檢索是采用布爾代數中的邏輯“與”、邏輯“或”、邏輯“非”等運算符,將檢索提問式轉換成邏輯表達式,限定檢索詞在記錄中必須存在的條件或不能出現的條件的一種檢索技術類型邏輯“或”組配邏輯“與”組配邏輯“非”組配第三節計算機信息檢索技術邏輯“或”組配定義:邏輯“或”是一種具有概念并列(或同義、近義、反義)關系的組配優點:可以擴大檢索范圍,提高查全率邏輯表達式:AORB或A+B含義:檢索記錄中凡含有檢索詞A或檢索詞B,或同時含有檢索詞A和B的,均為命中文獻第三節計算機信息檢索技術第三節計算機信息檢索技術邏輯“與”組配定義:邏輯“與”組配是一種具有概念交叉(或限定、形容、修飾)關系的組配優點:可增強檢索專指度,提高查準率邏輯表達式:AANDB或A*B含義:檢索記錄中只有同時含有檢索詞A和B的文獻,才能成為命中文獻第三節計算機信息檢索技術第三節計算機信息檢索技術邏輯“非”組配定義:邏輯“非”組配是一種具有概念排除關系的組配優點:可提高查準率,但會影響查全率邏輯表達式:ANOTB或A-B含義:只有檢索記錄中含有檢索詞A,但不含有檢索詞B的文獻,才算命中文獻第三節計算機信息檢索技術第三節計算機信息檢索技術截詞檢索截詞檢索是防止漏檢,提高查全率的一種檢索技術,用于外文數據庫算符:“*”或“?”功能:相當于布爾邏輯“或”類型自動截詞人工截詞第三節計算機信息檢索技術人工截詞按截詞位置前截詞中截詞后截詞按截詞數量有限截詞無限截詞第三節計算機信息檢索技術二次檢索定義:二次檢索是在前次檢索的基礎上進行的檢索,也叫進階檢索、再次檢索、在檢索結果中檢索等,各次檢索相互間為邏輯“與”操作優點可以逐步縮小檢索范圍,提高查準率簡化了檢索表達式的書寫,通過簡單檢索與進階檢索完全可以滿足復雜檢索表達式達到的檢索精度第三節計算機信息檢索技術限制檢索字段限制匹配度限制時間限制第三節計算機信息檢索技術詞位檢索優點:可彌補布爾邏輯算符只是定性規定檢索詞的范圍這一缺陷,以提高檢準率類型鄰位檢索字段檢索第三節計算機信息檢索技術鄰位檢索ONEAR:詞序不可顛倒NEAR:詞序可顛倒字段檢索同句檢索:“ASB”,表示A、B兩詞必須同時出現在非標題字段中的一個句子(或兩個標點符號)中,不限制詞距同段檢索:“AFB”,表示A、B兩詞必須同時出現在同一個文摘字段中,不限制詞序,也不限制詞距。第四節文獻檢索的方法與途徑文獻檢索的方法瀏覽法直接法追溯法循環法第四節文獻檢索的方法與途徑瀏覽法定義:就是科技人員對本專業或本學科的核心期刊每到一期便瀏覽閱讀的方法優點能最快地獲取信息能直接閱讀原文內容基本上能了解本學科發展的動態和水缺點科技人員必須事先知道本學科的核心期刊檢索的范疇不夠寬,因而漏檢率較大第四節文獻檢索的方法與途徑直接法定義:直接法又稱常規法,是指直接利用檢索系統(工具)檢索文獻信息的方法類型順查法倒查法抽查法分段法第四節文獻檢索的方法與途徑追溯法定義:追溯法又稱回溯法,是一種傳統的查找文獻的方法具體檢索方法:在查到一篇參考價值較大的新文獻后,利用文獻后面所列的參考文獻,逐一追查原文(被引用文獻),然后再從這些原文后所列的參考文獻目錄逐一擴大文獻信息范圍,一環扣一環地追查下去第四節文獻檢索的方法與途徑循環法定義:循環法又稱綜合法,是交替使用追溯法和直接法來進行檢索的綜合方法具體檢索方法:首先利用檢索工具查出一批文獻資料,再利用這些文獻資料所附的參考文獻追溯查找相關文獻,如此交替、循環使用直接法和追溯法,不斷擴展,直到達到檢索要求為止。第四節文獻檢索的方法與途徑文獻檢索的途徑著者途徑篇名途徑分類途徑主題途徑引文途徑序號途徑代碼途徑專門項目途徑第五節信息檢索的基本步驟分析研究課題確定檢索工具選擇檢索方法確定檢索途徑和檢索策略實施檢索并調整檢索策略索取原始文獻第五節信息檢索的基本步驟分析研究課題分析主題內容分析問題類型分析查找年代確定檢索工具學科、專業范圍信息類型文種課題內容第五節信息檢索的基本步驟選擇檢索方法根據檢索工具的條件選擇根據檢索課題的要求選擇根據學科發展特點選擇確定檢索途徑和檢索策略確定檢索途徑確定檢索策略第五節信息檢索的基本步驟實施檢索并調整檢索策略誤檢原因分析漏檢原因分析縮小檢索范圍的方法擴大檢索范圍的方法第五節信息檢索的基本步驟索取原始文獻原始

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論