




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
信息檢索的基本知識信息檢索的基本知識主要內容1.信息檢索概述2.信息檢索原理及檢索語言3.信息檢索系統與檢索工具4.信息檢索的一般程序信息檢索的基本知識1.信息檢索概述1.1信息檢索的含義
信息檢索(InformationRetrieval)是指將信息按一定的方式組織和存儲起來,并根據用戶的需要找出有關信息的過程,又叫信息儲存與檢索(InformationstorageandRetrieval),這是廣義的信息檢索,如圖1-1所示。狹義的信息檢索則是僅指該過程的后半部分,即從信息集合中找出所需信息的過程。信息檢索的基本知識信息存儲與檢索過程檢索工具數據庫檢索提問式分析分析標識標識匹配輸出文獻的選擇與收集文獻源用戶文獻特征標識語言信息需求檢索提問檢索結果反饋從這個圖中,我們可以看出兩條主線。一條主線是文獻檢索,通過分析自身的文獻需求,提出檢索請求。另一條主線是數據庫的建設,通過獲取文獻源,對文獻進行分類標引入庫,建成可檢索的數據庫。當檢索請求與數據庫相匹配后,就返回檢索結果,得到需要的文獻。信息檢索的基本知識檢索過程一位女子征婚,開出的交友條件有兩點-
1.要帥-
2.要有車-
電腦去幫她搜尋的結果~~~~~~~~~~~~~~~~~象棋-這位女子,不服搜出的結果又輸入-1.要有漂亮的房子-2.要有很多錢-電腦去幫她再次搜尋的結果~~~~~~~~~~~~~~銀行-此女子仍然不失望,繼續輸入條件-1要長得酷-2又要有安全感-結果搜出的結果是~~~~~~~~~~~~~~~~~~~奧特曼此女子仍然不失望,還繼續輸入條件1.要帥-2.要有車-3.要有漂亮的房子-4.要有很多錢-5要長得酷-6又要有安全感-電腦去幫她再次搜尋的結果~~~~~~~~~~~~~~奧特曼在銀行里下象棋
-信息檢索的基本知識以《中文科技期刊數據庫》為例它把我國公開或非公開發行的9000多種期刊,從1989年到現在的每一本每一期買回來,通過掃描、數碼拍相等方式錄入,轉化為數字形態,并對其中的每一篇文獻進行分類標引和主題詞標引等加工,然后入庫,最后通過一個檢索程序把它整合起來,發布在網絡上,供人們檢索使用。這個過程描述起來非常簡單,但在做的過程中,有很多細節性的問題。比如,購買期刊,涉及到版權問題;文獻標引,涉及到學術上的元數據標準問題;檢索程序,涉及到IT技術;網絡應用,也正在走向豐富的知識服務時代。信息檢索的基本知識1.2信息檢索的類型
1.根據檢索對象劃分根據檢索對象的不同,早期的信息檢索分為以下幾種。(1)文獻檢索:以文獻為檢索對象。凡是查找某一課題、某一著者、某一地域、某一機構、某一事物的有關文獻的出處和收藏單位等,均屬于文獻檢索。這是一種相關性檢索,它提供的是與用戶信息需求的相關文獻的線索或原文。(2)事實檢索:以特定的事實為檢索對象如查找某一事物發生的時間、地點與過程,某類產品哪些廠家生產、哪個牌號最好等,均屬事實檢索。屬確定性檢索。(3)數據檢索:以數據為對象的檢索。如查找某一數學公式、數據、圖表,某一種材料的成分、性能都屬于數據檢索的范疇。屬確定性檢索信息檢索的基本知識文獻檢索是一種不確定性檢索,多利用專業檢索工具,包括目錄、題錄、文摘、索引與搜索引擎及其相對應的數據庫資源與網絡資源。數據檢索與事實檢索得到的是字、詞、事物的概念、人名、機構名、地名、公式、參數、規格、型號等,所得結果非常準確,因而是一種確定性檢索。數據檢索與事實檢索主要使用數據、事實型工具檢索,包括詞典、百科全書、手冊、名錄、年簽、指南等類型及其相對應的數據庫資源與網絡資源。
信息檢索的基本知識2.按檢索方式分
按檢索方式分為手工檢索(手檢)和計算機檢索(機檢)兩種方式。(1)手工檢索:即用人工來直接查找所需信息的方式,多利用各種檢索工具的印刷版來實現,如印刷型的目錄、題錄、文摘、索引等。手檢直觀,不需要輔助沒備,但速度慢,漏檢嚴重,查全率受信息資源儲備數量的限制。(2)計算機檢索:就是將大量的文獻資料或數據進行加工整理,按一定格式存儲在機讀載體上,建成機讀數據庫,利用計算機對數據庫進行檢索的信息檢索方式。與手工檢索相比,計算機檢索速度快、效率高、查全率高,不受時空限制,檢索結果輸出方式多樣等。但查準率與網絡及數據庫質量的高低直接相關。信息檢索的基本知識1.2.1信息檢索原理
各種檢索系統的檢索原理基本相同,簡單地講就是對信息集合與需求集合的匹配與選擇。信息檢索的基本原理如圖1-2所示。1.2信息檢索原理及檢索語言檢索提問標識與存儲在檢索工具中的文獻索引標識進行比較,兩者一致或文獻索引標識包含著檢索提問標識,則具有該標識的信息就從檢索工具中輸入,輸出的信息就是檢索找到的信息。信息集合特征化表示特征化表示需求集合圖1-2信息檢索的基本原理示意圖選擇與匹配信息檢索的基本知識1.2.2檢索語言檢索語言又稱標引語言、索引語言等,是信息檢索系統存儲和檢索信息時共同使用的一種共同語言。即在文獻存儲時,文獻的內容特征(分類、主題)和外表特征(書名、著者)按照一定的語言來描述,檢索文獻時的提問也按照一定的語言來加以表達,這種在文獻存儲和檢索過程中,共同使用、共同遵循的語言就是檢索語言。傳統的手工檢索或現代的各種信息檢索系統,都是通過一定的檢索語言組織。通過檢索語言,可以把能夠表示文獻特征的全部標識按一定的規則組成一個有序的檢索系統,使每種文獻在檢索系統中都有固定的位置,從而為文獻檢索提供可能。
信息檢索的基本知識
檢索語言的種類很多,按描述文獻特征不同,檢索語言可分為描述文獻外表特征和內容特征的檢索語言,如圖1-3所示。信息檢索的基本知識檢索語言外表特征內容特征題名(書名、篇名)著者代碼(專利號、報告號、標準號等)引文(被引著者姓名和引用文獻的出處)分類語言主題語言標題詞關鍵詞敘詞圖1-3檢索語言的分類描述文獻外表特征的檢索語言,例如篇名、著者姓名、文獻號等作為文獻標識與檢索依據直接明了,使用時較為簡單。而文獻內容特征的語言,也就是分類語言和主題語言的原理和使用方法是下面主要介紹的內容。信息檢索的基本知識題名:
精神疾病案例診療思路作者:
楊世昌
出版項:北京:人民衛生出版社,2008頁碼:
300頁價格:
CNY37.00
主題:
精神疾病案例診療思路
索取號:R74/101內容提要:本書分兩個部分。第一部分:介紹精神疾病的診斷學基礎——晤談技術、病史采集、精神狀況檢查以及精神疾病的診斷思維。第二部分:根據多年臨床實踐編寫相關病例,每個病例依據臨床就診過程逐步提供病情或臨床相關信息,予以分析診療思路。同時編寫相關的理論知識。分類:
R74一條中文書目記錄:信息檢索的基本知識
一條英文書目記錄:
AUTHOR:Dichter,Carl.TITLE:SoftwareengineeringwithPerlPLACE:EnglewoodCliffs,N.J.PUBLISHER:PrenticeHallPTR,YEAR:1995PUBTYPE:BookFORMAT:282p.:ill.;24cm.+1computerdisk(31/2in.)NOTES:Includesbibliographicalreferences(p.267-268)andindexSystemrequirementsforaccompanyingcomputerdisk:HighDensityMSDOS;MacintoshwithPCExchange.ISBN:013016965XSUBJECT:Softwareengineering.Perl(Computerprogramlanguage)Software--Engineering信息檢索的基本知識
1.分類語言所謂類是指具有共同屬性的事物的集合。每一種事物都有多種屬性,用其某一種屬性作為劃分依據來對此事物進行劃分就稱為分類。分類是人類邏輯思維的一種最基本的形式,分類語言是用分類號來表達學科體系的各種概念,將各種概念按學科性質進行分類和系統排列。具體而言,它是以學科分類為基礎,按照概念劃分的原理,將知識概念從一般到具體、從簡單到復雜、從低級到高級逐級劃分。每劃分一次形成一批并列的概念—下位概念,它們同屬于一個被劃分的概念—上位概念。例如“醫學”這個類可以劃分為“基礎醫學”、“臨床醫學”、“康復醫學”、“預防醫學”等子類。“醫學”為被劃分的概念,即上位概念。它所劃分出的幾個概念,即下位概念。這幾個下位概念之間體現的是平行關系,而上下位概念之間,則是隸屬關系。
信息檢索的基本知識中國圖書館圖書分類法將圖書分為社會科學、自然科學、綜合三大類由字母和數字組成采用等級列舉表達從屬關系上位類目與下位類目的關系: 上位類目一定包含各個下位類目, 下位類目一定帶有上位類目的屬性。分類號越長,表示的學科范圍越窄。為了清楚醒目,通常分類號的第三位數字后,隔以.,如F279.712,TQ032.4信息檢索的基本知識中國圖書館分類法簡介:中國圖書館分類法(第四版)將圖書資料劃分為五大部類序列,具體如下:
◎馬克思主義、列寧主義、毛澤東思想
◎哲學
◎社會科學
◎自然科學
◎綜合性圖書由于社會科學與自然科學這兩個科學部門的內容很多,發展很快,又各自展開為若干大類,最后在五個基本部類的基礎上,組成22個大類分類號采用漢語拼音字母與數字混合編號制度。
信息檢索的基本知識中圖法簡表:
A
馬克思主義、列寧主義、毛澤東思想、鄧小平理論
B
哲學、宗教
C
社會科學總論
D
政治、法律
E
軍事
F
經濟
G
文化、科學、教育、體育
H
語言、文字
I
文學
J
藝術
K
歷史、地理
N
自然科學總論
O
數理科學和化學
P
天文學、地球科學
Q
生物科學
R
醫藥、衛生
S
農業科學
T
工業技術
U
交通運輸
V
航空、航天
X
環境科學、安全科學
Z
綜合性圖書
社會科學自然科學信息檢索的基本知識
每個類目都用分類號作為標識,每個分類號就代表特定的知識概念,體現這種分類體系的就是圖書分類法(表)。分類法種類很多,比較有影響的有《中國圖書館分類法》(簡稱《中圖法》)、《國際十進制分類法》和杜威分類法等,《中圖法》作為我國文獻分類標引工作的國家標準,被我國圖書情報單位廣泛應用。
信息檢索的基本知識O數理化……………
一級類目
O1數學………
…二級類目
……
O3力學………
…二級類目
O31理論力學………………
…三級類目
O311運動學………………
…四級類目.1質點運動………
…
五級類目
……
O4物理學…
…
二級類目信息檢索的基本知識應用舉例:
利用《中圖法》在《全國報刊索引》中查找有關“建筑抗震設計”方面的相關文獻。第一步:分析課題,按學科屬性屬于“T工業技術”中的“TU建筑科學”大類。
第二步:查《中圖法》確定分類號為:T工業技術—TU建筑科學—TU3建筑結構—TU352.11抗震結構。第三步:根據《全國報刊索引》(科技版)的分類目錄給出的TU3建筑結構的頁次,得到相關文獻。第四步:根據的出處索取原始文獻。信息檢索的基本知識2.主題語言主題檢索是直接以代表文獻內容主題概念的標識作為檢索標識,并按其字順組織起來的一種檢索語言。根據一詞語的選詞原則、組配方式、規范方法,主題語言可分為標題詞語言、關鍵詞語言和敘詞語言。信息檢索的基本知識(1)標題詞語言標題詞語言是以標題詞(規范的事物名稱、名詞術語)作為文獻內容標識和檢索依據的,以詞表預先確定組配方式標引和檢索的主題語言。采用標題詞語言的檢索工具,都有自己的標題詞表。標題詞的主要特征是事先組配,如美國的《工程標題詞表》(SubjectHeadingforEngineering,SHE)就是《工程索引》(TheEngineeringIndex,EI)的配套詞表。標題詞表的作用是對從信息資源中篩選出來的標題詞,從詞義、詞形、詞間關系和用法等方面進行管理和控制。保證一種事物只用一個標題詞表達,一個標題詞只表達一種事物或含義,避免使用過程中的混亂。
信息檢索的基本知識
標題詞語言是一種規范化、先組式的主題語言。一般由主標題和副標題共同構成,其表現形式為“主標題──副標題──副標題”。將所有的主標題集中并以主副標題字順排列成表,即成為文獻標引和檢索用的標題詞表。例如,《中國經濟特區的經濟法》一書,按標題詞表規范化的詞語來標引,其主題標目為“經濟特區”和“經濟法”,“中國”是說明和限定主題內容范圍的副標題。其主副標題組配如下:(1)經濟特區──經濟法──中國;或(2)經濟法──經濟特區──中國。無論以“經濟法”或以“經濟特區”作為檢索入口,都可以查到此書。
信息檢索的基本知識(2)關鍵詞語言以關鍵詞作為文獻內容標識和檢索依據的一種主題語言。關鍵詞選自文獻題目、文摘乃至正文中具有實質意義的詞語,是未經規范化處理的自由詞匯,關鍵詞語言是不受詞表控制的非規范化語言。如美國《化學文摘》(ChemicalAbstracts,CA)的關鍵詞索引(是CA各種索引中使用較多的一種)。信息檢索的基本知識(3)敘詞語言敘詞語言是主題語言的最高級形式。敘詞是從文獻內容中抽取出來的,從概念上不可再分的基本概念單元。敘詞受詞表控制,詞表中詞與詞之間無從屬關系,都是相互獨立的概念單元。檢索時利用這些表達概念單元的敘詞進行組配,以表達一個復雜的概念。敘詞的組配應嚴格遵守組配原則,使之符合概念邏輯,具有檢索意義,避免產生不合概念邏輯的假組配。敘詞語言適用于計算機和手工檢索系統,是目前應用較廣的一種語言。如英國《科學文摘》(ScienceAbstracts,SA)、《El》(93年后)等均采用敘詞語言。
信息檢索的基本知識敘詞語言是一種規范化、后組式的主題語言。后組式由文獻檢索人員按需要自由組配檢索概念,具有很大的靈活性,可充分地發揮主題詞之間的組配作用。
例如:“癌癥”應采用規范的主題詞“腫瘤”。信息檢索的基本知識國內典型敘詞表《漢語主題詞表》《中國中醫藥主題詞表》《地理科學敘詞表》《物理學漢語主題詞表》《數學漢語主題詞表》《教育主題詞表》……信息檢索的基本知識1.3.1信息檢索系統信息檢索系統就是為滿足各種各樣的信息需求而建立的一整套信息的收集、加工、存儲和檢索的完整系統。信息檢索系統由4個基本要素組成:信息資料;技術設備;檢索語言與方法;人員(包括系統管理人員和用戶)。信息檢索系統按信息的存儲和檢索設備可分為手工檢索系統和計算機檢索系統。
1.3信息檢索系統與檢索工具信息檢索的基本知識1.手工檢索系統手工檢索系統是用手工方式來處理和查找文獻的工具或系統,主要是指利用印刷型檢索工具。手工檢索的特點是檢索人員可根據自己的信息需求,邊查邊思考,隨時根據課題內容修改檢索策略,但查閱速度慢、效率低,檢索系統內容更新慢。信息檢索的基本知識2.計算機檢索系統計算機檢索系統是利用計算機檢索存儲于計算機或計算機網絡內的信息資源的一種方式,也是現在發展極其迅速、應用最為廣泛的檢索系統。計算機檢索系統包括聯機檢索、光盤信息檢索以及網絡信息檢索。信息檢索的基本知識(l)聯機檢索系統聯機檢索系統是指信息用戶利用終端設備,通過國際通信網絡與世界上的信息檢索系統進行直接的人機對話,從檢索系統的數據庫中找出所需信息的全過程。聯機檢索是計算機技術、信息處理技術和現代通信技術三者的有機結合。用戶利用檢索終端設備,通過通信線路與檢索系統的中央計算機進行人機對話,直接檢索到所需信息。數據庫的更新速度快、檢索速度快,但費用較高。典型的系統:Dialog、OCLCFirstSeach(OnlineComputerLibraryCenter)聯機計算機圖書館中心,總部設在美國的俄亥俄州
.信息檢索的基本知識OCLCFirstSeach登錄界面信息檢索的基本知識基本檢索界面信息檢索的基本知識
(2)光盤信息檢索系統光盤信息檢索系統是利用光盤數據庫作為信息資源數據建立起來的計算機信息檢索系統,分單機版和網絡版。用戶可通過購買或租用光盤,以較低的價格,不受時間限制地在帶有光盤驅動器的計算機上進行文獻檢索。
20世紀80年代末出現光盤網絡,它使多個用戶能同時檢索同一大型數據庫,共享信息資源。檢索效率得到了很大提高,檢索的費用較低。
信息檢索的基本知識(3)網絡信息檢索系統是指利用計算機設備和國際互聯網(Internet)檢索網上各服務器站點的信息。隨著Internet的發展,各種機構紛紛加入到Internet上,為信息需求者提供各種各樣的信息服務,構成極其豐富的網絡信息資源。網絡信息檢索系統是目前發展最快、最受人們歡迎的信息檢索系統。在互聯網上人們能夠很容易地訪問到文字、圖像和音頻等數字化資源,可檢索到科技、商貿、經濟時事新聞等信息。其特點是信息資源豐富、檢索方便,實現了超文本檢索。信息檢索的基本知識
1.3.2檢索工具1.檢索工具的類型檢索工具是在一次文獻的基礎上,經過加工整理、編輯而成的二次文獻。任何檢索工具都有存儲和檢索兩方面的功能。存儲的廣泛、全面和檢索的迅速、準確是對文獻檢索工具的基本要求。檢索工具按著錄內容劃分,可分為目錄、題錄、文摘、索引和搜索引擎。信息檢索的基本知識
(1)目錄(Catalogue)
目錄是對圖書、期刊或其他單獨出版物特征的揭示和報道。目錄以單位出版物為著錄對象,一般只記錄其外部特征。如題名、著者、出版事項、載體形態等。目錄的種類很多,如國家書目、聯合目錄、館藏目錄等。網絡上的目錄型搜索引擎,如Yahoo(http://hoo.com)它提供一種可供檢索的分等級列出的主題目錄,以超文本鏈接的方式將不同學科、專業、行業和區域的信息按分類或主題目錄的方式組織起來,人們通過主題目錄的指引,逐層瀏覽,查找自己需要的信息。信息檢索的基本知識館藏目錄信息檢索的基本知識
(2)題錄(Title)
題錄是對單篇文獻外表特征的揭示和報道,著錄項目一般有篇名、著者、著者單位、文獻來源、語種等。由于著錄項目比較簡單,因此收錄范圍廣,報道速度快,是用來查找最新文獻資料出處的重要工具。報道題錄的檢索工具的名稱不統一,有的定名為目錄,有的定名為索引,這是因為題錄在形式上和功能上分別與目錄、索引相似的緣故)但就其性質而言,題錄與目錄、索引有著根本的不同。國內外有許多大型的題錄型檢索刊物,我國的《全國報刊索引》、美國的《化學題錄》(ChemicalTitle)等均屬這種類型。信息檢索的基本知識單篇文獻的題錄格式【論文題名】網絡環境下信息檢索與報道服務淺析
【英文題名】InformationRetrievalandReportServiceinNetworkEnvironment
【作者】丁彩云DINGCai-yun
【作者單位】湖南化工職業技術學院,圖書館,湖南,株洲,412004
【刊名】株洲師范高等專科學校學報
【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE
【年卷期】2005Vol.10No.2
【關鍵詞】圖書館;網絡環境;信息搜集;信息檢索;信息報道
信息檢索的基本知識
(3)文摘(Abstract)
文摘是以精練的語言把文獻信息的主要內容、學術觀點、數據及結構準確地摘錄下來,并按一定的著錄規則與排列方式編排起來,供用戶使用的一種檢索工具。文摘在國外的檢索刊物中常用的詞有Abstract、Digest、Summary、Quotation等,在我國通常稱之為文摘、摘要、內容提要等。文摘是二次文獻的核心,以單篇文獻為報道單元,不僅著錄文獻的外表特征,還著錄文獻的內容特征。根據文摘的目的與用途,文摘可劃分為指示性文摘和報道性文摘。信息檢索的基本知識
①指示性文摘(IndicativeAbstracts):文摘內容比較簡單,一般在100字左右,簡明扼要地介紹文獻的主題范圍、研究方法、結論、用途等。不涉及具體的技術內容,以使讀者對文摘內容不產生誤解為原則,故有人也稱之為簡介②報道性文摘(InformationAbstracts):是對原文內容的高度濃縮,報道原文的論點、方法、設備、結論、具體數據等,一般在200一300字左右。其內容詳細具體,客觀而無評論,故有時可代替通閱原文。這類文摘對于不懂原文語種及難以獲得原文的科技人員尤為重要。信息檢索的基本知識
(4)索引(Index)
索引是對一組信息集合的系統化指引。索引一般只起指引特定信息內容及存儲地址的作用,是根據一定的需要,把特定范圍內的某些重要文獻中的有關款目或知識單元(如書名、刊名、人名、地名、語詞等),按照一定的方法編排,并指明出處,為用戶提供文獻線索的一種檢索工具。索引作為一種附屬性的檢索工具廣泛應用于各種檢索工具或數據庫中,索引的類型是多種多樣的,在檢索工具中常用的索引類型有篇名索引、引文索引、分類索引、主題索引和著者索引等,其中以主題索引、著者索引使用最多。信息檢索的基本知識
(5)搜索引擎(Engine)
搜索引擎是網絡環境中的一套信息檢索系統,它是一種利用網絡自動搜索技術,對各種Internet信息資源進行標引,并為網上檢索者提供檢索的工具。它通常有兩種不同的工作方式:一種是分類目錄型的檢索,把]Internet中的資源收集起來,由其提供的資源的層層推進,尋找到自己想要的信息;另一種是基于關鍵詞的檢索,用戶可以用邏輯組合方式輸人各種關鍵詞,搜索引擎根據這些關鍵詞尋找用戶所需資源的地址,然后根據一定的規則反饋包含此關鍵字詞信息的所有網址和指向這些網址的鏈接,為人們提供信息檢索服務。信息檢索的基本知識2.檢索工具的一般結構一種完整的檢索工具一般由5部分組成,
(1)使用說明:為使用者編寫的必要指導。一般包括編制目的、收錄范圍、著錄格式、代號說明及注意事項等,使用前要認真閱讀。(2)目次表:檢索工具的正文一般都按分類組織編排,因此前面都有詳簡不等的目次表作為分類查找文獻的依據。(3)正文:檢索工具的主體部分:存儲在檢索工具中的內容不是原始文獻,而是描述文獻外表特征與內容特征的著錄條目。著錄后的每篇文獻都有一個固定的序號以與其他著錄項目相區別,這個序號稱為文摘號或順序號。把大量的文獻著錄條目按一定的規則(一般是分類)組織起來,就構成了檢索工具的正文。信息檢索的基本知識
(4)輔助索引:為了迅速、準確、全面地查到所需文獻,僅從分類途徑入手是不夠的,還要有主題、著者、序號等多種途徑,因此索引也就有多種形式。但任何索引都不能單獨存在,它們是依附于正文主體的輔助部分,但它又是檢索工具的關鍵所在,掌握檢索工具的實質就是掌握各種輔助索引的使用方法。(5)附錄:附錄部分主要是使用該檢索工具必須參考的一些內容。例如,引用期刊一覽表、文獻來源名稱縮寫與全稱的對照表、縮略語的解釋以及收藏單位代碼等。信息檢索的基本知識
讀者在學習利用新的檢索工具時,應首先閱讀其使用說明,然后根據所查文獻的隸屬學科或專業,查找目次或分類表,經過瀏覽選中文獻。如果已知主題詞、著者名、機構名或其他代碼(如專利號、科技報告號、化學分子式等),則利用索引到達正文,可迅速、準確地查得所需文獻。信息檢索的基本知識無論是手工檢索方法還是計算機檢索技術,檢索的程序是一樣的,即都是一個經過仔細思考并通過實踐逐步完善查找方法的過程。整個檢索過程通常有以下5個步驟:(1)分析問題(2)選擇檢索方法(3)選擇檢索工具(4)確定檢索入口(5)查找文獻線索以及索取原文
1.4信息檢索的一般程序信息檢索的基本知識1.分析問題首先,將問題分類,有助于確定相應的檢索工具。所有的問題可以分成兩大類。一類是要查找某一特定的文獻或某一主題學科內容相關的文獻,這就要考慮文獻檢索類工具書(二次文獻)。例如,要查找“投資分析”的文章,就要用索引、文摘;要查圖書,就要用書目、館藏目錄以及訪問電子書刊網站、網上書店、電子圖書館等。另一類是查找具體的事實,如統計數據、人名、地址、機構概況、法律條文、術語等,這就要考慮查找三次文獻類工具書,統計年鑒、傳記工具書、機構名錄、手冊、字典、百科全書以及包括這類檢索工具的參考工具類網站。信息檢索的基本知識其次,要分析“已知”和“欲知”。分清哪些是檢索目標,哪些是檢索條件。第三,分析需求的主題內容,所屬學科性質。明確其主題內容,從而提出能準確反映課題核心內容的主題概念;明確檢索的學科范圍,學科范圍越具體、越明確越有利于檢索。第四,分析確定文獻的類型。僅僅指明需要某主題的近期文獻還不夠,因為文獻涉及的類型很多,如報紙、期刊、文集、會議論文、專利等,應弄清需要哪一類文獻。如果屬于基礎理論性探討,要側重于查找期刊論文、會議論文;如果是尖端技術,應側重于科技報告;如果是發明創造、技術革新,則應側重于專利文獻;如果是產品定型設計一,則需利用標準文獻及產品樣本。信息檢索的基本知識最后,選擇合適的文獻檢索時間范圍。確定所需文獻情報的時間范圍是為了使檢索更經濟、快捷、準確。對于需要較多回溯性資料的問題,檢索人員就要確定查找年代的上限和下限,如果是“近期文獻”,那么是近三年的還是限于去年的。當查不到某一特定文獻時,時間的差錯是應該考慮的一個主要原因。信息檢索的基本知識案例:科研課題常見信息需求查找某概念的確切含義:如“什么是ADSL”
查找某概念的背景知識如:“誰最先發現了傳染性蛋白”查找某些事物的數值及量化指標:如“2005年國際無線傳輸的相關標準”查找學科專業領域的新進展:“有關生物信息學計算機模擬算法的綜述文獻”查找專業課題相關的研究文獻;“氨基酸相似性比對算法相關文獻”特征型知識(事實、數值類數據庫、搜索引擎)關聯型知識(文獻數據庫)信息檢索的基本知識
2.選擇檢索方法信息檢索的一般方法如下:
(1)追溯法(引文法)這是一種傳統的文獻檢索方法,即利用參考文獻進行深入查找相關文獻的方法。追溯法包括兩種方法,一種是利用原始文獻所附的參考文獻進行追溯,另一種是利用引文索引檢索工具進行追溯。較為普遍的查法是由近及遠地追溯,即利用文獻后所附的參考文獻逐一追查被引用文獻,然后再從被引用文獻所附的參考文獻目錄逐一擴大檢索范圍,直到滿足要求為止。依據文獻引用與被引用之間的關系獲得內容相關的諸多文獻,這是一種擴大信息來源最簡捷的方法。在檢索工具短缺的情況下,采用此法可獲取一定數量的相關文獻。這種方法適合于歷史研究或對背景資料的查詢,其缺點是越查材料越舊,追溯得到的文獻與現在的研究專題越來越疏遠。信息檢索的基本知識因此,最好是選擇綜述、評論和質量較高的專著作為起點,它們所附的參考文獻篩選嚴格,有時還附有評論。由遠及近地搜尋,即找到一篇有價值的論文后進一步查找該論文被哪些其它文獻引用過,以便了解后人對該論文的評論、是否有人對此作過進一步研究、實踐結果如何、最新的進展怎樣等等。由遠及近地追尋,越查資料越新,研究也就越深入,但這種查法主要依靠專門的引文索引,如《科學引文索引》(SCI)、《社會科學引文索引》(SSCI)。利用引文法高效率地查找文獻的最有用的工具是利用引文索引。
信息檢索的基本知識信息檢索的基本知識信息檢索的基本知識信息檢索的基本知識信息檢索的基本知識引文檢索--從“被引用文獻”(citedpaper)檢索到“引用文獻”(citingpaper)
例:1994年至2003年華羅庚教授的著作被別人引用的情況,并按相關度排序
信息檢索的基本知識最后一頁信息檢索的基本知識被引用文獻中有華羅庚信息檢索的基本知識引文數據庫Webofscience中國科學(社會科學)引文數據庫全文數據庫、文摘數據庫中的引文(參考文獻)字段檢索專業引文數據庫信息檢索的基本知識
(2)工具法又稱常用法,即利用各類檢索系統(工具)查找文獻的方法。根據具體的檢索需要,又可以分為3種類型:①順查法:這是一種依照時間順序,按照檢索課題所涉及的起始年代由遠而近地查找信息的方法。這類方法適合于檢索內容復雜、時間較長、范圍較廣的理論性或學術性的課題。此法查全率高,但耗時費力,效率較低。②倒查法:這是一種由近及遠、由新到舊地逆著時問順序檢索信息的方法,即以查準查新為主。此法多用于檢索新課題或有新內容的老課題,及對某課題研究已有一定基礎,需要了解其最新研究動態的檢索課題。此法節省時間,效率較高。③抽查法:這是一種依據信息提問的特定需求,根據某學科發展的實際情況抽出學科的發展興旺時間段進行檢索,以達到采用較少的時間獲得較多文獻的檢索方法。使用此法必須熟悉該學科的發展歷史,否則很難達到理想的結果。信息檢索的基本知識
(3)交替法交替法就是把引文法和常規法結合起來查找文獻的方法:即先利用常規檢索工具找出一批有用文獻,然后利用這些文獻所附的引文進行追溯查找,由此獲得更多文獻。按照引文規律,有價值的文獻在發表后最初幾年(例如五年)內被引用的次數較多,但以后趨于減少。因此,追溯的年期應予限制。跳過追溯的那幾年再用常規檢索工具查出具有新價值的文獻,然后再根據所附參考文獻追溯查找,并依次進行第三次或多次循環,直到獲得的文獻符合要求為止。信息檢索的基本知識
3.確定檢索工具檢索工具種類繁多,必須有針對性的加以選擇。選擇檢索工具的原則,主要有以下幾點:
(1)其存儲內容是否廣泛,標引深度如何。
(2)提供的檢索途徑是否方便有效。(3)報道的時差如何。(4)還要注意專業特點,選擇專業對口的檢索工具。
(5)同時還要注意利用綜合性檢索工具。信息檢索的基本知識4.確定檢索入口檢索途徑往往不止一種,使用者應根據“已知”信息的特征確定檢索人口。文獻的特征分為外表特征(題名、著者、序號等)和內容特征(分類、主題、關鍵詞),因此文獻檢索的入口途徑,也分成如下兩方面。
(1)以所需文獻的外表特征為依據①題名途徑:即指根據已知的書名、刊名、篇名按字順排列規則在工具書中查找所需文獻的途徑。使用的工具如圖書書名目錄、期刊刊名目錄等,有時由于文獻的篇名較長,檢索者難以記憶,加之按名稱字順編排,造成相同內容的文獻分散,不能滿足族性檢索的要求。②著者途徑:即指以著者姓名為檢索詞查找文獻的途徑,多數檢索工具都有著者索引和機構索引等,這類索引均按著者姓名字順排列和檢索,故使用方便。
信息檢索的基本知識③序號途徑:即指按號碼順序如報告號、專利號、標準號、入藏號查找文獻的途徑。使用這種途徑多見于查找專利、科技報告、政府文獻和從文號查找檔案文件。(2)以所需文獻的內容特征為依據①分類途徑:按照文獻主題內容所屬的學科體系和事物性質進行分類編排所形成的檢索途徑。通過分類號來進行檢索。使用這一途徑必須了解學科分門別類的體系,并將文字概念轉換成分類檢索標識,在轉化分類號的過程中,由于受專業知識和分類方法的影響,常發生錯誤,造成漏檢和誤檢,影響檢索結果。
信息檢索的基本知識②主題途徑:是根據文獻主題內容提取主題詞,按字順將其排列起來,通過主題索引檢查文獻的途徑。常用的主題索引有標題詞索引、關鍵詞索引、敘詞索引等。主題途徑直接以詞或詞組作為檢索詞,表達概念比較準確、靈活,可隨時增補、修改,以便及時反映學科新概念,另外主題途徑能滿足特性檢索的要求,適合于查找比較具體、專業的課題資料。主題途徑是最常用的檢索途徑,但主題途徑的缺點是它要求使用者必須具備較高的專業知識、檢索知識和外語水平。以上所述的各種檢索途徑中,分類途徑和主題途徑是最常用的檢索途徑。分類途徑適合于族性檢索,主題途徑適合于特性檢索。兩者相互配合則會取得較好的檢索效果。其他途徑都是輔助性的檢索途徑。信息檢索的基本知識選擇檢索入口提供題名或關鍵詞、題名、關鍵詞、作者、刊名、第一作者、分類號、文摘、機構、任意字段等十個檢索入口。信息檢索的基本知識5.查找文獻線索和獲取原始文獻上述步驟完成之后,即可通過檢索工具具體的查找了,在各種檢索工具中,能查到的實際上是所需文獻的線索,下一步就是要利用館藏目錄或聯合目錄獲取原文,但是獲取原文并非易事,特別是外文文獻。原文獲取率的高低同館藏有關,但也與獲取方法有關。在開始獲取原文前,要注意掌握獲取原文的必要信息和獲取原文的途徑。信息檢索的基本知識(1)文獻類型的識別中文檢索工具常使用期刊、專利、會議、圖書、標準等標識區別不同的文獻類型。西文檢索工具中文獻類型的區分則主要依據各種文獻所特有的標識來識別,具體如下。①圖書:著錄的特征除書名、著者外,還有出版社、出版地、出版年、ISBN號等。例如:
Thisbookcontains…publbyApplSciPublLtd.London,Engl,1998,372pApplSciPublLtd出版機構;London,Engl,1998,372p——出版地點、文種、年份和圖書頁數。信息檢索的基本知識
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一年級語文下冊 第三單元 語文園地配套教學設計 新人教版
- 七年級語文上冊 第三單元 11《禮物》教學設計 冀教版
- 三年級道德與法治上冊教案(部編版)
- 人教部編版六年級下冊魯濱遜漂流記第一課時教案
- 九年級體育 第17周 第34次課教學設計
- 六年級下科學教案飛速發展的信息技術-青島版
- 七年級信息技術上學期 第十二課畫圖軟件使用技巧 教學設計
- 2024兵器裝備集團中國長安春季校園招聘筆試參考題庫附帶答案詳解
- 九年級物理上冊 11.1怎樣才叫做功教學設計 (新版)粵教滬版
- 三年級數學上冊 二 千克和克第1課時 認識千克教學設計 蘇教版
- 2025年全國國家版圖知識競賽(中小學組)題庫及答案
- 汽車租賃行業自駕租車免責聲明書
- 激光切割機項目可行性分析報告(模板參考范文)
- 2025年春季四年級下冊語文第15課《白鵝》課件(統編版)
- 劍橋國際少兒英語一級unit-7-Wild-Animal
- 課題申報參考:深化產業工人隊伍建設改革研究
- GB/T 45211.7-2025小麥抗病蟲性評價技術規程第7部分:蚜蟲
- 新時代青年傳承和弘揚傳統文化研究
- 杜邦分析體系下瀘州老窖公司盈利能力研究11000字
- 2024-2030年中國天然滋補品行業市場深度分析及投資戰略規劃建議報告
- 2025年中國鹽業股份有限公司招聘筆試參考題庫含答案解析
評論
0/150
提交評論