信息檢索基礎_第1頁
信息檢索基礎_第2頁
信息檢索基礎_第3頁
信息檢索基礎_第4頁
信息檢索基礎_第5頁
已閱讀5頁,還剩62頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

信息檢索基礎

信息檢索是指將信息按一定的方式

和規律排列存儲,并針對讀者特定

需求查找出所需文獻信息的過程和

技術。它包括信息存儲與信息檢索

兩個過程。

第一節工具書概述

參考工具書(數據和事實檢索)

工具書《

I檢索工具(文獻線索檢索)

■事實檢索——以確定的數值性數據(如人體生

理檢測指標、各種統計數字等)或具體的知識、

事實(如人物資料、專業術語等)為對象的檢

索。事實檢索為用戶提供的是所需知識的本身。

-線索檢索——指以某一課題、某一著者或某一

事物的相關文獻(如圖書、期刊、論文、專利

文獻、會議資料等)為對象的檢索。線索檢索

為用戶提供的只是所需文獻的線索。

■一、參考工具書

■㈠定義

■簡稱工具書。是根據人們各種需要,廣

泛收集一定范圍內的有關理論、術語、

圖表、數據等知識內容,按照一定的方

法加以編排,專供查閱的專類圖書。

■㈡特點

■1.易檢性

■2.知識性

■3.資料性

■㈢作用

-1.提供權威資料

-2.解答數據問詢

-3.掌握學術進展

㈣結構與編排

■1.結構

■參考工具書的一般結構,大體上可分為

三大部分即文前欄目、正文、和書后附

屬部分。

2.排檢方法

「形序法

「字順法,音序法

1號碼法

「分類法

類序法,

I主題法

I自然順序法

■㈤類型

■1.字典、詞(辭)典

T釋文字的形、音、義及其用法的參考工具書

稱為字典,如《說文解字》、《漢語大字典》

等。

■解釋詞語的概念、意義及其用法的參考工具書

稱為詞(辭)典,如《漢語大詞典》、《牛津

英漢大詞典》等。

■2.百科全書

■百科全書是概述人類一切門類或某一門類知識

完備的工具書。它包羅萬象,涉及人類一切知

識領域。

■如綜合性的百科全書《中國大百科全書》、

專業性的百科全書《中國醫學百科全書》

等。

?3.年鑒

■年鑒是匯集某一年內重大新聞、事件、數

據統計資料并按年度出版的工具書。如

《中國百科年鑒》、《中國經濟體制改革

年鑒》、《中國中醫藥年鑒》等。

■4.手冊

■手冊是一種匯集某一范圍內基礎知識的

基本數據、表格、圖形,并配有簡要文

字說明為主的工具書。如《機械設計手

冊》、《世界飛機手冊》、《中藥制劑

手冊》等。

■5.名錄

■名錄是提供有關專名(人名、地名、機

T布等)簡要資料的工具書。

■如《中國企事業名錄》、《國際名人錄》

等。

■6?類書

■類書是輯錄古代文獻中的史實典故、儷

詞駢語、詩賦或名物制度等原始資料,

按類或按韻編排,專供查閱古代資料的

參考工具書。

■如《永樂大典》。

■7?綜述

■綜述是對一個時期內某一學科或專題的

研究成果和文獻資料進行歸納、分析、

綜合,經整理而成的概述性資料。

■如《建國40年中醫藥科技成就》、《國

內外中醫藥科技進展》等。

■二、檢索工具

■㈠定義:

■用于報道、存貯和查找文獻線索的工具

稱為檢索工具。

■檢索工具應具備四個基本條件:

1.詳細記錄文獻的外表特征和內容特征。

2.具有既定的檢索標識。如主題詞、分類號、

著者姓名和文獻序號等。

3.根據標識的順序,系統地、科學地排列組織

文獻,使其成為一個有機的整體。

4.提供廣泛的信息來源,有多種檢索途徑。

■㈡功能

-1.存貯文獻信息

-2.檢索文獻信息

-3.報道文獻信息

■㈢類型

■根據著錄方式不同,檢索工具主要分為:

■⑴目錄

■又稱書目。是圖書或其他單獨出版的資料的內

容系統化的記載或主要內容的揭示,以整本書

或整本刊形式報道的檢索工具。

■有國家書目、書刊出版目錄、館藏目錄、聯合

目錄、專題文獻目錄等。

■⑵題錄

■題錄是在目錄的基礎上發展起來的,報

道和揭示單篇文獻的外表特征的檢索工

具。它與目錄的主要不同之處是各自的

著錄對象不同,目錄以單位出版物為著

錄對象,而題錄是以單篇文獻為著錄對

象。

■⑶索引

■是將書籍、期刊等相關文獻中所刊載的

論文題目、作者、主題、人名、地名、

名詞術語、分子式、參考文獻等摘錄出

來,按照一定的方法編排,并指明出處

的一種檢索工具。

■⑷文摘

■文摘是系統著錄、報道、積累和揭示文

獻外表特征和內容特征的檢索工具。其

結構與內容及出版發行方式都類似于題

錄,只是增加了論文的內容摘要。

■㈣檢索工具的質量評價

■1.收錄范圍

-2.檢索途徑

-3.著錄標準

■4.信息質量

-5.信息密度

■6.時差

、檢索工具與參考工具書的區別

名稱檢索對象編制報道時限用戶

參考工具書事實或數據不連續無廣泛

檢索工具文獻檢索連續有集中

■第二節檢索語言和檢索系統

■一、檢索語言

■1.定義

■檢索語言是從自然語言中精選出來的一整套詞

匯、符號,用以對文獻內容和信息特征進行概

括和規范,是文獻的標引系統,也是讀者檢索

使用的一種符號系統,是檢索工具和參考工具

書的重要組成部分。

■檢索語言須具備三個基本要素:

■①有一套專用字符來構建詞匯

■②有一定數量的基本詞語用來表達基本概念

■③有一套專用語法規則,用嚴格的句法手段和

詞法對詞匯進行控制,以準確表達各種各樣的

概念。

■檢索語言的實質都是表達一系列文獻內容的概

念及其標識系統,只是在表達各種概念及其關

系時的方式和方法不同,才形成了各種類型的

檢索語言。常見的檢索語言類型有:語詞型檢

索語言、分類型檢索語言、代碼型檢索語言等。

■本節主要介紹分類語言和主題語言。

■2.分類語言

■分類語言是指以數字、字母、或數字與字母結

合作為基本字符,以基本類目為基本詞匯,以

類目的從屬關系來表達概念間相互關系的一類

檢索語言。

■分類就是以學科分類為基礎,按照概念劃分的

原理,將知識要領從具體到一般、從簡單到復

雜、從低級到高級逐級劃分,每劃分一次就形

成一批并列的下位概念,它們同屬于一個被劃

分的上位概念。

-(1)《中國圖書館分類法》

■①簡介

《中國圖書館分類法》(原名《中國

圖書館圖書分類法》,簡稱《中圖法》)

其主要內容由基本大類、簡表、詳表和

通用復分表四大部分組成。

基本部類有五個:

c馬克思主義、列寧主義、毛澤東思想、鄧小平

理論

哲學、宗教

社會科學

自然科學

【綜合性圖書

I基本大類:

-基本大類多為獨立學科,或由相關密切

的學科組成,它是整個分類法的骨架,起

著承上啟下的作用,反映整個分類法的分

類概貌。在五個基本部類的基礎上,組成

22個基本大類(一級類目),用22個大

寫英文字母作為類號標識。

■簡表:

■簡表是在基本部類的基礎上根據圖書

資料的特點,進一步劃分出來的基本大

類,主要為第一、二級類目。

R21中醫預防.、衛生學

■A馬克思主義、列寧主義、毛澤東思想、鄧小平理論R22中醫基礎理論

■B哲學、宗教R1預防醫學、衛生學R24中醫臨床學

■C社會科學總論R2中國醫學_________R25中醫內科

《溫政治、法律

R3基礎醫學R26中醫外科

K經濟R4臨床醫學R271中醫婦產科

■G文化、科學、教育、體育R5內科學R272中醫兒科

-H語言、文字R6外科學R273中醫腫瘤學

■I文學R71婦產科學R274中醫骨傷科

■J藝術R72兒科學R275中醫皮膚科

■K歷史、地理

R73腫瘤學R276中醫五官科

-N自然科學總論

R74神經病學與精神病學

■0數理科學和化學R277中醫其他學科

■P天文學、地球科學R75皮膚病學與性病學R278中醫急癥學

-Q生物科學R76耳鼻咽喉科學R28中藥學

-R醫藥、衛生----------R77眼科學R289方劑學

■S農業科學R78口腔科學R29中國少數民族醫學

■T工業技術

R79外國民族醫學

■U交通運輸

-V航空、航天R8特種醫學三級類目([6)

■X環境科學、安全科學R9藥學

■Z綜合性圖書

■一級類目(22)二級類目(17)

■詳表:

■詳表由各級具體類目組成,是分類法的主

體,也是文獻分類標引和分類檢索的依據,在

結構和內容上是由簡表擴展而成,詳表之中,

類目間排列按照一定的原則,反映了學科間的

聯系。

■通用復分表:

■包括總論復分表;世界地區表;中國地區

表;國際時代表;中國時代表;世界種族與民

族表;中國民族表;通用時間、地點表。

■通用復分表是對詳表的補充,是對具有共

性的類目的進一步補充說明。

■②《中圖法》的醫學、中醫藥學類目

■從上面的簡表中可以看出,“R醫藥、衛生”

為醫學類的一級類目,下分工7個二級類目,

“R2中國醫學”是其中的一個類目,其下又

設有16個三級類目。三級類目下面又分四級

類目,分類語言就是從總論到各級,從一般到

具體,越分越詳細。

■R醫藥衛生

■R2中國醫學

■R28中藥學

■R282中藥材

■R282.5藥材鑒定

>R282.7各類藥材

>R282.71植物藥

■R醫藥衛生

-R5內科學

-R54心臟、血管(循環系)疾病

-R541心臟疾病

-R541.1先天性心臟血管病

>R541.2風濕性心臟病

-⑵分類語言的優缺點

■優點:

■①分類法能反映學科體系的特點,對于熟悉本

專業學科結構的用戶來說,十分方便;

-②由于在分類法中同類文獻聚集在一起,有利

于檢索同一學科或同一專業的文獻。

-③在檢索中分類法的分級類目上下位關系明確,

所以能夠靈活地擴大或縮小檢索范圍。

■①分類法對于邊緣學科、交叉學科的文獻較難

處理;對于新學科、新概念和新技術難以做出

及時反應;

■②在檢索中分類法對于同一類文獻檢索方便,

但對于特性檢索則不是很方便。如檢索某種藥

物的臨床應用,那么就要通過各個學科進行檢

索,才能獲得全面的檢索資料。

■3.主題語言

■用于表達文獻主題內容的詞語標識系統。

?主題詞

■是經過規范化處理的標準詞匯,也稱受控詞匯。

這是主題詞有別于自然詞語的關鍵所在。(專

指性強)

■關鍵詞

-是指從文獻的正文、摘要或題名中抽出的,在

表達文獻主題上具有關鍵作用的名詞術語。

(自然語言、專指性不高)

■⑴《中國中醫藥學主題詞表》簡介

■《中國中醫藥主題詞表》是中國中醫研究院

中醫藥信息研究所編輯出版,供中醫藥人員使

用的專業主題詞表,初版于1987年,1996年修

訂再版。

■該詞表充分反應了中醫藥學古代、現代以

及相關學科的科學用語,不但適合用于處理現

代中醫藥學文獻,而且適用于處理我國古代中

醫學文獻;不但能充分表現中醫藥的學術特色

和理論體系,而且能與現代醫學體系相兼容。

■《中國中醫藥主題詞表》包括專題副主題詞表、

專題副主題詞樹形結構表、編目副主題詞表、

出版類型,中醫藥學主題詞字順表(又稱主

表)、中醫藥學主題詞表樹形結構表(又稱范

疇表)及中醫藥學主題詞表附表:醫學家姓名

表。書后還附有相關索引表。

■在中醫藥學主題詞表中所收錄的全部主題詞按

漢語拼音順序排列,每個正式主題詞的著錄項

目有:

■①漢語拼音

■②中文名稱

-③英譯名或拉丁文名

■④樹形結構號

■⑤注釋與參照系統

■主要由字順表、樹形結構表和副主題詞表所組

成。

■①字順表

■又稱主表,共收錄主題詞5806個,入口詞1131個,

均按漢語拼音字順排列。

主題詞的著錄格式:

@qanhuoshangyan

②肝火上炎

③LIVER-FIREFLAMING-UP

④TC23」0.:L0,:L5?25?25?:L5.:L5

TC23.10.10.20.10.40.15

TC23.10.35.20.15.15

TC23.10.65.15.20.15

⑤屬實火;屬里實;屬肝系證候;肝經氣火上逆所

表現的證候;

生理狀態下的肝火用肝陽

95;工987?1994月干火亢盛

用肝火亢盛檢索工995前文獻

C肝陽上亢

D肝火亢盛

入口詞的著錄格式:

xinxiatong

心下痛

Y胃院痛

loujianfeng

漏肩風

Y肩凝癥

caoshanhu

草珊瑚

Y九節茶

■②樹形結構表

■又稱范疇表,按照中醫藥學科體系,將全部5806

個主題詞劃分為14個大類和59個子類,顯示了主

題詞之間的屬分關系。

■樹形結構表明確顯示了主題詞之間的上、下位

關系及屬分關系,是文獻標引和檢索時選用專

指主題詞的重要工具,也便于用戶從學科角度

選用主題詞,并可用于擴大或縮小檢索范圍。

■證候體征和證候TC23+

■證候TC23.10+

■八綱證候TC23.10.10+

■寒熱證候TC23.10.10.15+

■熱證TC23.10.10.15.25+

■火證TC23.10.10.15.25.25+

■實火TC23.10.10.15.25.25.15+

■肝火犯肺TC23.10.10.15.25.25.15.10

■③副主題詞表

■共收錄副主題詞93個,其中82個為《MeSH》表

的副主題詞,H個為中醫藥學專用副主題詞。

■在檢索中,副主題詞要和主題詞組配使用,目

的在于對主題詞加以限定,縮小檢索范圍,以

便對某一主題詞下的某一部分文獻進行族性檢

索。

■bingyinxue

■病因學

■etiology

■ET,etiol

■[C,F3,TC,(TC24除外)TF3]

■與疾病主題詞組配,表明致病原因,如

微生物等病原體,以及起致病作用的環境、社

會因素和個人習慣,也包括發病機理。

(1966)

■⑵主題語言的優缺點

■優點:

■①專指性強,適于特性檢索;

■②可跨學科、跨專業檢索,利于查檢新知識、

新概念;

■③具有很強的組配性、靈活性,廣泛用于計算

機檢索。

■缺點:

■①主題詞的選擇有一定的難度,順經一定的訓

練方能掌握;

■②對于一些內容復雜的課題,組配較難,容易

漏檢。

4.主題語言與分類語言的比較

⑴主題語言以主題詞為標識,具有直觀性,專指性

強,適于特性檢索;可跨學科或跨專業檢索;

利于查“新”;組配性強。

⑵分類語言以學科體系分類號為標弓I,強調隸屬

性,利于族性檢索;檢索同一學科或同一專業

的文獻;通過上下位詞的選擇,可擴大或縮小

檢索范圍。

八檢索系統

>1.手工檢索系統

-2.計算檢索系統:

-脫機檢索系統

-聯機檢索系統

■光盤檢索系統

-網絡檢索系統

第三節檢索原理、方法、途徑和步驟

■一、檢索原理

■信息檢索的本質是讀者對信息的需求與

信息集合的比較與選擇,即匹配的過程。

也就是采用一定的檢索手段,選擇不同

的檢索入口(即文獻標識),檢索出

(命中)相關信息的過程。

■各種檢索系統的檢索原理基本相同。簡

單地講,就是檢索提問標識與存儲在檢

索工具中的標引標識進行比較,兩者一

致或信息標引的標識包含著檢索提問標

識,具有該標識的信息就從檢索工具輸

出,輸出的信息就是檢索命中的信息。

信息存儲與檢索原理流程圖

信息存儲信息檢索

]----------------------

信息源讀者需求

I

選擇收集檢索提問

1

概>念分析卜系統詞表卜f概念分析

]

索引標識檢索標識

1數據錄入.-------------.提問輸入1

k檢索工具

檢索結果

、檢索方法

■1.常用法

■「順查法(以檢索課題的起始年代為起點,按時間順序由

遠及近地查找)

■I倒查法(與順查法相反,是一種由近及遠地查找的方法)

■I抽查法(是針對學科發展特點,抽出其發展迅速、發表文

獻較多的一段時期,逐年進行檢索的一種方法)

■2.追溯法

■3.分段法

■4.瀏覽法

、檢索途徑

■「外表特征一著者姓名、書名、刊名、

<號碼等途徑

I內容特征一分類號、主題詞、關鍵

詞、分子式等途徑

1?分類途徑:是按照文獻信息主題內容所屬學科類別來進行檢

索的一種途徑。

2.主題途徑:是依據文獻資料內容的主題進行文獻檢索的途

徑。

3.關鍵詞途徑:按照關鍵詞的字順,進行檢索的途徑。

4.題名途徑:根據文獻的題名(書名、刊名、篇名)等進行文獻

檢索的途徑。

5?著者途徑:用文獻的著作者、編者、譯者的姓名或機構團體

名稱編制而成的檢索途徑,用來檢索特定的個人或團體所產生的

文獻。

6?序號途徑:序號途徑是按照文獻信息出版時所編的號碼順序

來檢索文獻信息的途徑。

7.分子式途徑:這是以化學物質的分子式作為檢索標識來檢索

文獻信息的一種途徑。

8.弓I文途徑:引文途徑是從作者途徑去檢索引用該作者著作的有

關文獻,它不僅反映了某個作者歷年來發表了哪些文獻,而且也

反映了該作者的每篇文獻又被哪些作者引用,從而又發表了哪些

文獻。

四、檢索步驟

-1.分析研究課題,明確檢索目的和要求

-2.選擇檢索工具和檢索方法

-3.確定檢索途徑和檢索標識

■4.查找

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論