文獻檢索第一章_第1頁
文獻檢索第一章_第2頁
文獻檢索第一章_第3頁
文獻檢索第一章_第4頁
文獻檢索第一章_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章文獻檢索概述

【目的要求】1掌握與文檢有關的基本概念。2.知道文獻的類型。3.掌握機檢原理、類型、途徑與方法、檢索語等。4.能據檢索課題編制檢索策略,能據檢索結果計算查全率和查準率。【教學內容】1.知識、信息、情報、文獻、文獻檢索的概念2.文獻的分類3.機檢的原理、類型、途徑與方法、檢索語第一部分與文獻檢索有關的概念1.信息2.知識3.情報4.文獻5.文獻檢索唐《全唐詩》收有許渾寄遠詩:兩葉愁看愁不開,獨含惆悵上層臺。碧云空斷雁行處,紅葉已凋人未來。塞外音書無信息,道傍車馬起塵埃。功名待寄凌煙閣,力盡遼城不肯回。

五代李中《碧云集》暮春懷故人詩:池館寂寥三月盡,落花重疊蓋莓苔。惜春眷戀不忍掃,感物心情無計開。夢斷美人沉信息,目穿長路依樓臺。瑯殲繡假安可得,流水浮云共不回。南宋陳亮梅花詩“欲使春信息,不怕雪埋藏。”1.信息按來源分:無機信息、生物信息和社會信息;按認識論分:物質信息(又稱自然信息)和觀念信息(又稱精神信息);按知識門類分:哲學信息、自然科學信息和社會科學信息。信息是物體存在方式或運動狀態(tài)以一定的形式自我表征的信號。2.知識知識是人腦意識的產物,是經過人腦加工系統(tǒng)化了的信息。科學家錢學森對“情報”的解釋,“情報就是為了解決一個特定的問題所需要的知識英國情報學家布魯克斯認為:“情報是使人原有的知識結構發(fā)生變化的那一小部分知識”。我國情報學家嚴怡民教授認為:“情報就是作為交流對象的有用的知識”。3.情報情報具有三個基本屬性:知識性、傳遞性、有用性。常用定義:“文獻乃是指用文字、圖形、符號、聲波、視頻等技術手段記錄人類知識的一種載體,或稱其為固化在一定物質載體上的知識。”(摘自嚴怡民主編:《情報學基礎》)。構成文獻的兩個要索:一是一定的知識內容。二是用以記錄知識的物質載體。4.文獻信息、知識、情報、文獻的關系:

情報文獻知識信息大腦流動的、有用的固化在載體上5.文獻檢索運用一定的知識和技能,從眾多文獻中查找出所需的特定文獻資料,或從特定文獻中查找出所需的內容。這種行為或過程叫做文獻檢索。第二部分文獻的分類一、按載體形式劃分:手寫型文獻:印刷型文獻:

又稱“印刷品”。以紙張為存貯介質,以印刷為記錄手段生產出來的文獻。縮微型文獻:是一種以感光材料為存貯介質,以縮微照相為記錄手段產生的文獻形式。機讀型文獻:計算機可以識別(閱讀)的文獻。以磁性材料為載體,以打字、穿孔或光學字符識別裝置為記錄手段,并通過計算機處理而產生的文獻。如MARC磁帶。視聽型文獻:

二、按加工層次劃分(教材8頁)零次文獻;一次文獻;二次文獻;三次文獻。(零次文獻:指未經過任何加工的原始文獻,如實驗記錄、手稿、原始錄音、原始錄像、談話記錄等。零次文獻在原始文獻的保存、原始數據的核對、原始構思的核定(權利人)等方面有著重要的作用。)三、按出版形式劃分(教材6頁)圖書[M]——Monograph;連續(xù)出版物(期刊[J]——journal

、報紙[n]——Newspaper等);特種文獻(會議文獻、政府出版物、學位論文、研究報告、專利文獻、標準文獻、檔案文獻等)參考文獻類型及其標識是從出版形式劃分文獻類型的,詳細材料見bb平臺-外部鏈接-2012年畢業(yè)論文寫作規(guī)范(參考文獻)

參考文獻類型及其標識——從出版形式劃分文獻類型

1.根據GB3469規(guī)定,各類常用文獻標識如下:①期刊〔J〕②專著〔M〕③論文集〔C〕④學位論文〔D〕⑤專利〔P〕⑥標準〔S〕⑦報紙〔N〕⑧技術報告〔R〕⑨析出文獻〔A〕

2.電子文獻載體類型用雙字母標識,具體如下:①磁帶〔MT〕②磁盤〔DK〕③光盤〔CD〕④聯(lián)機網絡〔OL〕3.電子文獻載體類型的參考文獻類型標識方法為:〔文獻類型標識/載體類型標識〕。例如:①聯(lián)機網上數據庫〔DB/OL〕②磁帶數據庫〔DB/MT〕③光盤圖書〔M/CD〕④磁盤軟件〔CP/DK〕⑤網上期刊〔J/OL〕⑥網上電子公告〔EB/OL〕以上字母均為相應英文單詞的縮寫。

四、按學科內容劃分(中圖法)《中國圖書館分類法》(中圖法)共分5個基本部類、22個大類。采用漢語拼音字母除L.M.W.Y四個字母以外的22字母與阿拉伯數字相結合的混合號碼。用一個字母代表一個大類,以字母順序反映大類的次序,在字母后用數字作標記以區(qū)分小類。詳細材料見bb平臺-課程文檔:《中圖法》;教材53頁這些分類號反應文獻的內容特征,學科歸屬。我們將在后面的“文獻特征-內容特征”處還講解。注意:在實際工作中多數人用英文字母來拼讀。五、按檢索形式劃分手檢——紙質文獻;機檢——數字文獻。復習重要知識點1.哪些文獻分別屬于一、二、三次文獻(按教材掌握)2.概念:零、一二三次文獻3.從出版形式談報紙與期刊的異同。4.參考文獻類型標識碼[M]……5.《中圖法》用拼音字母所表示的22類圖書《中圖法》以22個漢語拼音字母表示的22類圖書:ABCDEFGHIJK(LM)NOPQRSTUV(W)X(Y)Z參考文獻類型專著論文集報紙文章期刊文章學位論文報告標準專利文獻類型標識M

CNJDRSP

對專著、論文集中的析出文獻,其文獻類型標識建議采用單字母“A”;對其他未說明的文獻類型,建議采用單字母“Z”。第三部分計算機檢索概說(教材第四章)一、機檢概念二、機檢文獻的特征三、機檢的基本原理四、機檢的基本步驟上機實踐一、機檢(計算機信息檢索)概念1.機檢的出現:

傳統(tǒng)的檢索手段是手工檢索(manualretrieval)。

即以手工翻檢的方式,利用工具書(包括圖書、期刊、目錄卡片等)來檢索信息的一種檢索手段。自20世紀80年代以來,以縮微品、聲像帶、磁盤、光盤等形式記錄的非紙信息急劇上升,伴隨計算機進入多媒體時代、信息科技也步入多媒體發(fā)展時期,手工檢索靠“手翻、眼看、大腦判斷”的檢索方式已難以全面適應當今信息的發(fā)展,計算機信息檢索必然地提到了應用與發(fā)展階段。90年代以來以Internet為代表的全球性網絡的實際應用更進一步推動了這一發(fā)展,這既是對手工檢索的擴展,也是信息時代的需要。2.信息檢索:(InformationRetrieval):指將信息按一定的方式組織和存儲起來,并根據信息用戶的需要找出有關信息的過程,所以它的全稱又叫“信息的存儲與檢索(InformationStorageandRetrieval)——廣義信息檢索。信息是物體存在方式或運動狀態(tài)以一定的形式自我表征的信號。狹義信息檢索(InformationSearch):僅指該過程的后半部分,即從信息集合中找出所需要信息的過程,相當于人們通常所說的信息查尋3.計算機信息檢索:概念:指以計算機技術為手段,通過光盤和聯(lián)機等現代檢索方式進行信息檢索的方法。與手工檢索一樣,計算機信息檢索應作為當今科技人員的一項基本功。美國將交互網絡檢索專家作為未來十大熱門職業(yè)之一。4.機檢與手檢的異同項目手檢機檢總體特征手翻、眼看、大腦判斷策略、查尋、機器匹配標引及索引特點檢索點較少檢索點較多檢索時間較慢較快檢索要求專業(yè)知識、外語知識、檢索工具知識

專業(yè)知識、外語知識、機檢系統(tǒng)知識查全查準率查準率較高查全率較高綜合效率較低較高文獻特征與文獻的關系(板書)

主題特征:主題詞、關鍵詞等分類特征:分類號外表特征:標題、作者、作者單位、專利號、報告號等模糊對應(族性檢索)精確對應(精確檢索)

文獻文特征獻內容特征二、機檢文獻的特征(一)外表特征:題目、作者、作者工作單位,專利和科技報告還有專利號(羅宇翔、張婧姝所發(fā)明的產品專利號上cnki檢索)或報告號等,這些可以表征一篇特定文獻的特征,可以在文獻的封面或扉頁,即不打開書本,或不看文獻的具體內容就可以確定一篇文獻。(書:如教材;論文:如:可用數據庫的期刊論文)(二)內容特征1.文獻的主題特征一般,一篇文獻中與論題相關的詞出現頻率較大。據研究在文獻中出現的頻率既不高也不低的詞,在文獻中約3-20個之間,這些詞恰恰是與文獻的主題相關度較大的詞,我們稱之為文獻的主題詞或關鍵詞。主題詞或關鍵詞表征文獻的主題特征,文獻主題特征與文獻的關系可圖示如下:文獻主題特征與文獻的關系圖

主題詞與關鍵詞的區(qū)別與聯(lián)系(教材54頁)區(qū)別:關鍵詞:指文獻題名乃至正文中出現的能表達文獻信息內容的重要語詞,是一種未經規(guī)范的自然語言。如《中國大百科全書》后附的“內容索引”。主題詞:能表達、描述文獻主題,并經過優(yōu)選、限定內容涵義的自然語言。如各種《漢語主題詞表》中的術語。主題詞較關鍵詞反映文獻內容更明確,同時由于排除了使用同義詞、近義詞的可能,因而也保證了文獻的查全率并大大節(jié)省文獻檢索的時間。因此提倡使用主題詞來描述文獻的主題。聯(lián)系:二者均是能表達、描述文獻主題的名詞術語。小結:正因為關鍵詞或主題詞能表征特定文獻的主要內容,所以我們檢索時可從關鍵詞或主題詞角度入手族性檢索特定主題下的文獻。操練:一般的由于作者對自己的文獻較熟悉,在具體操作時關鍵詞或主題詞均由作者本人給出。練習:(1)能從一篇文獻(論文)的關鍵詞或主題詞,大致概括該論文的主要內容。(2)能給自己閱讀理解后的論文提煉出關鍵詞或主題詞。(1)類案例:據關鍵詞概括文獻(論文)的內容題名:馬王堆醫(yī)書中的新興量詞作者:西南師范大學文獻所張顯成關鍵詞:

馬王堆醫(yī)書新興量詞發(fā)展演變提問:從已知的三個關鍵詞思考該文獻的主要內容……內容提要:

具有豐富的量詞是漢語的一大特點(也是漢藏語系諸多語言的特點),研究漢語的量詞具有重要意義。馬王堆醫(yī)書是口語性很強的文獻,內中有很多量詞,為我們研究先秦兩漢的量詞提供了極其寶貴的材料。其量詞中最有價值的是那些新興量詞,共有13個。這些新興量詞帶給我們的信息很豐富,既刷新了我們對這些量詞產生時代的認識,又使我們認識了漢語量詞家族中還有我們原來未曾認識的新成員,還可使我們藉之弄清這些量詞發(fā)展演變的情況。所以,馬王堆醫(yī)書中的這些新興量詞具有重要的研究價值。(1)類案例如:“從語言與文化的關系角度審視歷屆春晚”(浙江工商大學徐敏)通過“語言;文化;春晚;年度主題;年度流行語

”5個關鍵詞的組合就可大致表示這篇文獻的主要內容……。【摘要】語言與文化的關系極為密切,二者是共生共存的。而詞匯作為語言中最為積極活躍的部分,具有可塑性強、折射度高、創(chuàng)新性優(yōu)的特點,被喻為社會文化的鏡子,能更為直接地反映出一定時期社會和文化的發(fā)展。從語言與文化的關系角度,選取表現主題時代化、表現手段生活化、表現領域全面化、表現思想權威化的歷屆春晚為剖析素材,可以發(fā)現,歷年春晚主題定位彰顯一脈相承的中華主流價值觀念、反復著重塑造和頌揚的意象映射出中華兒女共有的樸素情感、年度主題和年度流行語又具有深深的年度烙印。又如:“《老學庵筆記》版本源流考”(漢語言09校級優(yōu)秀論文獲得者任艷)

通過“《老學庵筆記》;陸游;版本源流”3個關鍵詞組合可大致標識這篇文獻的主要內容……摘要:《老學庵筆記》,是南宋著名詩人陸游晚年完成的筆記體作品,書中或記載逸聞趣事,或考訂詩文,間采民間傳說,多為作者親見親歷親聞之事,記事嚴謹,涉及內容豐富,具有較高的文學、文獻及史料價值,是眾多宋人筆記中的佼佼者。本書在作者生前并未刊印,是于宋理宗紹定元年(公元一二二八年)由其子子遹將它與作者的其它遺稿一起刻印,共十卷,此陸氏家刻本為唯一的宋本。明代以后,《老學庵筆記》的各種版本相繼出現。而關于《老學庵筆記》版本問題的研究,目前學術界主要集中在版本內容特別是刻本內容的揭示,對廣義“版本”視域下的不同類型的版本內容及源流關系,研究薄弱,不利于今人從不同角度評判選擇善本。本文基于前人研究上的問題,著力于《老學庵筆記》刻本、新版古籍、數字版本及域外版本的內容及源流關系,豐富新時期版本研究的內容,最終為不同需求的讀者提供善本。(2)類案例:據文獻(論文)內容提煉關鍵詞題目:考證《山海經》的醫(yī)藥學性質作者:天津中醫(yī)藥大學07漢語言張亞麗

內容摘要:就《山海經》是一部什么性質的文獻,學者爭論激烈,不少人認為《山海經》是一部地理學或歷史學方面的書籍,更有人認為它是神話類或小說類的文學書。本文在前人研究基礎上,基于《山海經》中的藥物學、醫(yī)學知識的完整考察與分類,以及《山海經》與同時代醫(yī)藥書籍相似性比較,試圖揭示《山海經》一書的醫(yī)藥學性質,為人們多方面利用該文獻提供幫助。提問:……關鍵詞:山海經;藥物學;醫(yī)學(文獻性質)題目:門、中、天三字的文化淺析——從經絡腧穴穴位命名角度研究漢字文化(淺析腧穴名中“門、中、天”字的文化鏡像功能)作者:天津中醫(yī)藥大學04漢語言柏林內容摘要:漢字中凝結著中華民族豐富的文化。本文通過計算機軟件對針灸經絡常用穴位用字進行數據統(tǒng)計,并分別在經絡腧穴穴位命名用字的不同使用頻率上抽取出“門、中、天”三個字為研究對象,進而從中國傳統(tǒng)文化的角度和經穴定義的角度來分析“門、中、天”三個字的文化涵義,尋求出漢字在經絡腧穴穴位命名與中國傳統(tǒng)文化聯(lián)系中的鏡像功能。研究結果表明“門、中、天”三個字在經穴上的釋義與中國傳統(tǒng)文化中的門俗觀念、中和中庸的處世之道、天人合一的哲學思想有著密切的聯(lián)系,印證了漢字對中國傳統(tǒng)文化的鏡像作用。提問:關鍵詞:漢字;門俗;中和;天人合一;腧穴

題目:從語言學角度看中醫(yī)“脈”字的流變(【分類號】H12;R22)作者:天津中醫(yī)藥大學04漢語言周超

內容摘要:本文利用小學文獻和相關中醫(yī)古籍,對中醫(yī)“脈”字進行了形音義考察,勾勒出“脈”字形音義的發(fā)展變化情況。得出如下結論:第一,“脈”字的字形嬗變規(guī)律是:由溫(日應為目)①到??,由??到衇,由衇到脈,由脈到脈,且這個過程中一直存在不同字形之間的混用及假借等情況。第二,脈字醫(yī)學上的含義由血脈等逐漸演變出脈象、脈搏,甚至診脈等含義。此外,還有經脈、氣脈等含義并行;非醫(yī)學脈字的含義先有條理、脈絡、連貫等含義,后出現一特殊的“脈脈不得語”之義。而脈字這兩方面意思的流變都是以《說文解字》中該字本義“血理分衺行體者”為基礎的。第三,脈字發(fā)音在南朝梁時為莫革切,唐宋變?yōu)槟@切,明代又變?yōu)槟浊校疫@期間在某些地域脈字還有別的讀音。

①溫(日應為目):見《足臂十一脈灸經》,文物出版社注釋說:“從目從??而略有省變,應即眽字,在本篇中讀為脈,和帛書《陰陽十一脈灸經》甲本假眽為脈是一樣的。溫(日應為目)字也見于《古璽文字徴》附錄所收戰(zhàn)國璽印,可能是戰(zhàn)國古文的一種寫法。”提問……關鍵詞:脈;語言學;中醫(yī);流變操練:(1)由分類號,不讀正文推測論文的學科內容。(2)體會為什么從分類號可以查找特定類的文獻。思考:從中醫(yī)文獻的分類談中醫(yī)學的學科交叉性案例:見bb-課程文檔-文獻的分類特征以及H、R類文獻的細目2.文獻的分類特征

——中圖法(見bb-課程文檔-中圖法中國圖書分類法(第5版)A馬克思主義、列寧主義、毛澤東思想、鄧小平理論B哲學、宗教

B0∕1哲學理論∕世界

B2∕3∕4中國∕亞洲∕非洲哲學

B5∕6∕7歐洲∕大洋州∕美洲哲學

B80∕81思維科學∕邏輯學(論理學)

B82∕83∕84∕9理學(道德學)∕美學∕心理學∕宗教

C社會科學總論

C0∕1∕2社會科學理論與方法論∕社會科學現狀、概況∕機關、團體、會議

C3∕4∕5∕6社會科學研究方法∕教育與普及∕叢書、文集、連續(xù)XXX性出版物∕社會科學文獻參考工具書

C7∕8∕91∕92∕93檢索工具書∕統(tǒng)計學∕社會學∕人口學∕管理學

C94∕95∕96∕97系統(tǒng)科學∕民族學∕人才學∕勞動科學

D∕E∕F政治、法律∕軍事∕經濟G文化.科學.教育.體育

G0∕1文化理論∕世界各國文化與文化事業(yè)

G2∕3信息與知識傳播∕科學、科學研究

G4∕8教育∕體育H語言、文字

H0∕1∕2語言學∕漢語∕中國少數民族語言

H3∕4∕5常用外國語∕漢藏語系∕阿爾泰語系

H61∕62∕63南亞∕達羅毗荼語系∕南島語系

H64∕65∕66∕67東北亞諸語言∕高加索∕烏拉爾∕阿非羅-亞細亞語系XXX(閃-含語系)

H7∕81印歐∕非洲諸語系

H83∕84∕9∕美洲諸∕大洋州諸語言∕國際輔助語I文學

I0∕1∕2文學理論∕世界文學∕中國文學

I3——7各國文學J藝術

J0∕1∕2∕29∕3∕4藝術理論∕世界各國藝術概況∕繪畫∕書法、篆刻∕雕塑∕攝影藝術

J5∕59∕6∕7工藝美術∕建筑藝術∕音樂∕舞蹈

J8∕9戲劇藝術∕電影、電視藝術

K歷史、地理

K0∕1∕2∕3∕4∕5∕6史學理論∕世界史∕中國史∕亞洲史∕非洲史∕歐洲史∕大洋州史

K7∕81∕85∕89美洲史∕傳記∕文物考古∕風俗習慣

K9地理

N自然科學總論

N0——6同社會科學總論相應處

N7自然科學文獻檢索工具

N79∕8自然科學非書資料、視XXX聽資料∕自然科學調查、考察

N91∕94∕99自然研究、自然歷史∕系統(tǒng)科學∕情報學、情報工作

O數理科學和化學P天文學、地球科學Q生物科學R醫(yī)藥、衛(wèi)生

R1∕2∕3∕4預防醫(yī)學、衛(wèi)生學∕中國醫(yī)學∕基礎醫(yī)學∕臨床醫(yī)學

R5∕8∕9各科醫(yī)學及外國民族醫(yī)學、特種醫(yī)學∕藥學

S農業(yè)科學T工業(yè)技術U交通運輸V航空、航天X環(huán)境科學、安全科學

Z綜合性圖書

Z1∕2∕3∕4∕5∕6∕8叢書∕百科全書、類書∕辭典∕論文集、全集、選集、雜著∕年鑒、年刊∕期刊、連續(xù)性出版物∕圖書目錄、文摘、索引

H0語言學(更詳者見bb-課程文檔)H0-0語言理論與方法論

H0-05語言與其他學科的關系

H0-06語言學派、學說及其研究

H0-09語言發(fā)展史與語言學史

H002語言規(guī)劃

H003語言的分類

H004語言的分布

H01語音學

H02文字學

H03語義、語用、詞匯、詞義學

H030語義學、語用學

H031基本詞匯

H032同義詞、多義詞、反義詞

H033熟語

H034俗語

H035外來語

H039詞源學H04語法學

H041構詞法

H042詞類

H043句法H05寫作學與修辭學

H059翻譯學

H06詞典學

H07方言學

H08應用語言學H09語文教學……H1漢語(更詳者見bb-課程文檔)H1漢語

H11語音

H12文字

H13語義、詞匯、詞義(訓詁)

H14語法

H15寫作、修辭

H159翻譯

H16字書、字典、詞典

H17方言

H19漢語教學

H2中國少數民族語言H3常用外國語

H31英語

H32法語

H33德語

H34西班牙語

H35俄語

H36日語……H9國際輔助語文獻主題特征與分類特征的區(qū)別與聯(lián)系(教材55頁)參見bb-課程文檔-試談分類法與主題法的異同與文獻信息主題內容沒有關系或關系不大的信息稱為文獻信息的外表特征,例如,著者、著者單位、期刊名稱、專利說明書的專利號、政府報告的報告號等。與文獻信息主題內容密切相關的信息稱為文獻信息的內容特征。文獻信息內容特征主要有各種形式的主題詞和分類號。文獻內容特征與外表特征的區(qū)別與聯(lián)系小結:文獻特征與文獻的關系

主題特征:主題詞、關鍵詞等分類特征:分類號外表特征:標題、作者、作者單位、專利號、報告號等模糊對應(族性檢索)精確對應(精確檢索)

文獻文特征獻內容特征復習重要知識點:1概念:手檢、機檢2理解:(1)手檢機檢異同(2)文獻特征與文獻的關系(3)關鍵詞與主題詞的區(qū)別聯(lián)系、(4)文獻主題特征與分類特征的區(qū)別與聯(lián)系3操練:(1)會據論文提煉關鍵詞,會據關鍵詞概括論文主要內容(2)就H類圖書能據分類號知道圖書的學科內容屬性;能據圖書的學科內容屬性知道它的分類號。

(一)檢索系統(tǒng)(二)檢索技術及其運用(三)檢索策略及其設計(四)檢索效果的評價三、計算機檢索的基本原理(一)機檢系統(tǒng)的結構1.題錄2.文摘3.索引1.題錄題錄題錄是所有的檢索系統(tǒng)都應具備的基本內容,它包括文獻標題、作者、作者工作單位、發(fā)表時間、文獻來源(期刊、會議、專利等)

——幫助獲取原文2.文摘報道性文摘(informativeabstract)是原文內容的濃縮,信息量大,參考價值高,一般長200-300字,有的可達500字。

概略地指出原文的主題范圍、目的和方法,一般不包括具體內容,適用于篇幅長、內容散的文章。一般長100字。它只起解題作用,故又稱“解題性文摘”或“簡介”。(上舉周超論文摘要的兩個版本能體現兩類摘要的區(qū)別)有文摘員個人的看法,其價值主要取決于文摘員的水平。由于評論性文摘有違于文摘的客觀性標準,因而現在已極少采用。概念:摘要(abstract),也稱文摘,是對一篇文獻的內容作的簡略準確的描述。評論性文摘(criticalabstract)指示性文摘(indicativeabstract)報道-指示性文摘分類:3.索引檢索系統(tǒng)中的索引是指按文獻的特征(外表、內容)依一定的次序將文獻(通常以文摘號)排列起來的目錄,通過它可以得到相關的文摘。按索引款目索引可分為:主題詞索引、關鍵詞索引、分類號索引、作者索引、作者工作單位索引、各種號碼索引:如專利號索引小結:檢索系統(tǒng)表文獻描述項索引

外表描述項題錄:文摘號、題目、作者、作者單位、文獻來源、發(fā)表時間等作者索引、號碼索引(專利號、報告號等)……內容描述項文摘(Abstract)主題詞索引、關鍵詞索引、分類號索引……(二)檢索技術及其運用1.邏輯組配2.截詞技術3.限制技術:詞位限制、檢域限制4.檢索技術的運用

1.邏輯組配:布爾邏輯組配是現行計算機檢索的基本技術,主要通過“和(and,*)”、“或(or,+)”、“非(not,-)”等將檢索詞聯(lián)絡起來,對A、B兩詞而言其邏輯含義如下:

and,*:AandB如:PBLand

文獻檢索or,+

:AorB如:王叔和or《脈經》not,-:AnotB如:馬王堆醫(yī)書not

五十二病方

2.截詞技術:截詞包括后截、中截、前截等。在DIALOG系統(tǒng)中,用?作為截詞符,主要包括下列情形:

符號意義實例?后截斷,中截一字符computer?;wom?n

又如:張燦?,裘?圭

??后、中截二字符act??;

又如:裘??

???后、中截三字符computat????computer:前截符——?燦玾

3.限制技術:

(1)詞位限制可以是相鄰若干詞,在同一句(段)(全文)中的位置關系,DIALOG系統(tǒng)所用位置算符:A(nW)B

:表示A、B兩詞相隔n詞且前后次序不變,符合檢出要求;n=1時即A()BA(nN)B:表示A、B兩詞相隔n詞且前后次序不限,符合檢出要求;n=1時即(N)BA(s)B:表示A、B兩詞只要在同一字段中就符合檢出要求(2)檢域限制可針對特定年代、特定類別、特定檢索點等作限制,包括前綴限制符和后綴限制符。對DIALOG系統(tǒng)而言,前綴限制符例如:

AU=限查特定作者

JN=限查特定刊名

LA=限查特定語種

PN=限查特定專利號

PY=限查特定年代后綴限制符例如:

/TI限在題目中查

/AB限在文摘中查

/DE限在敘詞標引中查4.檢索技術的運用

(1)非專業(yè)檢索時檢索技術的運用

——以Cnki中的高級檢索界面為例(要求會操作)(2)專業(yè)檢索時檢索技術的運用

——以Cnki中的專業(yè)檢索界面為例(要求能理解)

注意:在http:///鏈接處現場演示復習:操練:主要的3種類型摘要的表達方式。檢索技術的運用(三)檢索策略及其設計檢索策略是對檢索的全面策劃,在操作上主要指數據庫的選擇和檢索式的編制,前者取決于現有的數據庫資源,后者則反映檢索目標。編制和調整檢索策略的一般程序是:1.據檢索要求確定檢索詞和截位、詞位關系等檢索技術;2.據檢索技術組配成式;3.在所選數據庫中實施檢索;4.據檢索參數評價檢索效果;5.據評價結果調整優(yōu)化檢索式,直到符合檢索要求。(四)檢索效果的參數查全率(Recallfactor,簡稱R)查準率(也稱適中率Pertinencyfactor,簡稱P)漏檢率(Missionfactor,簡稱M)誤檢率(也稱檢索噪音,Noisefactor,簡稱N)新穎率檢索速度

圖1.4文獻總量與檢出文獻之間的關系

n為檢索系統(tǒng)中文獻總量B為m中與檢索課題有關的文獻量(檢準文獻量)

a為n中與檢索課題有關的文獻量m為檢索輸出的文獻量令R表示查全率、P表示查準率、M表示漏檢率、N表示誤檢率,則R、P、M、N定義如下:查全率(R)指的是檢出的相關文獻量(B)與系統(tǒng)文獻庫中相關文獻總量(a)的比率,它反映該系統(tǒng)文獻庫中實有的相關文獻量在多大程度上被檢索出來。公式如下:R=B/a*100%

查準率(P)指的是檢出的相關文獻量(B)與檢出文獻量(m)的比率,是衡量信息檢索系統(tǒng)檢出文獻準確度的尺度。公式如下:

P=B/m*100%

M=(1-B/a)*100%=100%-RN=(1-B/m)*100%=100%-P最理想的檢索效果是M、N均為0,即R、P均為100%

實驗表明:R和P之間存在相反的相互依賴關系,即提高R會降低P,反之亦然。

圖1.5檢索特性曲線

提高查全率(R

)的具體措施:bb-外部鏈接-“怎樣提高文獻檢索的查全率”。新穎率和檢索速度可定義如下:

能檢出的最近單位時間內發(fā)表的文獻量

新穎率=───────────×100%

最近單位時間內發(fā)表的文獻總量

檢索輸出的文獻量(m)檢索速度=───────────

檢索所用時間(t)檢索策略的調整案例:例1:“《文獻檢索》課的PBL(problem-basedlearning

)教學”這一課題檢索策略的制定與調整:1.分析檢索要求與檢索詞:要求檢索出《文獻檢索》課程采用PBL這種教學方式的研究情況,涉及檢索詞:文獻檢索(信息檢索、??檢索)、PBL(problem-basedlearning

、基于問題式的教學)2.策略一:檢索途徑:主題;檢索式:(PBL)*??檢索4.在cnki總庫中實施檢索,得到32條檢出文獻(時間2012年10月8日)5.分析檢出文獻(m):從題目、關鍵詞、摘要等方面分析檢出文獻是否符合檢索要求,并判斷R

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論