第一章 文獻信息檢索基礎_第1頁
第一章 文獻信息檢索基礎_第2頁
第一章 文獻信息檢索基礎_第3頁
第一章 文獻信息檢索基礎_第4頁
第一章 文獻信息檢索基礎_第5頁
已閱讀5頁,還剩163頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章文獻信息檢索基礎第一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室2個人信息姓名曹濤部門信息檢索教研室職稱講師手公室圖文信息中心312郵箱ntcaot@163.com第二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室3你能做到嗎???一、去圖書館借一本圖書:陳沛.搜商[M].北京:清華大學出版社,2006.二、找一篇期刊論文,并閱讀全文:袁銀男,許楨英,劉會霞,王勻.完善實踐教學體系強化創新能力培養[J].實驗室研究與探索,2010,(4).三、找一本外文期刊,并瀏覽其上面的論文:

ChemicalEngineeringJournal

(化學工程雜志)四、找一篇你所學專業的博士論文,并閱讀全文。五、找一些有關“安全旅行包”的專利,并閱讀全文。六、選一個你專業上的問題,并就此問題寫一篇綜述報告。第三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室421世紀的必備能力基本學習技能(指讀、寫、算)信息素養(經濟、高效、合法地獲取、利用、交流信息)創新思維能力人際交往與合作精神實踐能力——美國教育技術CEO論壇2001年第4季度報告第四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室5★什么是文獻信息檢索?簡單地講,文獻信息檢索就是利用各種檢索工具去查找自己所需要的文獻,并利用這些文獻信息的過程。第五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室6★為什么要進行文獻信息檢索?為什么要開設文獻信息檢索課?①撰寫畢業論文②提高信息素養③科學研究④獨立學習,終身學習第六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室7課程性質本課程是我校的一門公共必修課,是一門以文獻信息及其相關檢索系統的特點與使用方法為研究對象,旨在培養學生的信息素養,提高在信息化、網絡化環境中進行自主性、創造性學習的能力的方法學課程。第七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室8課程特點和學習方法1.實踐性強注重實習課2.課程基礎英語+專業知識+計算機操作基礎3.課程教學內容的再鞏固多實踐第八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室9課程安排第一周、文獻信息檢索基礎、網絡信息資源檢索(3)第二周、文獻信息檢索基礎、事實與數據型信息資源(3)第三周、上機實習(3)第四周、常用中文文獻信息資源(3)第五周、上機實習(3)第六周、常用外文文獻信息資源、特種文獻信息資源、學位論文撰寫指導(3)第七周、上機實習(3)第八周、卷面考查(3)第九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室10課程教學方法與程序教材:現代信息檢索與利用教程教學:課堂實時多媒體教學考核:作業與考試30%(平時成績)+70%(考試成績)第十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室11如何有效利用圖書館館藏書目—圖書館借書—委托借還—預約—續借

—新書通報——圖書薦購

—查詢電子資源(超星、讀秀等)

—聯合目錄——館際互借—原文傳遞數字資源—全文

—原文傳遞第十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室12第十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室13第十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室14第十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室15第十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室16第十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室17第十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室18第十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室19第十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室20第二十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室21第二十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室22第一章文獻信息檢索基礎一、信息素養教育二、信息、知識、情報、文獻三、信息資源四、信息檢索第二十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室231.1信息素養教育信息素養的概念信息素養的內容信息素養的特點信息素養教育介紹信息素養的能力標準大學生開展信息素養教育的必要性第二十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室24★信息素養(信息素質)就是能夠判斷何時需要信息,懂得如何獲取信息,以及如何評價和有效利用所需信息的一系列能力的總和。—ALA,1989

信息意識信息知識信息能力信息道德第二十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室25★信息意識:包括對信息具有敏銳的感受力、對信息具有持久的注意力和對信息具有深刻的判斷力。★信息知識:包括傳統的信息素養、信息的基本知識和現代信息技術知識。★信息能力:包括信息捕捉獲取能力、信息分析鑒別能力、信息處理加工能力和信息交流表達能力。★信息道德:指在信息活動中,人們所必須要遵守的社會法律規范和行為準則。★信息素養的四個要素共同構成一個不可分割的統一整體。信息意識是先導,信息知識是基礎,信息能力是核心,信息道德是保證。第二十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室26高校學生應具備的信息素養的6個一級指標:★確定所需信息的范圍★有效地獲取所需的信息★鑒別信息及其來源★將檢出的信息融入自己的知識基礎★有效地利用信息去完成一個具體的任務★了解利用信息所涉及的經濟、法律和社會問題,合理合法地獲取和利用信息

——美國大學和研究圖書館協會(ACRL)特別工作組,2001.1批準,2004.1月全美大學圖書館協會正式通過第二十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室271.2信息、知識、情報、文獻★信息是指客觀世界中各種事物的存在方式和它們的運動狀態的反映,也就是客觀世界一切事物的存在和運動所能發出的各種信號和消息。第二十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室28★知識是人們對客觀事物存在和運動規律的認識,是人們在改造客觀世界的實踐中積累起來的認識和經驗的總和。第二十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室29★情報是為了解決一個特定問題所需要的知識和信息,是激活了的知識。第二十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室30★文獻是在存儲、檢索、利用或傳遞記錄信息的過程中,可作為一個單元處理的,在載體內、載體上或依附載體而存儲有信息或數據的載體。簡單講,文獻是記錄有知識的一切載體。第三十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室31信息知識情報文獻第三十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室32★文獻的類型:(1)文獻按知識依附的載體及記錄方式可分為:寫刻型文獻印刷型文獻縮微型文獻聲像型文獻電子型文獻第三十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室33★寫刻型文獻:是指以手寫或雕刻為主要手段,主要以自然物、紙張為信息記錄載體文獻。

如筆記、書信、會議記錄、甲骨文獻、泥版文獻等。第三十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室34★印刷型文獻:又稱紙質型文獻,是指以印刷技術為主要手段、主要以紙張為信息記錄載體的文獻。具有便于閱讀和流傳等優點。

如紙質圖書、期刊等。第三十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室35★縮微型文獻:是以感光材料記錄信息的一種載體。具有存貯密度高,體積小,傳遞和保存都很方便等優點。

如縮微膠卷、縮微膠片等。第三十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室36★聲像型文獻:又稱視聽型信息,是一種記錄聲音、圖像信息的載體。具有直觀真切,形象生動等優點。

如磁帶、錄音帶、錄像帶等。第三十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室37★電子型文獻:又稱機讀型文獻、數字型文獻。具有存貯密度高,自動存取速度快、原有記錄可以改變、抹去或更新等優點。

如電子圖書、電子期刊等。第三十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室38(2)文獻按出版形式分為:圖書期刊特種文獻(非書非刊文獻)第三十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室39★圖書(Book):指內容比較成熟、資料比較系統、有完整定型的裝禎形式的非連續性出版物,如教科書、專著、工具書等。不少于49頁,有書名、作者、ISBN,有版權保護。

ISBN:國際標準書號。如:978-7-81123-556-2

參考文獻格式---于光.科技信息資源與網絡檢索[M].哈爾濱:哈爾濱工業大學出版社,2001.第三十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室40第四十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室41★期刊(Journal):是指有固定名稱、定期或不定期出版、匯集了多位著者論文的連續出版物。期刊一般都有固定的刊名。ISSN:國際標準刊號(國際標準連續出版物號)。

CN:國家統一刊號。

參考文獻格式---陸權.沐舒坦糖漿臨床療效隨機對照研究[J].臨床兒科雜志,2007,21(1):50-52.第四十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室42微波輔助氯化物發生-原子熒光光譜法測定水樣中的痕量砷

第四十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室43★特種文獻:指出版形式、發行渠道比較特殊的文獻資料,介于圖書與期刊之間。包括:學位論文(博、碩士)會議文獻專利文獻標準文獻

……第四十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室44★學位論文(Dissertation):高等學校或研究院所的學生在導師指導下從事某一學術課題的研究,為獲得某種學位而撰寫的學術性較強的研究論文。

參考文獻格式---黨建武.神經網絡方法求解組合優化問題的研究[D].成都:西南交通大學,1996.

基于空殼納米金顆粒的電化學傳感器研究第四十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室45★會議文獻(conference):是指在各種學術會議上宣讀或交流的論文、報告以及討論記錄、會議紀要等。會議文獻多數以會議錄的形式出現,也有部分在期刊上發表。會議文獻是專業領域最新研究成果報道的一種主要方式。

參考文獻格式---孟憲政.種苜蓿養奶牛加快傳統農業向現代農業的轉變[C].第三屆中國奶牛發展大會論文集,2008:429-430.

脫油瀝青溶劑熱合成蠕蟲狀碳材料第四十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室46★專利文獻(Patents):是指記錄有關發明創造信息的文獻,蘊涵著技術信息、法律信息和經濟信息。

狹義的專利文獻指各國專利局出版的專利說明書。

參考文獻格式---姜錫洲.一種溫熱外敷藥制備方案[P].中國:881056078,1989-07-26.第四十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室47第四十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室48★標準文獻(Standards):指由專門委員會制定,經過公認權威機構或國家行政主管部門批準的一套具有法定約束力的規范化文獻。標準分為:國際標準、區域性標準、國家標準、專業標準、地方標準和企業標準。

參考文獻格式---GB/T5795-1986.全國文獻工作標準化技術委員會第七分委員會[S].北京:中國標準出版社,1986.第四十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室49第四十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室50課堂練習姚蕾.體育隱蔽課程論[D].北京:北京體育大學,2000.江山野.簡明國際教育百科全書課程[M].北京:教育科學出版社,1991.張華.走向課程理解,西方課程理論新進展[J].全球教育展望,2001,12(7).黃猛,柳賀.動態聯盟合作伙伴選擇的混沌搜索方法[C].中國控制與決策學術年會論文集,2006.第五十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室51(3)文獻按對信息加工深度的不同將文獻分為:零次文獻一次文獻二次文獻三次文獻第五十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室52★零次文獻:指未經發表和有意識處理的最原始的文獻。

如工程樣圖、新聞稿、私人筆記、個人書信等。第五十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室53★一次文獻:即原始信息,是指記錄原始的創造,即首次記錄科研成果,新技術,新知識,新發明,新見解的文獻。

如期刊論文、學位論文、科研報告、專利文獻、會議文獻等。第五十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室54第五十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室55★二次文獻:也稱檢索工具,是在一次文獻的基礎上加工、整理而形成的,用來提供一次文獻的檢索線索。

如書目、文摘、題錄、索引等。如圖書館館藏目錄、大學生推薦書目、全國新書目、WebofScience(科學引文索引)、BIOSISPreviews(生物學文摘)第五十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室56第五十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室57第五十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室58★三次文獻:在一次文獻、二次文獻的基礎上,分析綜合歸納信息后,組織形成具有資料性、查考性、閱讀性的文獻。

如綜述、工具書、百科全書、調查報告、事實數據庫等。第五十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室59第五十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室60

從一次文獻到二次文獻、三次文獻,是知識與信息從無序到有序的結構化、系統化的過程。一次文獻是文獻的基本形式,是檢索的對象;二次文獻是對一次文獻的加工處理,是檢索一次文獻的工具;三次文獻則是對一次文獻與二次文獻組織、加工、綜合的結果,既可以是檢索的對象又可以是檢索的工具。第六十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室611.3信息資源自習第六十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室62★1.4信息檢索1.4.1信息檢索概念、類型1.4.2信息檢索原理、語言1.4.3信息檢索途徑、方法1.4.4信息檢索技術、策略、效果第六十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室631.4.1信息檢索概念、類型★信息檢索:廣義上是指將信息按一定的方式組織和存儲起來,并根據信息用戶的需要找出有關信息的過程和技術,全稱為“信息存儲與檢索”(InformationStorageandRetrieval)。第六十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室64狹義上是指信息的有序化識別和查找的過程,即人們根據特定的信息需求,采取科學的方法,應用專門的工具,從浩瀚的信息海洋中迅速、準確地獲取所需信息的過程(InformationRetrieval)。第六十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室65按檢索對象的性質來看,可分為:★文獻檢索(狹義)如“微電子封裝產業現狀與趨勢”如“范疇數據類型(CDT)構造的基本原理”★數據檢索如“2005年國際無線傳輸的相關標準”★事實檢索如“什么是ADSL”

如“誰最先發現了傳染性蛋白”第六十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室66檢索過程信息存儲文獻信息內容信息特征信息檢索用戶信息需求分析信息特征標引標引信息檢索語言輸入

輸入信息檢索系統輸出檢索結果檢索標識提問標識分析第六十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室67外部特征內容特征信息排序外部特征內容特征字順時序地序分類主題信息檢索(查找)檢索語言信息組織(存儲)信息描述信息標引信息整序匹配1.4.2信息檢索原理、語言第六十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室68★信息組織:為了方便人們檢索、獲取信息,將大量、龐雜、無序的信息進行系統化和有序化的過程。第六十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室69★信息描述:對文獻、信息的外部特征進行分析、提取,然后對這些特征加以規范化的記錄。第六十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室70外部特征主要有:責任者(作者、編者、譯者等,機構)題名(篇名、刊名、書名、文件名等)版本(出版者、時間、版次、格式)標識(ISBN、ISSN、專利號、URL等)。。。。。。第七十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室71★信息標引:對文獻的內容信息進行分析,并充分而有效地予以揭示的過程。第七十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室72內容特征主要有:學科(分類號)主題(主題詞、關鍵詞等)描述內容(摘要、目次、附注)分子式、基因序列、公式專有名詞、全文、文中字詞句。。。。。。第七十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室73★信息整序:將信息集合中的信息按一定的規則有序地組織起來。整序方法主要有:分類、主題、字順、時序、地序、號碼法等。第七十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室74★每個特征都是一個信息單元,一條記錄由若干個信息單元組成,若干個記錄組成一個信息集合,將一個信息集合中的所有記錄按一定順序排列就完成一個整序過程。第七十四頁,共一百六十八頁,編輯于2023年,星期四序號書名作者出版社出版時間ISBN分類號主題詞1現代信息查詢與利用趙靜科學出版社20047-03-013626-8G252.7情報檢索、高等學校、教材2人文社科信息檢索與利用教程沙振江江蘇大學出版社2007978-7-81130-003-1G252.7社會科學、情報檢索、高等學校3大學英語語法李玉璞山東大學出版社20037-5607-2207-5H314英語、語法、自學參考資料4圖像處理宋學巖人民郵電出版社20027-115-10509-XTP391.41圖形軟件第七十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室76信息檢索語言★信息檢索語言是為建立信息檢索系統而創建的專門用來描述信息內容特征、外部特征和表達檢索提問的一種人工語言,是連接信息存儲和信息檢索兩個過程中標引人員和檢索人員的橋梁。第七十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室77信息檢索語言描述內容特征的檢索語言描述外部特征的檢索語言主題語言分類語言代碼語言題名責任者編號第七十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室78分類語言★分類語言是按信息資料內容的學科知識屬性或事物性質分門別類來系統標識和組織信息資料,并用分類號和相應的分類款目表達文獻主題概念的方法。第七十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室79★中圖法《中國圖書館分類法》廣為全國公共圖書館和信息研究所等機構采用,是我國通用的綜合性圖書資料分類法,現使用第五版(2010.09)。第七十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室80★《中圖法》中的標記符號采用漢語拼音字母與阿拉伯數字相結合的混合制號碼,用一個字母表示一個大類,以下的各級類目用數字或字母加數字表示。《中圖法》共分五大部類,22個大類,每個大類下分若干小類。第八十頁,共一百六十八頁,編輯于2023年,星期四★五部類,22大類馬克思主義、列寧主義、毛澤東思想、鄧小平理論……A馬克思主義、列寧主義、毛澤東思想、鄧小平理論哲學、宗教……

B哲學、宗教社會科學……

C社會科學總論D政治、法律E軍事F經濟G文化、科學、教育、體育H語言、文字I文學J藝術K歷史、地理自然科學……N自然科學總論O數理科學和化學P天文學、地球科學Q生物科學

R醫藥、衛生S農業科學T工業技術U交通運輸

V航空、航天

X環境科學、安全科學綜合性圖書……

Z綜合性圖書第八十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室82O數理科學和化學大類O3力學二級類目O6化學O62有機化學三級類目O64物理化學(理論化學)、化學物理學O643化學動力學、催化作用四級類目O649半導體化學O649.2半導體表面化學五級類目

O649.3半導體分析化學

……第八十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室83★通用復分表:總論復分表世界地區表中國地區表國際時代表中國時代表世界種族與民族表中國民族表通用時間、地點表第八十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室84第八十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室85第八十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室86★索書號是圖書館賦予每一種館藏圖書的號碼。這種號碼具有一定結構并帶有特定的意義。在館藏系統中,每種索書號是唯一的,可借以準確地確定館藏圖書在書架上的排列位置,是讀者查找圖書非常必要的代碼信息。由兩部分組成:分類號/書次號。★G252.7/1103現代信息檢索與利用第八十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室87★索書號的第一部分是根據圖書的學科主題所取用的分類號。使同一學科主題的圖書得以比較集中地排列在書架上,起到方便讀者查找的作用。第八十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室88★索書號的第二部分是按照圖書作者姓名所編排的著者號碼,或者是按照圖書進入館藏時間的先后順序,或者按書名編寫的書名號,用于進一步區分同一分類號的圖書。第八十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室89★《科圖法》★《人大法》★《四庫全書總目》★《杜威十進制分類法》★《國際十進分類法》★《美國國會圖書館圖書分類法》★《冒號分類法》第八十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室90分類檢索語言的特點★分類法符合人們認識事物的規律和處理事物的習慣。★由于分類法是按學科、專業集中文獻,能系統地揭示文獻內容特征,因此能夠實現族性檢索,獲得較高的查全率。★便于組織圖書資料的排架。★分類檢索語言是一種符號體系。★分類檢索語言是一種先組式語言,不能隨時修改補充。★分類檢索語言是單線排列類目體系,不能靈活組配檢索課題,不利于查找復雜交叉的主題概念。第九十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室91主題語言★主題語言是以表達文獻信息主題內容特征的詞語作為標志,以主題概念為基礎,并按字順序列排檢的信息檢索語言。★主題語言適合特性檢索,系統性不強。第九十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室92★主題檢索語言可分為:標題法單元詞法人工語言敘詞法關鍵詞法自然語言第九十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室93標題法★標題法以嚴格規范化的、事先設計好的標題(標題詞)作為信息的主題標識。第九十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室94單元詞法★單元詞是從文獻內容中抽選出來的最基本的詞匯。第九十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室95敘詞法★敘詞法,在我國稱主題詞法。是以敘詞作為信息主題標識的主題法。★敘詞是指從文獻題目、正文、摘要中抽取出來的,用以表達文獻內容的自然語言,并在這些自然語言中優選出來并經過規范化處理的名詞術語。敘詞語言最基本的原理是詞與概念之間一一對應。第九十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室96關鍵詞法★關鍵詞法是直接選用文獻信息中的自然語言作為基本詞匯,并將那些能夠揭示文獻信息題名或主題意旨的關鍵性自然語詞作為關鍵詞進行標引的一種檢索語言。第九十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室97如何確定課題的關鍵詞:A.分析、提取課題的概念,如“關于中國唐詩的韻律研究”,“關于時間的名人名言”B.尋找同一事物的學名和俗名等,如漢語與中文C.尋找同一事物的簡稱、全稱、音譯和意譯等,如日本語與日語D.擴充同義詞匯,如課題:“SARS”E.尋找同一事物名稱的反義詞,如廉潔與腐敗F.尋找不同的詞形,如單復數、不同詞性、英美語的不同形式,如draw與drawing,stock和shareG.上位概念擴展法,如繼承法與民法、詞法與語法H.下位概念擴展法,如課題:“西部環境保護法規”I.隱含概念擴展法,如“外資管理”的“管理”隱含著“法規”等具體的管理方法第九十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室98★選取關鍵詞的方法:★分析課題,提取概念

例:河豚毒素的液相色譜分析

河豚毒素液相色譜中國武術套路的形成和發展武術套路形成發展第九十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室99★整理概念,擴充同義詞匯

例:研究SARS的論文

SARS非典非典型性肺炎查找文獻檢索方面的文獻文獻檢索信息檢索文獻信息檢索第九十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室100★運用分析所得詞匯試查例:灌溉用的橡塑多孔管灌溉橡塑橡膠塑料多孔管唐山綜合防災的研究唐山城市綜合防災地震洪水火災…

決策支持系統專家系統…第一百頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室101(a)找出顯性主題概念。(b)找出隱性主題概念。(c)排除無關和重復概念,確定核心概念。例一:土壤環境條件對豆科植物固氮作用的影響a:土壤條件豆科植物固氮作用b:溫、濕度,ph值︱大豆、花生等︱固氮菌、根瘤菌等例二:蕓豆天然食用色素的提取

a:蕓豆天然食用色素提取

c:排除天然、食用兩詞注意:在主題分析中,應排除那些檢索意義不大而比較泛指的概念詞,如展望、發展趨勢、現狀、近況、應用、利用、作用、方法、影響、效率、結構等第一百零一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室102★關鍵詞法的特點:★由于關鍵詞使用的是自然語言,故容易掌握,使用方便,及時反映最新概念。★關鍵詞語言的缺點是查準率和查全率較低,這是因為關鍵詞是未經規范化處理的自然語言,其同義詞、近義詞、多義詞未加規范統一,造成文獻的漏檢誤檢。第一百零二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室103主題檢索語言的特點★1、不必知道文獻屬于哪門學科。★2、主題語言簡單、直接。★3、專指度高,查準率高。★4、查全率低。★5、詞表收錄有限。第一百零三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1041.4.3信息檢索途徑、方法★檢索途徑:1、分類途徑是按照文獻信息的主題內容所屬學科分類體系的類目、分類號及分類索引進行信息檢索的一種檢索途徑。第一百零四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室105第一百零五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1062、主題途徑是根據文獻內容的主題特征,利用各類主題詞、關鍵詞進行信息檢索的一種檢索途徑。第一百零六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1073、著者途徑是以著者姓名、學術團體、機構名稱作為檢索標識來檢索文獻信息的一種檢索途徑。第一百零七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1084、題名途徑是以書名、刊名或文獻篇名作為檢索標識來檢索文獻的一種檢索途徑。第一百零八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1095、引文途徑是從被引論文去檢索引用論文的一種途徑。第一百零九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1106、序號途徑是指利用文獻的各種序號作為檢索標識,如專利號、標準號、國際標準書號、國際標準刊號等檢索所需信息的檢索途徑。第一百一十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室111★信息檢索方法:★追溯法:利用文獻末尾所附的參考文獻進行追溯查找的方法。★常用法:利用檢索工具查找文獻資料。★順查法★倒查法★抽查法★綜合法:常用法和追溯法的結合。★瀏覽法:對本專業或本學科的重要期刊、尤其是核心期刊逐期瀏覽閱讀的方法。第一百一十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1121.4.4信息檢索技術、策略、效果檢索技術:布爾邏輯檢索截詞檢索限定檢索短語/詞組檢索精確/模糊檢索位置檢索加權檢索第一百一十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室113★布爾邏輯檢索布爾邏輯檢索技術是利用布爾邏輯運算符將用戶的多個簡單概念組配成一個具有復雜概念的檢索提問式,用以表達用戶的檢索需求。第一百一十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室114★邏輯與限定檢索范圍,增強檢索的專指度,提高信息的查準率。邏輯運算符:“AND”、“*”。例:高血壓的治療

金庸的天龍八部

南通大學的顧曉松

信息資源查詢計算機病毒第一百一十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室115★邏輯或用于并列概念的一組組配,可以擴大檢索范圍,提高檢索的查全率。邏輯運算符:“OR”、“+”。例:基因工程的研究現狀與發展前景

計算機電腦微機發表在《中華醫學雜志》、《中華流行病學雜志》上有關SARS的文獻。第一百一十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室116★邏輯非用于排除含有不需要概念的信息,可以縮小檢索信息的范圍。邏輯運算符:“NOT”、“-”。例:除了南通大學的張三以外的作者寫的。。。信息源中除了文獻信息源以外的信息。第一百一十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室117★布爾算符的優先級邏輯非(-)最高邏輯與(*)次之邏輯或(+)最低★可以用()改變優先級

A*C+B*C

可表達為(A+B)*C例:南通大學+南通師范學院*周群(南通大學+南通師范學院)*周群第一百一十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室118難點:主題概念分析什么是主題概念的分析?主題概念的分析即對檢索課題進行分析,分析出課題涉及的事物名稱,尤其是所包含的主題概念,這個過程又叫提煉主題詞或是關鍵詞。第一百一十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室119查找吸煙與肺癌的關系的文獻關鍵詞=吸煙關鍵詞=肺癌and關鍵詞=(吸煙OR抽煙)AND關鍵詞=(肺癌OR肺部腫瘤OR肺腫瘤)主題概念的分析1---抽取檢索詞第一百一十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室120主題概念的分析2---同義詞分析查找有關計算機輔助設計的文章計算機輔助設計輔助設計CADorCAD技術CAD系統第一百二十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室121主題概念的分析3---使用不同位類的概念詞垃圾的處理回收利用掩埋填埋廢棄物同義詞下位類詞第一百二十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室122主題概念的分析3or關鍵詞=回收關鍵詞=利用關鍵詞=填埋關鍵詞=掩埋關鍵詞=垃圾關鍵詞=廢棄物andor第一百二十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室123主題概念的分析3檢索表達式:關鍵詞=(垃圾or廢棄物)and(回收or利用or填埋or掩埋)第一百二十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室124主題概念的分析4全息防偽技術在包裝方面的運用關鍵詞=全息關鍵詞=包裝and檢索表達式:關鍵詞=全息and包裝第一百二十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1251、檢索南通大學張三和李四合作撰寫的關于信息素養的文章。2、檢索除吳凡以外的老師發表在《南通大學學報》上的文章。3、唐宋詩詞研究4、檢索吳文或李旭撰寫的關于計算機等級考試研究的文章。字段代碼:T=題名,K=關鍵詞,J=刊名,A=作者,S=機構,C=分類號課堂思考第一百二十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室126主題概念分析小貼士排除比較泛指、檢索意義不大的概念。例如,“發展”、“趨勢”、“現狀”、“關系”等概念一般應予以排除。少用外延十分寬廣的概念。諸如“工藝”、“分析”、“應用”,及“有機物”、“無機物”、“重金屬”、“輕金屬”、“高分子材料”等,一般都應轉換成具體的方法或材料、化合物。有些檢索概念已經體現在所使用的數據庫中,這些概念也應該予以排除。如:使用陶瓷專業數據庫一般就排除陶瓷;計算機在計算機專業數據庫中一般也應予以排除。第一百二十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室127★截詞技術截詞檢索就是用截斷的詞的一個局部進行的檢索,是檢索詞與數據庫所存儲信息字符的部分一致性匹配檢索。常用的截詞符有“?”“*”等,分為有限截詞和無限截詞。第一百二十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室128★后截詞檢索利用一組相關詞詞首相同的特點,利于擴大檢索范圍,又稱前方一致。例:cat、cats----cat?computer、computers、computing----comput*bacteria、bacterium、bacteriophage----bacter*朱秀?----朱秀林、朱秀青、朱秀云……第一百二十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室129第一百二十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室130★前截詞檢索英語系統中多用于以構詞詞素為詞頭的英語單詞的檢索,利于擴大檢索范圍,又稱后方一致。例:minicomputer、microcomputer----*computer四級英語、六級英語、考研英語----*英語第一百三十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室131★中截詞檢索英語系統中多用于查檢英語和美語單詞的拼寫不同,單復數及因單詞詞根的元輔音變換而構成的派生詞,又稱前后一致。例:foot、feet----f*t/f??twomen、woman----wom?n第一百三十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室132★前后截詞檢索又稱為中間一致。例:computer、computers、computing、minicomputer----*comput*第一百三十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室133★限定檢索(1)字段限定檢索字段限定檢索是限定檢索詞在記錄中出現的字段范圍,檢索時,計算機只對限定字段進行查找。這是提高檢索效率的措施之一。第一百三十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室134★基本檢索字段有:

圖書:書名、作者、出版地、出版社、出版時間、國際標準書號、主題詞、分類號等。

期刊論文:題名、作者、機構、刊名(年/卷/期)、分類號、關鍵詞、摘要等。

學位論文:題名、作者、作者單位、導師、導師單位、學位授予單位、學位授予時間、專業、分類號、關鍵詞、摘要。

……第一百三十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室135(2)二次檢索指在前一次檢索的結果中運用邏輯“與、或、非”進行另一概念的再限制檢索,其主要作用是進一步精選文獻,以達到理想的檢索結果。第一百三十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室136★短語/詞組檢索指在命中記錄中包含與所輸入的檢索詞完全一致的詞組或短語,常用運算符為“”,即雙引號。第一百三十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室137★精確/模糊檢索精確檢索指檢索詞與檢索字符串完全相等,在檢索形式上完全匹配的檢索技術。模糊檢索類似智能檢索,在各檢索系統中用法不一致。第一百三十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室138★位置檢索技術兩個概念的不同相對位置常反映它們的不同語義關系,位置算符檢索采用位置邏輯算符來限定檢索詞與檢索詞之間的位置關系。第一百三十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室139★(F)同字段鄰接★(P)同自然段鄰接★(S)同句鄰接★(nN)有間斷無序鄰接★(nW)有間距有序鄰接第一百三十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室140信息檢索策略信息需求分析選擇檢索工具或檢索系統確定檢索途徑編制檢索式調整檢索策略索取原始文獻分析主題內容分析問題類型分析查找年代第一百四十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1411、科研課題常見信息需求種類課題的研究背景,如:發展水平和動態、現有成果的文獻(綜述、調研報告)課題研究的詳細內容,如:有關該課題的基本理論(公認的理論、原理、依據等)文獻(研究論文)有關課題的(事實、知識點)文獻有關該課題的佐證(引用文獻)資料第一百四十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室142科研課題常見信息需求查找某概念的確切含義:如“什么是ADSL”

查找某概念的背景知識:如“誰最先發現了傳染性蛋白”查找某些事物的數值及量化指標:如“2005年國際無線傳輸的相關標準”查找學科專業領域的新進展:如“微電子封裝產業現狀與趨勢”查找專業課題相關的研究文獻;如“范疇數據類型(CDT)構造的基本原理”特征型知識(事實、數值類數據庫、搜索引擎)關聯型知識(文獻數據庫)第一百四十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室143明確檢索要求了解某一理論、方法、設備、過程等具體

的片斷的信息,以解決研究中的具體問題,檢索要求以“準確切題”為主。申請發明、申報成果獎勵、鑒定科研成果以及立項查新時,往往需要全面地收集某一主題范圍的文獻信息,這類課題具有普查追溯的特點,應著眼于“全面而廣泛”。對于做學位論文來說,做課題前應充分了解一下本課題國內外的研究現狀(即論文的綜述部分),這時應對該課題進行較全面的檢索:包括綜述性的文章,要求全;對于該課題的核心部分,即該課題所要解決的具體問題,創新的地方,則需要準。第一百四十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1442.選擇檢索工具查找事實類信息:辭典、年鑒、百科全書、史書、手冊、典章、搜索引擎等查專題研究文獻類信息:書目文獻數據庫、全文數據庫、期刊文獻數據庫、特種文獻數據庫、電子圖書數據庫等第一百四十四頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室145選擇檢索工具全文數據庫:直接獲取深層信息如原文文摘索引數據庫:廣泛、全面獲取相關信息的概要搜索引擎、事實、數值、特種文獻數據庫:檢索特征、事實信息(如名詞解釋、標準、設計數據等)或廣泛的信息概況第一百四十五頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1463.確定檢索途徑及檢索標識內容特征標識:分類檢索:分類名、分類號(classification)

主題檢索:關鍵詞(uncontrolledterm)、主題詞(controlledterms,subjectheadings)外部特征標識:著者檢索:姓名(authorname)刊名:縮寫與全稱(serial(journal)title)機構檢索:縮寫與全稱(organizationname)關聯檢索標識:引文(cited)著者或關鍵詞其他限制檢索標識:語種、年份、地區第一百四十六頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室1474.構筑檢索提問(式)Query檢索式又稱檢索提問式,是情報用戶向檢索系統表達文獻需求的句式。簡單提問式--含一個檢索詞上下文提問式--精確短語、近似短語檢索復合提問式--含有布爾算符和至少兩個檢索詞結構提問式--多界面形式第一百四十七頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室148★復雜檢索式三部曲:①找出檢索詞②確定檢索字段③選擇布爾邏輯符號第一百四十八頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室149★例:檢索岳權撰寫的有關網絡信息資源方面的并在高等教育出版社出版的圖書。作者=岳權*書名=網絡信息資源*出版社=高等教育出版社第一百四十九頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室150★例:檢索發表在《中華醫學雜志》、《中華流行病學雜志》上關于SARS的論文。(刊名=中華醫學雜志+刊名=中華流行病學雜志)*(題名=SARS+關鍵詞=非典+摘要=非典型性肺炎)第一百五十頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室151★例:檢索南京大學的陳建群教授撰寫的除了植物群落方面的論文。機構=南京大學*作者=陳建群-關鍵詞=植物群落-題名=植物群落-摘要=植物群落第一百五十一頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室152★課堂習題:1、南通大學(原南通師范學院)的周建忠或者端木藝發表的論文。2、除了北京大學的張清以外的作者寫的關于《紅樓夢》的研究與評論(I207.411)方面的論文。第一百五十二頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室153

5.信息檢索效果評價

主要的評估指標是信息檢索的查全率和查準率查全率又稱檢全率、命中率,是指檢出的相關文獻數與系統中相關文獻總數之比。查準率又稱檢準率、相關率,是指檢出的相關文獻數與檢出的文獻總數之比。第一百五十三頁,共一百六十八頁,編輯于2023年,星期四信息檢索教研室154★檢索效果評價及其優化評價目的:找出檢索中存在的問題和影響檢索效果的各種因素,以便提高檢索的有效性。評價指標:

查全率(R)、查準率(P)、漏檢率(O)、誤檢率(F)第一百五十四頁,共

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論