信息檢索基礎(chǔ)(研)_第1頁
信息檢索基礎(chǔ)(研)_第2頁
信息檢索基礎(chǔ)(研)_第3頁
信息檢索基礎(chǔ)(研)_第4頁
信息檢索基礎(chǔ)(研)_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、信息檢索(Information Retrieval)是將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的需要找出有關(guān)信息的過程。1.1 信息檢索概述1.1.1 信息檢索的定義1信息檢索的三個層次從信息檢索技能和能力綜合來看,分為三個層次:2第一層次:知道什么信息在什么地方。熟悉各種信息源的類型、內(nèi)容及特點;了解課題分析的基本方法;熟悉自己的信息環(huán)境;能根據(jù)需要選擇合適的信息檢索數(shù)據(jù)庫等。 3第二層次:從檢索系統(tǒng)中檢索出信息。 要求熟練掌握信息檢索技術(shù),并能利用這些技術(shù)從不同的信息檢索數(shù)據(jù)庫中檢索出所需信息。第三層次:信息選取與綜合利用。 該層次是信息檢索的最終目的,包括信息檢索結(jié)果的選擇、保

2、存、分析和利用。信息檢索只有對檢索的結(jié)果進(jìn)行綜合利用,是一個知識再創(chuàng)造的過程,解決實際問題,才能體現(xiàn)信息檢索的價值。 41.1.2 文獻(xiàn)信息源(1)信息的定義: 信息就是生物以及具有自動化控制系統(tǒng)的機(jī)器,通過感官和相應(yīng)的設(shè)備與外界進(jìn)行交換的一切內(nèi)容。(情報學(xué)概論武漢大學(xué))(2)信息源 聯(lián)合國教科文組織把信息源定義為:“個人為滿足其信息需求而獲得信息的來源?!?信息源分為文獻(xiàn)信息源和非文獻(xiàn)信息源。5 文獻(xiàn)是將人類知識用文字、圖形、聲頻、視頻、信號等手段記錄在一定的物質(zhì)載體上的媒介。 文獻(xiàn)信息源是以文獻(xiàn)為載體,經(jīng)過加工的信息源。它是在時間和空間上積累和傳播信息的最有效的手段,是獲得信息的最基本、最

3、主要的來源,是情報源的主體部分,便于廣泛傳播、系統(tǒng)積累、長期保存和直接利用,是情報搜集、存貯、檢索、利用的主要對象。 文獻(xiàn)信息源主要有紙質(zhì)文獻(xiàn)信息源和電子文獻(xiàn)信息源兩種。 (3)文獻(xiàn)信息源的定義6(4)文獻(xiàn)信息源的類型 1)根據(jù)文獻(xiàn)信息源的加工層次劃分: 一次文獻(xiàn):又稱原始文獻(xiàn),以作者本人的研究成果為依據(jù)創(chuàng)作的未經(jīng)情報加工的原始文獻(xiàn)。是最基本的文獻(xiàn)信息源,具有新穎性、創(chuàng)造性、系統(tǒng)性等特點。 二次文獻(xiàn):指人們對大量無序的一次文獻(xiàn)使用一定的方法進(jìn)行加工、整理,使之簡化(著錄文獻(xiàn)特征、摘錄文獻(xiàn)內(nèi)容要點等)后所得的產(chǎn)物。具有濃縮性、匯集性、有序性的特點。 三次文獻(xiàn):在合理使用二次文獻(xiàn)的情況下,選用一次

4、文獻(xiàn)內(nèi)容,加以分析、綜合而編寫出來的文獻(xiàn)。具有高度濃縮和深度加工的特點。72)按文獻(xiàn)載體形式劃分 印刷型,也叫紙介質(zhì)文獻(xiàn),以紙張為載體,通過油印、鉛印、影印、復(fù)印等各種印刷手段將信息記錄在紙張上的文獻(xiàn)。其特點是使用方便、易于閱讀、但需要占用大量空間,不便于整理和保存。 縮微型,以感光材料為載體,利用光學(xué)技術(shù)將文字、圖形、影像等信息符號按比例縮小的一種文獻(xiàn)形式,常見的縮微型文獻(xiàn)有縮微平片和縮微膠卷等。其特點是體積小、重量輕、存儲密度高,便于收藏、保存和傳遞,但必須借助縮微閱讀機(jī)或其他輔助設(shè)備才能閱讀,不便于攜帶,難于普及。8 聲像型,也稱視聽型文獻(xiàn),指以磁性材料或感光材料為載體,采用錄音、錄像或

5、攝影技術(shù)直接記錄聲音信息或圖像信息而形成的文獻(xiàn)。常見的有唱片、錄音帶、錄像帶、幻燈片、電影片等。其特點是直觀、真切、傳遞速度快、存儲密度高。 電子型,又被稱為機(jī)讀型文獻(xiàn),現(xiàn)在電子型文獻(xiàn)有時也統(tǒng)稱為電子信息資源、電子出版物。電子型文獻(xiàn)包括電子圖書、電子期刊、電子新聞、各種聯(lián)機(jī)信息庫和光盤數(shù)據(jù)庫產(chǎn)品或軟盤、磁帶、磁盤等產(chǎn)品。電子型文獻(xiàn)數(shù)據(jù)庫是計算機(jī)信息檢索的主要工具,其特點是體積小、組織有序、檢索方便、直觀生動、便于遠(yuǎn)距離傳輸,但需要借助計算機(jī)閱讀、不便于攜帶,費用較高。網(wǎng)絡(luò)信息資源作為新的信息資源類型,是一種非常重要的電子信息資源。 93)按文獻(xiàn)的編輯出版形式劃分(1)科技圖書(Book)(2)

6、科技期刊(Journal) (3)科技報告(technical report)(4)會議文獻(xiàn)(conference paper) (5)專利文獻(xiàn)(patent document) (6)學(xué)位論文(thesis, dissertation) (7)標(biāo)準(zhǔn)文獻(xiàn)(standard) (8)政府出版物(government document) (9)產(chǎn)品樣本(products samples)(10)檔案文獻(xiàn)(records ) (11)報紙 (Newspaper)10 國際文獻(xiàn)標(biāo)準(zhǔn)認(rèn)為:凡篇幅達(dá)到49頁以上并構(gòu)成一個書目單元的文獻(xiàn)叫圖書。 圖書的特征: 主題突出,內(nèi)容系統(tǒng),論述全面深入,知識成熟穩(wěn)定。

7、 出版的周期長,因而其內(nèi)容一般就缺乏最新的研究成果。 閱讀型 :教科書、專著、文集等 工具型:詞典、百科全書、手冊、年鑒等(1)圖書(BOOK)1112國際標(biāo)準(zhǔn)書號(ISBN)(International Standard Book Number)每一種正式出版的圖書的唯一標(biāo)識代碼。ISBN7501312893北京圖書館出版社第一段:語區(qū)號,代表國家、地區(qū)、語種,如0,1英,2法,3德,4日,7中第二段:出版商代號,由國家或地區(qū)ISBN中心分配;第三段:出版圖書號,由出版商按出版順序所給第四段:校驗位13參考文獻(xiàn)Monograph14(2)期刊(Journal)15 期刊又稱雜志,它是指定期或

8、不定期連續(xù)出版的、有統(tǒng)一的名稱、固定的開本、版式、有連續(xù)的序號、匯集了多位作者分別撰寫的多篇文章,并由專門的機(jī)構(gòu)編輯出版的連續(xù)性出版物。 期刊分為: 學(xué)術(shù)性(Journal) 工具型(Abstracts,Index) 報導(dǎo)型(News) 綜合型(Review,World, A據(jù)統(tǒng)計,科研人員從期刊中得到的信息約占65%以上 特點:內(nèi)容新穎、信息量大、出版周期短、傳遞信息快、 傳播面廣、時效性強(qiáng) 用途:獲取最新研究成果和動態(tài)16核心期刊少數(shù)刊載某一學(xué)科大量高質(zhì)量專業(yè)論文的期刊。特點(1)刊載專業(yè)文獻(xiàn)密度高,信息含量高;(2)水平較高,代表本學(xué)科的最新發(fā)展水平;(3)出版相對穩(wěn)定,所載文獻(xiàn)壽命較長

9、;(4)利用率和被引率較高。目前,許多單位核心期刊的判定是以中文核心期刊要目總覽為標(biāo)準(zhǔn)17參考文獻(xiàn)中期刊的著錄方式18數(shù)據(jù)庫中的著錄格式19 科技報告是指國家政府部門或科研生產(chǎn)單位關(guān)于某項研究成果的總結(jié)報告,或是研究過程中的階段進(jìn)展報告。 (3)科技報告(technical report):科技報告的特點(1)反映新的科研成果迅速;(2)內(nèi)容多樣化;(3)質(zhì)量參差不齊;(4)保密性強(qiáng);(5)每份報告獨立成冊,有連續(xù)編號。2021(4)會議文獻(xiàn)(conference paper)會議文獻(xiàn)是指在各種會議上宣讀、交流的論文、報告及其它有關(guān)文獻(xiàn)。 會議文獻(xiàn)的特點: 內(nèi)容新穎、專業(yè)性和針對性強(qiáng),傳遞信息

10、迅速,能及時反映科學(xué)技術(shù)中的新發(fā)現(xiàn)、新成果、新成就以及學(xué)科發(fā)展趨向。 222324 是實行專利制度的國家,在接受申請和審批發(fā)明過程中形成的有關(guān)出版物的總稱。包括專利說明書、專利公報、專利分類表、專利檢索工具以及與相關(guān)的法律性文件。(5)專利文獻(xiàn)(Patent Literature) 特點: (1)內(nèi)容新穎、出版迅速 (2)涉及技術(shù)領(lǐng)域廣泛、實用性強(qiáng) (3)具有法律效力 (4)重復(fù)量大2526標(biāo)準(zhǔn):主要是對工農(nóng)業(yè)產(chǎn)品和工程建設(shè)的質(zhì)量、規(guī)格及其檢驗方法等方面所作的技術(shù)規(guī)定,是從事生產(chǎn)、建設(shè)的一種共同技術(shù)依據(jù)。(6)標(biāo)準(zhǔn)文獻(xiàn)(Standard Literature) 標(biāo)準(zhǔn)文獻(xiàn):是按規(guī)定程序制訂,經(jīng)權(quán)

11、威機(jī)構(gòu)公認(rèn)或主管部門批準(zhǔn)的在特定范圍內(nèi)執(zhí)行的規(guī)格、規(guī)則、技術(shù)要求等規(guī)范性文件。272829標(biāo)準(zhǔn)文獻(xiàn)的主要特點(1)標(biāo)準(zhǔn)的制訂、審批程序有專門規(guī)定,并有固定的代號,格式整齊劃一;(2)一個標(biāo)準(zhǔn)一般只能解決一個問題;(3)時效性強(qiáng);(4)不同種類、不同級別的標(biāo)準(zhǔn)在不同范圍內(nèi)執(zhí)行;(5)有一定的法律效力和約束力;(6)有自身的檢索系統(tǒng)30如檢索:1、圖書館收藏的“有機(jī)化學(xué)”專業(yè)的新書2、“炸藥沖擊損傷演化的動態(tài)過程”研究 3、申請?zhí)枮?2131129.3 的專利4、由陳英主編的科技信息檢索一書 如何檢索?1.1.3 信息檢索途徑311.1.3 信息檢索途徑內(nèi)容特征途徑分類途徑 主題途徑外部特征途徑

12、著者途徑序號途徑名稱途徑其它途徑32 分類檢索途徑分類途徑:是按照文獻(xiàn)所屬的學(xué)科屬性進(jìn)行文獻(xiàn)檢索的途徑。33中國圖書館分類法是1971年由北京圖書館倡議,全國36個單位組成的編寫組集體編制的,于1975年正式出版,1980年、1990年、1997年先后修訂三次。 中國圖書館分類法是我國當(dāng)代具有代表性的圖書分類法,被推薦為我國標(biāo)準(zhǔn)圖書分類法廣泛使用于圖書館和情報部門。中國圖書館分類法(中圖法)34馬克思主義、列寧主義、毛澤東思想、 哲學(xué)社會科學(xué)中國圖書館分類法的體系結(jié)構(gòu)部類(5個)自然科學(xué)綜合性圖書大類(一級類目) 22 個35馬克思主義、列寧主義、毛澤東思想A 馬克思主義、列寧主義、 毛澤東思

13、想、鄧小平理論哲學(xué) 社會科學(xué)C 社會科學(xué)總論D 政治、法律E 軍事F 經(jīng)濟(jì)G 文化、科學(xué)、教育、體育H 語言、文字I 文學(xué)J 藝術(shù)K 歷史、地理 B 哲學(xué)、宗教中國圖書館分類法的體系結(jié)構(gòu)36自然科學(xué)N 自然科學(xué)總論O 數(shù)理科學(xué)和化學(xué)P 天文學(xué)地球科學(xué)Q 生物科學(xué)R 醫(yī)藥、衛(wèi)生S 農(nóng)業(yè)科學(xué)T 工業(yè)技術(shù)U 交通運(yùn)輸V 航空、航天X 環(huán)境科學(xué)、勞動 保護(hù)科學(xué)TB一般工業(yè)技術(shù) TD礦業(yè)工程 TE石油、天然氣工業(yè) TF 冶金工業(yè) TG金屬學(xué)、金屬工藝 TJ 武器工業(yè) TK 動力工業(yè) TH機(jī)械、儀表工藝 TL 原子能技術(shù) TM電工技術(shù) TN無線電、電信技術(shù) TP自動化、計算技術(shù) TQ化學(xué)工業(yè) TS輕工業(yè)、

14、手工業(yè) TU建筑科學(xué) TV水利工程 綜合性圖書Z 綜合性圖書37TQ 化學(xué)工業(yè) TQ-9 化學(xué)工業(yè)經(jīng)濟(jì) TQ01 基礎(chǔ)理論 TQ02 化工過程(物理過程及物理化學(xué)過程) TQ03 化學(xué)反應(yīng)過程 TQ04 化工原料、輔助物料 TQ05 化工機(jī)械與儀器、設(shè)備 TQ06 化工生產(chǎn)過程、產(chǎn)品最后處理及包裝 TQ07 化工產(chǎn)品與副產(chǎn)品 TQ08 化工廠 TQ09 化學(xué)工業(yè)廢物的處理與綜合利用 38TQ11 基本無機(jī)化學(xué)工業(yè) TQ12 非金屬元素及其無機(jī)化合物化學(xué)工業(yè) TQ13 金屬元素的無機(jī)化合物化學(xué)工業(yè) TQ15 電化學(xué)工業(yè) TQ16 電熱工業(yè)、高溫制品工業(yè) TQ17 硅酸鹽工業(yè) TQ2 基本有機(jī)化學(xué)

15、工業(yè) TQ31 高分子化合物工業(yè)(高聚物工業(yè)) TQ32 合成樹脂與塑料工業(yè) TQ33 橡膠工業(yè) TQ34 化學(xué)纖維工業(yè) TQ35 纖維素質(zhì)的化學(xué)加工工業(yè) TQ 化學(xué)工業(yè)39 TQ41 溶劑與增塑劑的生產(chǎn) TQ42 試劑與純化學(xué)品的生產(chǎn) TQ43 膠粘劑工業(yè) TQ44 化學(xué)肥料工業(yè) TQ45 農(nóng)藥工業(yè) TQ46 制藥化學(xué)工業(yè) TQ51 燃料化學(xué)工業(yè)(總論) TQ52 煉焦化學(xué)工業(yè) TQ53 煤化學(xué)及煤的加工利用 TQ54 煤炭氣化工業(yè) TQ55 燃料照明工業(yè) TQ56 爆炸物工業(yè)、火柴工業(yè) TQ57 感光材料工業(yè) TQ58 磁性記錄材料工業(yè) TQ59 光學(xué)記錄材料工業(yè) TQ61 染料及中間體工

16、業(yè) TQ62 顏料工業(yè) TQ63 涂料工業(yè) TQ64 油脂和蠟的化學(xué)加工工業(yè)、肥皂工業(yè) TQ65 香料及化妝品工業(yè) TQ9 其他化學(xué)工業(yè) TQ 化學(xué)工業(yè)40TQ46 制藥化學(xué)工業(yè) TQ460.1 基礎(chǔ)理論 TQ460.2 物理化學(xué)過程及設(shè)備 TQ460.3 化學(xué)反應(yīng)過程及設(shè)備 TQ460.4 原料及輔助物料 TQ460.5 制藥機(jī)械與設(shè)備 TQ460.6 制藥工藝 TQ460.7 產(chǎn)品檢驗及分析鑒定 TQ460.8 制藥廠 TQ460.9 三廢處理與綜合利用 TQ461 中草藥制劑的生產(chǎn) TQ462 無機(jī)化合物藥物的生產(chǎn) TQ463 有機(jī)化合物藥物的生產(chǎn) TQ464 生物制品藥物的生產(chǎn) TQ4

17、65 抗菌素制造 41分類檢索途徑的特點 分類途徑較能體現(xiàn)學(xué)科的系統(tǒng)性,反映事物的隸屬、平行、派生關(guān)系,能較好地滿足族性檢索的需要,即可提高文獻(xiàn)的查全率。42 主題檢索途徑 主題途徑:是按照表達(dá)文獻(xiàn)信息主題內(nèi)容的主題詞進(jìn)行信息檢索的一種途徑。 43關(guān)鍵詞 關(guān)鍵詞:是文獻(xiàn)標(biāo)題、文摘或原文中抽選出來的對表達(dá)文獻(xiàn)主題內(nèi)容起關(guān)鍵作用的、具有實質(zhì)意義的詞匯。 它的主要特點是:關(guān)鍵詞屬于自然語言,未經(jīng)規(guī)范處理,不受詞表控制,它來自文章標(biāo)題或文摘、正文中,專指度高,用作檢索詞,查準(zhǔn)率高,但查全率低,并適宜用計算機(jī)快速編制關(guān)鍵詞索引。44外部特征途徑著者途徑序號途徑名稱途徑其它途徑451.1.4 信息檢索方法

18、追溯法工具法(常用法)順查法倒查法抽查法循環(huán)法46選擇信息檢索方法的原則 1、有檢索工具時用工具法或綜合法(循環(huán)法)。 2、無檢索工具時用直接法或追溯法(引文法)。 3、新興學(xué)科或知識更新快的學(xué)科課題,用倒查法。 4、查全率要求高用順查法。 5、已經(jīng)掌握課題發(fā)展的規(guī)律、特點,用抽查法。47參考文獻(xiàn)回溯例:納米接觸問題的連續(xù)方法建模與計算 張錫義涂蘇龍樊康旗儀器儀表學(xué)報 2005年,S2期參考文獻(xiàn)1. ChuH.DMDTMsuper structure characterizations J. TI Technical Journals,1998:375.2. 白春禮.納米科技及其發(fā)展前景J.科

19、學(xué)通報,2001(2):8991.3. LandmanU,LuedtkeWD,NancyAB.Atomistic mechanisms and dynamic sofadhesion, nanoidentation, andfracture J. Science,1990,248:454461.4. 居建華,夏一本,等.氮對類金剛石薄膜的微觀結(jié)構(gòu)內(nèi)應(yīng)力與附著力的影響J.物理學(xué)報,2000,49(11):23102313.481.2.1 布爾邏輯檢索1.2.2 截詞檢索1.2.3 位置限定檢索1.2.4 字段限定檢索1.2 計算機(jī)信息檢索技術(shù)49用于表達(dá)檢索詞與詞之間的邏輯關(guān)系的檢索。 1.2.

20、1 布爾邏輯檢索50 用于兩個或兩個以上概念之間的相交關(guān)系或限定關(guān)系運(yùn)算,表示檢索結(jié)果必須滿足兩個或兩個以上條件的單元集合。符號:AND或*表達(dá)式:A AND B(A*B)檢索詞A和檢索詞B同時出現(xiàn)在一條記錄中。其作用是縮小檢索范圍,提高查準(zhǔn)率。(1)邏輯與51用于兩個或兩個以上概念之間的并列關(guān)系運(yùn)算;符號: OR或+表達(dá)式:A OR B (A+B)檢出記錄中含有檢索詞A或檢索詞B的文獻(xiàn)如 :微機(jī) + 電腦 + PC機(jī) 黑火藥 OR 煙火藥 OR 火藥 OR 點火藥 OR 煙火 OR 煙花 OR 發(fā)射藥(2)邏輯或52NOT或-A NOT B(A-B)記錄必須包含檢索詞A但不能包含檢索詞B。即

21、在含有檢索詞A的文獻(xiàn)中去除含有檢索詞B的文獻(xiàn)。其作用是縮小檢索范圍。例如檢索式: 信息檢索-數(shù)據(jù)檢索 計算機(jī) NOT 微機(jī)(3)邏輯非53 截詞檢索就是把檢索詞截斷,取其中的一部分,再加上截詞符號一起進(jìn)行檢索。主要用于檢索詞的單復(fù)數(shù)、詞的詞尾變化、詞根相同的一類詞,以及同一詞的拼法變異等。 1.2.2 截詞檢索54 是指在檢索詞后截幾個有限的字母,如名詞的單復(fù)數(shù),動詞的詞尾變化等。如輸入computer? ?表示有0-1個字母變化 可檢出computer和computers. 輸入stud?表示截斷處有0-3個字母變化 可檢出 study,studies,studied,studing.(1)

22、有限截斷55(2)無限截斷在檢索詞后加一個“?“,表示該詞后可加任意個字符。使用無限截詞,所截詞根不能太短,否則會輸出許多無關(guān)文獻(xiàn),造成誤檢。 如:computer?可檢出computers computering,computered,computerization56(1)前截詞:也稱左截詞,后方一致,截詞符位于詞干的前邊。如: ?computer可檢索computer、minicomputer、 microcomputer詞。 ?Chemistry 可以檢索 chemistry、biochemistry、electrochemistry、 physicochemistry ?polyme

23、r 可檢出polymer、copolymer、homopolymer57(2)后截詞:也稱右截詞,前方一致,截詞符位于詞干的后邊。如: computer? 可檢索computer、computers、computerize等詞 Physic? 可檢出physic、physical、physican、physicalism58 (3)中間截詞:截詞作為通用字符位于檢索詞的中間,而詞的前后一致,凡前后方一致的詞都能檢出,通常用在英美對某些詞的不同拼寫法。 如:wom?n可檢出woman、women等。 fib?board 可檢出 fiberboard、fibreboard兩詞。59 為了提高檢索的

24、查準(zhǔn)率,縮小檢索的范圍 ,將檢索詞限定在特定的字段中進(jìn)行檢索。如檢索式:(1)AU=Gordon? AND PY=199? (2) chemical reaction/DE,TI(3)(minicomputer/DE, TI) OR (personal computer/ID, TI)AND (PY=2008) AND (LA=English )1.2.3 字段限定檢索60常見的檢索字段:題名Title TI文摘Abstract AB作者Author AU作者單位Corporate Source CS刊名Journal Name JN敘詞Descriptor DE語種Language LA文獻(xiàn)

25、類型Document Type DT61 表示兩個檢索詞間的位置臨近關(guān)系,又叫鄰接檢索,使用的檢索算符稱為位置算符。 布爾邏輯運(yùn)算符表示兩個概念之間的邏輯關(guān)系,位置算符表示的是兩個概念在信息中的實際物理位置關(guān)系。 1.2.4 位置限定檢索62例如:檢索“CD-ROM”,則可用CD(W)ROM;檢索式econom?(2N)recovery,可以檢出:economic recovery recovery of the economy recovery from economic troubles63位置算符常用的有: (W)與(nW)算符 W是with的縮寫。(W)或用( )表示其連接的兩個檢索詞

26、必須按序出現(xiàn),中間不允許插詞,只能有一空格或標(biāo)點、符號。如:high(W)class命中的記錄中出現(xiàn)的匹配詞可能有:high class 或high-class。64(nW)與(W)類似,只是它允許插詞,插詞量小于或等于n個。如:silicon(1W)sensor命中的記錄中出現(xiàn)的匹配詞除silicon sensor外,還可能有:silicon integrated sensor, silicon image sensor, silicon-based sensor等。如:silicon(2W)sensor命中的記錄中出現(xiàn)的匹配詞除上例的外,還可能會有:silicon angular rate

27、 sensor, silicon-based chemical sensor等等。65N是near的縮寫。(N)表示其連接的兩個檢索詞的順序可以互易,但兩詞間不允許插詞。(nN)中的n表示允許插詞量少于或等于n個。如:internet(N)accessing命中記錄中出現(xiàn)的匹配詞可能有:internet accessing, accessing internet。如:internet(1N)accessing命中記錄中除上例的外,還會可能有:accessing internet, accessing the internet, internet /intranet accessing等。(N)

28、與(nN)算符66位置算符在數(shù)據(jù)庫中的實際應(yīng)用1)EI NEAR Bridge NEAR Piling* 表示這兩個詞要彼此接近,前后順序不限。W/n Pig* W/2 pine*表示兩個詞的距離不能超過n個單詞Adj Channel adj tunnel表示含有這兩個詞,兩個詞相 鄰,位置一定2)SCI 用同句算符(SAME):如Channel same tunnel,表示channel 和tunnel 出現(xiàn)在同一句子中才符合檢索條件。67位置算符舉例:Elseviertongue w/2 base檢索間最多插入2個單詞68直接采用自然語言中的字、詞、句進(jìn)行提問式檢索,同一般口語一樣。這種基

29、于自然語言的檢索方式又被稱為“智能檢索”,適合不太熟悉網(wǎng)絡(luò)信息技術(shù)的人員使用。支持自然語言檢索的有中文的悠游,英文的AltaVista, Excite,Infoseek,HotBot,AskJeeves等1.2.5 自然語言檢索691.3 信息檢索的一般步驟1.3.1 分析研究課題,明確檢索目標(biāo)和范圍,確定檢索詞1.3.2 選擇合適的數(shù)據(jù)庫1.3.3 選擇檢索途徑1.3.4 編制檢索提問式1.3.5 上機(jī)檢索并對檢索策略進(jìn)行調(diào)整1.3.6 獲取原文701.3.1 分析研究課題,明確檢索目標(biāo)和范圍,確定檢索詞 確定檢索的時間范圍、語種范圍、文獻(xiàn)類型。 檢索系統(tǒng)收錄了不同類型的文獻(xiàn)信息,課題性質(zhì)不

30、同,所需要的文獻(xiàn)類型也不同。 對基礎(chǔ)理論研究的課題,側(cè)重于檢索期刊論文,專著和科技報告等; 搞技術(shù)應(yīng)用和開發(fā)的課題,側(cè)重于檢索專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn); 搞產(chǎn)品選型設(shè)計的課題,側(cè)重于檢索產(chǎn)品樣本資料、標(biāo)準(zhǔn)文獻(xiàn)和專利文獻(xiàn)等。 71 了解課題對查新、查準(zhǔn)、查全等方面 的具體要求。 文獻(xiàn)檢索目的:科研立題、科研階段性研究、科研成果鑒定、申請專利、撰寫論文、綜述、述評 (1)若要了解某學(xué)科、理論、課題、工藝過程等最新進(jìn)展和動態(tài),則要檢索最近的文獻(xiàn)信息,強(qiáng)調(diào)“新”; (2)若要解決研究中某具體問題,找出技術(shù)方案,則要檢索有針對性、能解決實際問題的文獻(xiàn)信息,強(qiáng)調(diào)“準(zhǔn)” (3)若要撰寫綜述、述評或?qū)V龋私庹n

31、題、事件的前因后果、歷史和發(fā)展,則要檢索詳盡、全面、系統(tǒng)的文獻(xiàn)信息,強(qiáng)調(diào)“全” 。72“臭氧氧化法處理TNT堿性廢水的研究”確定核心概念:臭氧氧化法、TNT、廢水 分析課題內(nèi)容,找出主題概念,排除無關(guān)和重復(fù)概念,確定核心概念73例 1、檢索“ 形狀記憶合金作為密封元件在法蘭 連接中的應(yīng)用 ” 分析: 形狀記憶合金在目標(biāo)文獻(xiàn)中可能以“形狀記憶合金”出現(xiàn),也有可能以“形狀記憶效應(yīng)”出現(xiàn); 密封在目標(biāo)文獻(xiàn)中除了以“密封”出現(xiàn),還有可能以“泄漏”出現(xiàn),考慮到法蘭連接中的密封元件一般為墊片或墊圈,因此目標(biāo)文獻(xiàn)中還有可能以“墊片”或“墊圈”來替代“密封”; 法蘭連接一般采用螺栓連接,因此目標(biāo)文獻(xiàn)中除了可能

32、出現(xiàn)“法蘭連接”外,也有可能出現(xiàn)“螺栓連接”。74 例2:檢索“石質(zhì)文物保護(hù)”方面的文獻(xiàn) 分析: 一般對于石質(zhì)文物的保護(hù)是采用在文物表面涂層的辦法。現(xiàn)在常用的有兩類涂層:一類是有機(jī)硅涂層,一類是聚酯涂層。所以可將涂層、薄膜作為概念提出。如果對保護(hù)材料有特殊的要求,還可以將硅、有機(jī)硅或者聚酯作為概念提出。同樣,石質(zhì)文物也有不少的下位概念,如石樓、石碑、紀(jì)念碑等。因此檢索可依據(jù)具體要求作出靈活的調(diào)整。75關(guān)鍵詞選取方法根據(jù)自己的專業(yè)知識確認(rèn)檢索詞外,還可以借助一些工具和方法。同義詞、近義詞獲取方法:通過詞表、辭書、詞典進(jìn)行核對與擴(kuò)充,可以根據(jù)詞表如“漢語主題詞表”確定出規(guī)范化的主題詞;根據(jù)專業(yè)詞典找出別名、俗名、商品名、學(xué)名等。上下位主題詞獲取方法:從主題詞表中獲得。有的主題詞表,如我國國防科技主題詞表,英國INSPEC主題詞表等可以查得。76掌握數(shù)據(jù)庫資源所覆蓋的學(xué)科范圍掌握各種數(shù)據(jù)庫收錄文獻(xiàn)的類型查看數(shù)據(jù)庫的詳細(xì)介紹和說明 1.3.2 選擇合適的數(shù)據(jù)庫771.3.3 選擇檢索途徑分類途徑:關(guān)鍵是確定分類類目和分類號。主題途徑:關(guān)鍵是確定主題詞和關(guān)鍵詞。著者途徑:關(guān)鍵是著者書寫方法和規(guī)則。序號途徑:專利號、標(biāo)準(zhǔn)號、化學(xué)分子式索引和 CAS登記號等。781.3.4 編制檢索提問式1.單元詞檢索(概念檢索) 檢索標(biāo)識是具體的檢索詞或詞組,每個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論