




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1第3章 搜索引擎及網絡信息檢索3.1 基本知識3.2 典型的搜索引擎 3.3 搜索引擎的檢索技巧3.4 免費學術資源檢索與利用23.1基本知識3.1.1 基本概念3.1.2 搜索引擎的優點和缺點 3.1.3 搜索引擎的類型 33.1.1 基本概念 搜索引擎是Internet上的一種網站,它的主要任務是在Internet上主動搜索Web服務器信息并將其自動索引,其索引內容存儲于可供查詢的大型數據庫中。 一個搜索引擎由搜索器、索引器、檢索器和用戶接口等四個部分組成。搜索器索引器檢索器用戶接口1搜索引擎43.1.1 基本概念域名在整個Internet中必須是唯一的;一臺計算機可以有多個域名,但只能
2、有一個IP地址。若系統沒有域名服務器,則只能使用IP地址。注意:域名、IP地址、域名服務器三者之間的關系2域名53.1.2 搜索引擎的優點和缺點 優點:網絡的資源非常豐富,對于一個普通網民來說在這浩如煙海的信息流中尋找對自己有用的信息成為一件十分困難的事。搜索引擎的作用就在于整合網絡資源,為用戶提供貼心的搜索服務,提高效率。缺點:質量參差不齊,信息的分類加工欠規范,各搜索引擎在檢索指令的輸入格式與輸入內容上存在差異并難以兼容,缺乏通行易用的檢索方法與技巧;63.1.2 搜索引擎的優點和缺點 沒有統一的網絡信息分類標準,令網絡用戶無所適從,而且網絡信息分類難以與傳統的文獻分類融合,與常見的學科及
3、知識體系之間缺乏必要的內在聯系,使得網絡信息的分類體系對知識面或學科的覆蓋率達不到要求,對專業性較強的深度信息的查全率較低;建立資源索引時針對性不強,搜索速度慢,死鏈接過多,重復信息及無效信息過多;對資源不具有選擇和價值判斷的能力,排序結果不理想,難以搜索根據用戶訪問而臨時動態生成的網頁,查全率下降。73.1.3 搜索引擎的類型 1.根據搜索引擎的數據檢索機制劃分 2.按檢索內容劃分3.按搜索引擎數據來源劃分83.1.3 搜索引擎的類型 1.根據搜索引擎的數據檢索機制劃分 1)主題型搜索引擎 2)分類型搜索引擎 3)混合型搜索引擎 91)主題型搜索引擎主題型搜索引擎將不斷收集到的網上頁面及地址
4、信息以數據庫的形式組織存貯。查詢時用戶向其提問框中輸入關鍵詞,搜索引擎便會從數據庫中檢索與之相匹配的相關記錄,按一定的排序返回給用戶。代表:Google、百度網站。3.1.3 搜索引擎的類型-根據搜索引擎的數據檢索機制劃分103.1.3 搜索引擎的類型-根據搜索引擎的數據檢索機制劃分1)主題型搜索引擎11 優點:查詢全面、充分,用戶能夠對各網站的每篇文章中的每個詞進行搜索,檢索直接、方便,而且可使用布爾邏輯檢索、短語檢索等高級功能。 缺點:繁多而雜亂,沒有清晰的層次結構。3.1.3 搜索引擎的類型-根據搜索引擎的數據檢索機制劃分1)主題型搜索引擎122)分類型搜索引擎 通過用戶瀏覽層次類型目錄
5、來尋找所需信息。分類一般按主題分類,并輔之以年代、地區等分類。 代表:Yahoo、搜狐、新浪網站 例如:新浪分類目錄計算機與互聯網 硬件行情報價。3.1.3 搜索引擎的類型-根據搜索引擎的數據檢索機制劃分13142)分類型搜索引擎3.1.3 搜索引擎的類型-根據搜索引擎的數據檢索機制劃分15 優點:使用戶清晰方便地查找到某一大類信息,尤其適合那些希望了解某一范圍內信息,并不嚴格限于查詢關鍵字的用戶。 缺點:搜索范圍較全文搜索引擎要小許多,尤其是當用戶選擇類型不當時,可能遺漏某些重要的信息源。3.1.3 搜索引擎的類型-根據搜索引擎的數據檢索機制劃分2)分類型搜索引擎163、混合型搜索引擎例:雅
6、虎,既有搜索框,又有分類瀏覽目錄3.1.3 搜索引擎的類型-根據搜索引擎的數據檢索機制劃分17綜合型專題型特殊型 2.按檢索內容劃分3.1.3 搜索引擎的類型-按檢索內容劃分181)綜合型搜索引擎 綜合型搜索引擎在采集標引信息資源時不限制資源的主題范圍和數據類型,又稱為通用型檢索工具。 如:Google、百度、新浪、搜狐、網易、Yahoo等。3.1.3 搜索引擎的類型-按檢索內容劃分19202)專題型搜索引擎 專題型搜索引擎專門采集某一主題范圍的信息資源,并用更為詳細和專業的方法對信息資源進行標引描述。 例如:科技信息搜索引擎、重點學科導航系統、學科信息門戶等。3.1.3 搜索引擎的類型-按檢
7、索內容劃分213)特殊型檢索工具 特殊型檢索工具指那些專門用來檢索某一類型信息和數據的檢索工具,如查詢地圖的檢索工具“MapBlast”、查詢圖像的檢索工具“WebSEEK”等。3.1.3 搜索引擎的類型-按檢索內容劃分223按搜索引擎數據來源劃分單獨型搜索引擎 擁有獨立的采集標引機制和獨立的數據庫,例搜狐集中型搜索引擎 沒有自己的數據庫,它利用一個統一的界面,查詢其他單獨型搜索引擎的數據庫,例3721。3.1.3 搜索引擎的類型按搜索引擎數據來源劃分233.1.4 主題搜索引擎的關鍵詞語法規則1、自動將關鍵詞拆分進行模糊查詢 此類搜索引擎有Google、百度、雅虎、3721、首都在線等。例:
8、輸入“西南大學”。 優點:信息覆蓋面大。2、按關鍵詞進行精確查詢 此類搜索引擎有新浪、搜狐、網易、找到啦、中華網和常青藤等。 優點:準確性高。243.1.4 主題搜索引擎的關鍵詞語法規則3、檢索式的運算符號 1) 使用邏輯運算算符 2) 使用位置算符 3) 使用字段限定251) 使用邏輯運算算符搜索引擎基本上都支持“與”、“或”、“非”、括號或引號等邏輯運算符號,不同的搜索引擎使用的邏輯符不完全相同?!癆ND” 在中文搜索引擎都可以用空格代替;“NOT” 有時可以用減號代替,格式如:“關鍵詞A - 關鍵詞B”,減號前面要有空格?!癘R” 有時用“|”表示,例如在百度搜索引擎的格式是“關鍵詞A
9、| 關鍵詞B”。Google直接用“OR”表示,格式是“關鍵詞A OR 關鍵詞B”。 3.1.4 主題搜索引擎的關鍵詞語法規則262) 使用位置算符 AltaVista使用位置算符“NEAR/n”,n是兩個詞之間的單詞的數目。 如:“Microsoft NEAR/5 Internet”表示在“Microsoft”和“Internet”這兩個關鍵字之間的單詞數目不得超過5個。 如果不輸入n,表示兩個詞挨在一起。 為了控制挨在一起的兩個詞之間的順序,可以使用“ADJ”(adjacent)操作符,如:“Microsoft ADJ Internet”,表示“Microsoft”必須在“Internet
10、”之前。3.1.4 主題搜索引擎的關鍵詞語法規則273)使用字段限定 intitle限定網頁標題。intitle A指所有搜索結果的網頁標題中都要包含“A”。例:檢索清華大學主頁,輸入intitle 清華大學。 site限定在某類站點或某個網站內搜索。例:在新浪網上查找金庸,金庸site: 注意:“site:”后面跟的站點域名不要帶“http:/”;site:和站點名之間,不要帶空格。例:keywords site:edu,搜索教育站點的資源;site:cn,定位于國家或地區;site: ,定位于這些國家或地區的教育站點。3.1.4 主題搜索引擎的關鍵詞語法規則283)使用字段限定 filet
11、ype 限定文件類型。 用法是“關鍵詞A filetype:文件格式后綴名”。 如“個人年終總結 filetype:doc”,搜索結果全都是word文件的個人年終總結。注意:“filetype:”和“后綴名”之間不能有空格。 inurl 限定域名。 常見使用方式“關鍵詞A inurl:英文字符B”。 例如“搜索引擎 inurl:ssyq ”,檢索在url中含有ssyq的網頁中關于“搜索引擎”的信息。3.1.4 主題搜索引擎的關鍵詞語法規則293.2 典型的搜索引擎1. Google 2. 百度 3. 搜狐 4. 新浪網 5. 其他中文搜索引擎6. 其他英文搜索引擎 7. 特殊型搜索引擎303.
12、3 搜索引擎的檢索技巧3.3.1 常規的檢索技巧3.3.2 Google和百度的高級檢索技巧313.3.1 常規的檢索技巧1分類查詢2關鍵詞查詢3多次查找4按照地域查詢5查詢最新信息323.3.2 Google和百度的檢索技巧1Google高級檢索技巧1)短語檢索 使用“” 對詞組精確限定。2)字段限定檢索(1) 限定網站【例】“金庸 site:”搜索中文教育科研網站上所有包含“金庸”的頁面?!纠縇ink:(2) 限定網頁【實例】輸入“inurl:midi 滄海一聲笑”查找MIDI曲“滄海一聲笑”。333.3.2 Google和百度的檢索技巧 (3) 限定標題 【實例】輸入intitle:“
13、Browser Launch Page”,搜索網絡攝像頭。 (4) 限定文件類型【實例】利用后綴名來搜索電子書,例如輸入“存在與虛無 chm”、“水煮三國 chm”,檢索相應格式的這些電子圖書。342百度的高級搜索技巧【實例】輸入“問情 inurl:mp3”,搜索戲說乾隆的主題曲。 【實例】輸入“小說 intitle:bookmarks”查找小說的精彩站點。 【實例】輸入“攝影 site:”檢索攝影網站hao123的攝影信息。 3.3.2 Google和百度的檢索技巧353.4 免費學術資源檢索與利用1、利用搜索引擎搜索 1)Google Scholar 2)Google Book Searc
14、h2、利用Open Access搜索363.4 免費學術資源檢索與利用 隨著網絡技術的發展,Open Access(簡稱OA)資源得到了空前的發展。但是,許多OA資源分散存放在世界各地不同的服務器和網站上,用戶很難直接全面地檢索到這些資源。目前在OA資源揭示方面,主要有DOAJ和OpenDOAR兩個項目,分別在進行OA期刊和OA倉貯的整理工作。除此之外,國際國內一些高等院校、機構和個人也對OA期刊和OA倉貯在不同層面上做了類似的整理和揭示。37 Open Access:任何經由同行評論的電子期刊,以免費的方式提供給讀者或機構取用、下載、復制、打印、發行或檢索文章。作者可保有著作權,但在出版前需
15、付 500 至 1500 美元予出版社。3.4 免費學術資源檢索與利用38The National Academies Press(NAP)免費電子圖書 The National Academies Press是美國國家科學院下屬的學術出版機構,目前通過其主站點可以免費在線瀏覽3000多種電子圖書,圖書內容覆蓋環境科學、生物學、醫學、計算機科學、地球科學,數學和統計學,物理、化學、教育等諸多領域。3.4 免費學術資源檢索與利用39DOAJ開放獲取期刊目錄 DOAJ (Directory of Open Access Journals)是由瑞典隆德大學圖書館 2003 年 5 月推出的開放獲取期
16、刊的檢索系統。DOAJ 按期刊的學科主題分為 17 類,包括 Agriculture and Food Sciences , Arts and Architecture , Biology and Life Sciences , Business and Economics , Chemistry , Earth and Environmental Sciences , General Works , Health Sciences , History and Archaeology , Languages and Literatures , Law and Political Science
17、 , Mathematics and Statistics , Philosophy and Religion , Physics and Astronomy , Science General , Social Sciences , Technology and Engineering 。 /3.4 免費學術資源檢索與利用40PloS 免費期刊 科學公共圖書館( The Public Library of Science ,簡稱 PLoS )成立于 2000 年,是一家致力于推動全球科技和醫學領域文獻的公開獲取的非盈利性組織。 / HighWire Press 免費電子期刊 HighWire
18、 出版社是 1995 年由美國斯坦福大學創立的,主要覆蓋學科領域有生命科學、醫學、物理學以及社會科學。 / 3.4 免費學術資源檢索與利用41J-STAGE日本電子科技信息服務 J-STAGE ( Japan Science and Technology Information Aggregator , Electronic, )向全世界即時發布日本科學技術研究的杰出成果和發展,文獻多為英文,少數為日文。 http:/www.jstage.jst.go.jp/browse/_journallist Oaister Oaister 由美國密執安大學數字圖書館制作服務部主辦。提供電子圖書、電子期刊
19、、錄音、圖片及電影等數字化資料的 “ 一站式 ” 檢索的門戶網站。 /3.4 免費學術資源檢索與利用42Scirus Scirus 是著名出版公司 Elsevier 開發的、專門面向科學家和科研人員的學術信息檢索工具。目前 Scirus 可搜索 4.5 億個與科學相關的網頁,大多是網上開放獲取資源,也含部分商業收費資源。學科領域以自然科學為主,也有部分社科資源。 /3.4 免費學術資源檢索與利用43MIT 機構收藏庫 MIT Dspace 是使用 Dspace 軟件開發的一個數字化成果存儲與交流知識庫。收錄該校教學科研人員和研究生提交的論文、會議論文、預印本、學位論文、研究與技術報告、工作論文
20、和演示稿全文等。 /3.4 免費學術資源檢索與利用44劍橋大學機構收藏庫( Cambridge Dspace ) 英國劍橋大學圖書館與該校的計算機服務中心合作,加入 MIT 的 Dspace 聯盟項目,建立 DspaceCambridge 存儲庫。此系統用于存儲劍橋大學圖書館自己數字化的資料和本校其他機構產生的數字資源,如學術交流資料、學位論文、技術報告、各個學部和大學檔案等,以不同的格式如多媒體、交互式課件、數據集、數據庫等形式存儲。使用方法同 MIT Dspace 。 http:/www.dspace.cam.ac.uk/3.4 免費學術資源檢索與利用45加利福尼亞大學機構收藏庫( eScholarship Repository of California University ) eScholarship Repository 是美國加利福尼亞大學研究成果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨越難關2025年注冊會計師考試應對試題及答案
- 微生物檢驗領域的技術挑戰及試題及答案
- 細菌抗性機制和檢測方法試題及答案
- 項目范圍變更的管理流程考點試題及答案
- 項目管理中的文檔控制流程與規范試題及答案
- 提高項目管理考試通過率試題及答案
- 注冊會計師未來職業規劃試題及答案
- 項目管理專業考試內容解析試題及答案
- 2025銀行從業資格證考試對策及試題答案
- 微生物文化對創新的推動作用及試題及答案
- 醫療器械公司規章制度與管理條例
- 2025年航空工業西安飛機工業(集團)有限責任公司招聘筆試參考題庫附帶答案詳解
- 2025年春新滬科版物理八年級下冊課件 第九章 浮力 第四節 物體的浮與沉 第1課時 物體的浮沉條件
- 城市更新專題培訓
- 燈謎文化知到智慧樹章節測試課后答案2024年秋西安交通大學
- 中華人民共和國內河交通安全管理條例
- 文化行業非物質文化遺產保護傳承方案
- 小學生交友主題班會課件
- 2024年共青團入團考試題庫及答案
- 最優控制理論課件
- 2023年北京中醫藥大學管理崗招聘筆試真題
評論
0/150
提交評論