搜索引擎課件_第1頁
搜索引擎課件_第2頁
搜索引擎課件_第3頁
搜索引擎課件_第4頁
搜索引擎課件_第5頁
已閱讀5頁,還剩41頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、搜索引擎的使用搜索引擎的使用常用網絡搜索引擎常用網絡搜索引擎 介紹與利用介紹與利用 大崗中學大崗中學 李淑華李淑華網絡信息資源是指計算機網絡上可以網絡信息資源是指計算機網絡上可以利用的各種信息資源的總和。利用的各種信息資源的總和。網絡信息資源的特點:網絡信息資源的特點:1)數量巨大,增長迅速。)數量巨大,增長迅速。2)內容豐富,形式多樣。)內容豐富,形式多樣。3)信息發布自由,信息資源良莠不齊。)信息發布自由,信息資源良莠不齊。4)傳播范圍廣泛。)傳播范圍廣泛。5)網絡信息具有一定的交互性。)網絡信息具有一定的交互性。網絡信息資源檢索方法網絡信息資源檢索方法v(1)直接瀏覽)直接瀏覽 用戶使用

2、最為廣泛,最原始的獲取信息的方法。用戶使用最為廣泛,最原始的獲取信息的方法。 v(2)利用導航網站、門戶網站)利用導航網站、門戶網站 基于專業人員對網絡信息資源分布的了解,對基于專業人員對網絡信息資源分布的了解,對 網絡信息進行評價、組織、分類等工作,再按一網絡信息進行評價、組織、分類等工作,再按一 定的專業或學科形成具有良好分類體系的網絡資定的專業或學科形成具有良好分類體系的網絡資 源指南。源指南。 http:/或者或者http:/ 等等 學科信息門戶學科信息門戶v(3)利用搜索引擎)利用搜索引擎 搜索引擎搜索引擎(Search Engines)是一個專門提是一個專門提 供信息搜索服務的網站

3、,是對互聯網上的信息供信息搜索服務的網站,是對互聯網上的信息 資源進行搜集整理,然后提供用戶查詢的系統。資源進行搜集整理,然后提供用戶查詢的系統。 開啟網絡知識殿堂的鑰匙開啟網絡知識殿堂的鑰匙 獲取網絡知識信息的工具獲取網絡知識信息的工具搜索引擎的概念及工作原理搜索引擎的概念及工作原理概念概念:(Search Engine)從廣義上講是)從廣義上講是用來對網絡信息資源管理和檢索的一系列用來對網絡信息資源管理和檢索的一系列軟件,在軟件,在Internet網上查找信息的工具或網上查找信息的工具或系統。系統。組成:組成:WWW服務器,搜索程序(如服務器,搜索程序(如spider、crawler、ro

4、bot),索引數據庫),索引數據庫(包括成千上萬甚至上億個網頁),檢索(包括成千上萬甚至上億個網頁),檢索程序(用來處理用戶的檢索請求)程序(用來處理用戶的檢索請求)研究目的與意義研究目的與意義v工作原理:簡單地說主要包括以下幾個步驟:v網頁信息搜索v索引庫的建立v用戶檢索式的處理v檢索結果輸出搜索引擎分類搜索引擎分類 按其工作方式主要可劃分為:按其工作方式主要可劃分為:1、全文搜索引擎:全文搜索引擎:全文搜索引擎的使用方法也稱為“關鍵字查詢”,指用于代表所需信息主題的關鍵詞進行信息查詢。Google 、百度、百度2、目錄索引類搜索引擎:目錄索引類搜索引擎:采用羅列目錄的方式,引導搜索者依據分

5、類目錄查找需要的信息。搜狐、新浪、搜狐、新浪、Yahoo雅虎雅虎 搜索引擎的檢索方法v布爾邏輯檢索v截詞檢索v字符串檢索v位置檢索常用檢索技術常用搜索引擎介紹及示例vGoogle(中文)v網址:http:/概述特點檢索功能介紹Googlev概述Google是由美國斯坦福大學的兩位博士生拉里佩吉和謝爾蓋布林于1998年創建的其優勢在于掌握的信息量以及檢索模型和檢索速度。它可為世界各地的用戶提供適需的搜索結果,而且搜索時間通常不到半秒Google采用全文標引方式,提供每日更新。Google 的查詢界面設置搜索偏好,包括每個網頁上默認的搜索結果數量、界面語言,以及查詢語言直接進入最符合搜索條件的網頁

6、Googlev特點支持多達一百多種語言提供1萬多億個搜索網頁,涵蓋內容齊全搜索速度快結果命中率高搜索結果摘錄查詢網頁的部分具體內容,而不僅僅是網站簡介智能化的“手氣不錯”功能,提供可能最符合要求的網頁“網頁快照”功能,能從Google服務器里直接取出緩存的網頁Google檢索功能檢索功能基本檢索:(布爾檢索功能)v邏輯“與”:檢索框中的兩個關鍵詞之間用空格空格隔開則默認為是“AND”(“與”運算)連接v邏輯“非”:用“”(減號)表示,同時要求在減號前保留一個空格v邏輯“或”:用“OROR”表示v雙引號、連字號、斜線、問號、等號、省略號都可以作為短語的連接符號查找名言或專有名詞v指定網域:利用s

7、ite:site:可以在某個特定的網站或域中進行搜索v指定文件類型:filetypefiletype:文件類型,可以在一類文件中進行搜索,比如,filetype:pdf, filetype:ppt等邏輯與功能邏輯非功能邏輯或功能專用語查詢功能“ ”、“-”、“”、“+”、“=”、“,”“”指定網域指定文件類型檢索功能v基本檢索其它檢索語法v搜索的關鍵詞包含在URL鏈接中:inurl:v搜索的關鍵詞包含在網頁標題中:intitle:v搜索的關鍵詞包含在網頁的“錨”中:inanchor: 或allinanchor:v搜索所有鏈接到某個URL的網頁:link:Google檢索功能檢索功能v基本檢索(

8、高級檢索功能)v 可以排除某個特定站點的網頁(限定網域)v可以對檢索結果頁面的語言類型進行限制(限定語種)v可以限定檢索結果的時間范圍(更新日期)v可以限定關鍵詞出現的位置(字詞位置)v可以檢索鏈向某一個網頁的所有頁面(鍵連功能)v可以檢索與某一個網頁相關的所有網頁(相似網頁檢索)高級檢索界面高級檢索示例輸入檢索條件高級檢索示例檢索結果常用中外文學術搜索引擎常用中外文學術搜索引擎 中中 文文外外 文文-Google中文學術搜索中文學術搜索-CNKI知識搜索知識搜索-讀秀學術搜索讀秀學術搜索-百度國學百度國學-Google Scholar-Scirus-Scitopia-INFOMINE Goo

9、gle ScholarvGooglar Scholar是Google針對學術文獻而開發的搜索引擎v檢索大量免費學術文獻:預印本庫、開放獲取 期刊、機構庫等v檢索商業資源:Google Scholar與Nature、 Science、IEEE、Elsevier以及中文數據庫等 出版商合作vhttp:/Google scholar期刊論文、學位論文、同行評議、書籍、預期刊論文、學位論文、同行評議、書籍、預印本、標準文獻、會議文獻和技術報告等印本、標準文獻、會議文獻和技術報告等文獻文獻類型類型自然科學、人文科學、社會科學等,側重自然科學、人文科學、社會科學等,側重醫學、物理、經濟、計算機等學科醫學、

10、物理、經濟、計算機等學科學科學科范圍范圍在參考文獻中檢索到,無全文選擇檢索范圍圖書信息點擊被引次數,顯示引用具體信息輸入檢索詞類似或相關論文鏈接到中國科學院圖書館聯合目錄,查找收藏館我校訂購資源:讀秀學術搜索v讀秀學術搜索是全球最大的中文文獻資源服務平臺,集文獻搜索、試讀、文獻傳遞、參考咨詢等多種功能為一體。它的后臺是一個海量的超大型數據庫,能夠為讀者提供260萬種中文圖書書目信息、180萬種中文圖書原文、6億頁全文資料的信息。v同時,通過讀秀學術搜索,還能一站式檢索館藏紙質圖書、電子圖書、期刊等各種異構資源,幾乎涵蓋了圖書館內的所有信息源,從而為讀者提供最全面、準確的學術資料。 1海量學術資

11、源庫v讀秀學術搜索提供全文檢索、圖書、期刊、報紙、學位論文、會議論文、標準、專利、視頻等9個主要搜索頻道,讀者通過讀秀學術搜索,能夠獲得關于檢索點的最全面的學術資料,避免了反復收集和檢索的困擾。2參考咨詢服務v讀秀提供的參考咨詢服務,通過文獻傳遞,直接將相關學術資料送到讀者郵箱,使讀者零距離獲取珍稀學術資源。vhttp:/檢索常見錯誤v常見錯誤1:錯別字經常發生的一種錯誤是輸入的關鍵詞含有錯別字。像“星際爭吧”、“以德制國”之類的關鍵詞能搜索到什么有用資料呢?每當你覺得某種內容網上應該有不少、卻搜索不到結果時,應該先查一下關鍵詞中是否有錯別字。檢索常見錯誤v常見錯誤2:關鍵詞太常見搜索引擎對常

12、見詞的搜索存在缺陷,因為這些詞曝光率太高了,以至于出現在成百萬網頁中,使得它們事實上不能被用來幫你找到什么有用的內容。比如,搜索“電話”,有無數網站提供跟“電話”相關的信息,從網上黃頁到電話零售商到個人電話號碼都有。所以當搜索結果太多太亂的時候,你應該嘗試使用更多的關鍵詞或者減號來搜索,不使用過于通用的詞匯來搜索,設計一個類似“上海 常用電話”這樣特殊的搜索關鍵詞,會給你真正有用的結果。當然,如果你想找的是一串汽車網站或一串MP3網站,那么用“汽車”、“MP3”搜索就是正確的。檢索常見錯誤v常見錯誤3:多義詞要小心使用多義詞,比如搜索“Java”,你要找的信息究竟是太平洋上的一個島、一種著名的

13、咖啡、還是一種計算機語言?搜索引擎是不能理解辨別多義詞的。最好的解決辦法是,在搜索之前先問自己這個問題,然后用短語、用多個關鍵詞或者用其他的詞語來代替多義詞作為搜索關鍵詞。比如用“爪哇 印尼”、“爪哇 咖啡”、“Java 語言”分別搜索可以滿足不同的需求。檢索常見錯誤v常見錯誤4:不會輸關鍵詞,想要什么輸什么搜索失敗的另一個常見原因是類似這樣的搜索:“現代愛情故事歌詞”、“信息早報在濟南的發行情況”、“鈴羊車的各種圖案”、“上海到成都列車時刻表”。你錯把搜索引擎當成是聽話的服務員了,其實搜索引擎是很機械的,當用關鍵詞搜索的時候,它只會把含有這個關鍵詞的網頁找出來,根本不管網頁上的內容是什么。問

14、題在于,沒有一個網頁上會含有“現代愛情故事歌詞”和“上海到成都列車時刻表”這樣的關鍵詞,所以搜索引擎也找不到這樣的網頁。但是真正含有你想找的內容的網頁,應該含有的關鍵詞是“現代愛情故事”、“歌詞”;“上海”、“成都”、“列車”、“時刻表”,所以你應該這樣搜索:“現代愛情故事 歌詞”、“信息早報 濟南 發行情況”、“鈴羊 車 圖案”、“上海 成都 列車 時刻表”。不要用自己心中想的白話去搜索,當搜索結果太少甚至沒有的時候,你應該輸入更簡單的關鍵詞來搜索,猜測你找的網頁中可能含有的關鍵詞,然后用那些關鍵詞搜索。網絡信息檢索的技巧:掌握網絡信息檢索的技巧:掌握“擴檢擴檢”與與“縮檢縮檢”方法,提高檢

15、索效率方法,提高檢索效率 信息檢索過程是不斷調整檢索策略的過程,也是進信息檢索過程是不斷調整檢索策略的過程,也是進行擴檢或縮檢的過程。當檢索結果中相關信息或所需要行擴檢或縮檢的過程。當檢索結果中相關信息或所需要的信息太少或沒有時,需要進行擴檢,反之就需要進行的信息太少或沒有時,需要進行擴檢,反之就需要進行縮檢。縮檢。 擴檢主要方法擴檢主要方法 v多搜索引擎、多庫檢索。據有關資料介紹,多搜索引擎、多庫檢索。據有關資料介紹,目前國外大型搜索引擎在目前國外大型搜索引擎在WebWeb上僅能收錄覆蓋上僅能收錄覆蓋1/31/3的公開的公開WebWeb頁面,任何大型搜索引擎也不頁面,任何大型搜索引擎也不可能

16、將公開網頁全部收錄。因此對于難檢資可能將公開網頁全部收錄。因此對于難檢資料或有高查全率要求情況下,必須進行多搜料或有高查全率要求情況下,必須進行多搜索引擎查詢檢索。對于產品的科技查新檢索,索引擎查詢檢索。對于產品的科技查新檢索,至少要分別使用至少要分別使用googlegoogle、百度、一搜三個以、百度、一搜三個以上搜索引擎進行搜索,用上述集成搜索引擎上搜索引擎進行搜索,用上述集成搜索引擎可以高效滿足這一要求。可以高效滿足這一要求。 擴檢主要方法擴檢主要方法v在布爾檢索式中,增加布爾在布爾檢索式中,增加布爾“或或”相連的相連的關鍵詞,減少關鍵詞,減少 “ “與與”相連的關鍵詞,即擴大相連的關鍵

17、詞,即擴大搜索的主題。搜索的主題。v采用上位詞檢索,擴大概念范圍。如飛機采用上位詞檢索,擴大概念范圍。如飛機是直升飛機的上位詞。是直升飛機的上位詞。v另外,為了得到較多的檢索結果,應用循環另外,為了得到較多的檢索結果,應用循環法不斷擴大檢索范圍,利用減少限制、熱鏈、法不斷擴大檢索范圍,利用減少限制、熱鏈、站點推薦、模糊檢索擴大檢索范圍。站點推薦、模糊檢索擴大檢索范圍。 縮檢主要方法縮檢主要方法:v在檢索式中,增加邏輯在檢索式中,增加邏輯“與與”相連的關鍵相連的關鍵詞,或利用二次檢索功能,逐次附加新的檢詞,或利用二次檢索功能,逐次附加新的檢索條件,進行概念限制,縮小檢索范圍。索條件,進行概念限制,縮小檢索范圍。v對檢索結果中反復出現的無關重復信息,對檢索結果中反復出現的無關重復信息,利用邏輯利用邏輯“非非”去除,即在不需要出現的關去除,即在不需要出現的關鍵詞前加鍵詞前加“-”-”排除一些

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論