網絡信息檢索_第1頁
網絡信息檢索_第2頁
網絡信息檢索_第3頁
網絡信息檢索_第4頁
網絡信息檢索_第5頁
已閱讀5頁,還剩115頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第三章 互聯網信息檢索請大家動手查找,歌曲:n有位朋友,記得在我是歌手聽過一首韓紅的歌 歌名不記得 只記得歌詞幾句 能幫我搜索到歌曲名嗎?n歌詞大意是:花雨漫天飛翔請大家動手查找,圖片引言引言n“在這個星球的歷史上,從來沒有這么多的人依靠自身有能力去找到這么多的東西和這么多關于其他人的信息。 ”來自:Thomas Friedman :世上的一切問題你去問Google n網絡搜索難點:是如何找到更少的搜索結果,而不是找到更多。n網絡搜索目標:n花費最少的時間n找到最精確的信息。n超越谷歌:學生如何做學術研究:n學生在學習中使用了進行與課程有關的研究工作。n大多數學生將搜索引擎作為其研究開始的第一

2、步百度:如此專注百度:如此專注GoogleGoogle成功的七堂課成功的七堂課 Internet第一搜索引擎Google檢索指南 nGoogleGoogle時代的工作方法時代的工作方法: :如何解放你的大腦、發現你如何解放你的大腦、發現你想要的、作對你想做的想要的、作對你想做的GoogleGoogle改變生活改變生活 n巧用百度巧用百度第三章互聯網信息檢索第三章互聯網信息檢索搜索引擎搜索引擎 網絡信息資源分類網絡信息資源分類 簡單地可以分為兩類:簡單地可以分為兩類: 一類是來自正式文獻信息源的信息:一類是來自正式文獻信息源的信息:質量質量高、內容可靠,一般都有檢索平臺高、內容可靠,一般都有檢索

3、平臺, ,花錢購花錢購買才能很方便的使用。(如買才能很方便的使用。(如CNKICNKI數據庫)數據庫) 一類是各類網站上的信息:一類是各類網站上的信息:包羅萬象、良包羅萬象、良莠不齊,一般通過搜索引擎進行檢索。莠不齊,一般通過搜索引擎進行檢索。 注意:注意:科學研究需要的文獻資料,一般要科學研究需要的文獻資料,一般要通過圖書館主頁的各種數據庫獲取。通過圖書館主頁的各種數據庫獲取。 網絡檢索工具網絡檢索工具搜索引擎搜索引擎 因特網上蘊藏著豐富的信息資源。它因特網上蘊藏著豐富的信息資源。它已經成為全球傳播科研、教育、商業和社已經成為全球傳播科研、教育、商業和社會信息的最主要渠道。我們怎么從著信息會

4、信息的最主要渠道。我們怎么從著信息的海洋中準確迅速地找到所需的信息?從的海洋中準確迅速地找到所需的信息?從2020世紀世紀8080年代起人們開發了各種網絡信息年代起人們開發了各種網絡信息檢索工具。檢索工具。19891989年,萬維網誕生了。年,萬維網誕生了。 WWWWWW上的資源成為因特網的主流,越來上的資源成為因特網的主流,越來越多的萬維網搜索引擎成為檢索網絡信息越多的萬維網搜索引擎成為檢索網絡信息資源的工具。所以我們在這里介紹資源的工具。所以我們在這里介紹WWWWWW上的上的搜索引擎。搜索引擎。 一、搜索引擎概述一、搜索引擎概述本次課程內容本次課程內容一、搜索引擎概述一、搜索引擎概述1、常

5、用搜索引擎介紹、常用搜索引擎介紹2、搜索引擎的關鍵詞語法規則搜索引擎的關鍵詞語法規則3、GoogleGoogle與百度的檢索技巧與百度的檢索技巧優酷視頻:n什么是搜索引擎?http:/ 搜索引擎概述搜索引擎概述-概念概念 1 1、搜索引擎、搜索引擎(Search EngineSearch Engine) :人們經常將人們經常將網網絡信息檢索工具絡信息檢索工具概稱為搜索引擎它以一定的策略概稱為搜索引擎它以一定的策略在在InternetInternet上搜集、發現信息,對信息進行提取、上搜集、發現信息,對信息進行提取、組織和處理,并為用戶提供檢索服務,從而達到信組織和處理,并為用戶提供檢索服務,從

6、而達到信息導航的目的。搜索引擎也是一類網站,即因特網息導航的目的。搜索引擎也是一類網站,即因特網上上具有檢索功能的網頁。具有檢索功能的網頁。 它能夠在它能夠在萬維網萬維網上主動搜索其他上主動搜索其他webweb站點中的站點中的信息并對其自動進行索引,即記錄下各個信息并對其自動進行索引,即記錄下各個WebWeb頁面頁面的的URLURL地址并進行有序排列這些索引內容存放在地址并進行有序排列這些索引內容存放在可供的查詢的索引數據庫中。可供的查詢的索引數據庫中。 搜索引擎概述搜索引擎概述-類型類型 2 2、根據搜索引擎的信息搜集方法和服務提供方式根據搜索引擎的信息搜集方法和服務提供方式的不同來的不同來

7、劃分為以下三大類:劃分為以下三大類:(1 1)全文搜索引擎)全文搜索引擎( (機器人搜索引擎)機器人搜索引擎) (2 2)目錄式搜索引擎)目錄式搜索引擎(3 3)元搜索引擎)元搜索引擎 本質區別:本質區別:目錄索引搜索引擎目錄索引搜索引擎的資料數據庫中,搜索保的資料數據庫中,搜索保存的是互聯網上各網站的存的是互聯網上各網站的站名、站名、網址和內容提要網址和內容提要;全文全文搜索引擎搜索引擎的資料庫中,搜索保存的則是互聯網上各的資料庫中,搜索保存的則是互聯網上各網站網站的每一個網頁的全部內容的每一個網頁的全部內容,范圍要大得多。,范圍要大得多。 GoogleGoogle主頁主頁 百度主頁百度主頁

8、 YAHOOYAHOO搜索主頁搜索主頁 搜索引擎的工作原理搜索引擎的工作原理在因特網中發現、搜集網頁信息在因特網中發現、搜集網頁信息對信息進行提取和組織、建立索引庫對信息進行提取和組織、建立索引庫根據用戶輸入的查詢條件,在索引庫中快速檢出文檔,根據用戶輸入的查詢條件,在索引庫中快速檢出文檔,進行相關度評價,將結果進行排序將查詢結果返給用戶進行相關度評價,將結果進行排序將查詢結果返給用戶索引數據庫索引數據庫信息搜集信息搜集用戶用戶 1 1、全文搜索引擎介紹、全文搜索引擎介紹 全文搜索引擎全文搜索引擎 全文搜索引擎全文搜索引擎是名副其實的搜索引擎。它是名副其實的搜索引擎。它們都是通過從互聯網上提取

9、各個網站的信們都是通過從互聯網上提取各個網站的信息(以網頁文字為主)而建立的數據庫中,息(以網頁文字為主)而建立的數據庫中,檢索與用戶查詢條件匹配的相關記錄,然檢索與用戶查詢條件匹配的相關記錄,然后按一定的排列順序將結果返回給用戶,后按一定的排列順序將結果返回給用戶,因此它們是真正的搜索引擎。因此它們是真正的搜索引擎。 國外具代表性的有國外具代表性的有 GoogleGoogle等,國內著等,國內著名的有百度(名的有百度(BaiduBaidu) 全文搜索引擎提供的完整信息全文搜索引擎提供的完整信息全文搜索引擎工作原理全文搜索引擎工作原理 工作原理工作原理是由網絡機器人軟件是由網絡機器人軟件ROB

10、OTROBOT,每天,每天2424小時不停地訪問因特網上的網站,并根小時不停地訪問因特網上的網站,并根據頁面上的鏈接從一個網頁跳到另一個網據頁面上的鏈接從一個網頁跳到另一個網頁,提取網頁,以及標題、關鍵詞、超鏈頁,提取網頁,以及標題、關鍵詞、超鏈接、元數據乃至網頁全文等各種信息。搜接、元數據乃至網頁全文等各種信息。搜索到的網頁信息被存儲在數據庫中,由機索到的網頁信息被存儲在數據庫中,由機器自動標引形成索引器自動標引形成索引, ,建立索引庫。建立索引庫。 1.1、Google搜索引擎介紹搜索引擎介紹 GoogleGoogle搜索引擎介紹搜索引擎介紹 Google Google是由是由2 2名斯坦

11、福大學博士生名斯坦福大學博士生Larry Page 和和Sergey Brin(拉里拉里佩奇和謝爾蓋佩奇和謝爾蓋布林布林)19981998年創年創立,立,是目前世界上最大、用戶最多、是目前世界上最大、用戶最多、全球公認最佳的搜索引擎。全球公認最佳的搜索引擎。 網址(網址(http:/.hk/)或或(http:/http:/) GoogleGoogle搜索引擎介紹搜索引擎介紹 Google Google 是由英文單詞是由英文單詞“googolgoogol”變化而來變化而來表示表示 1 1 后邊帶有后邊帶有 100 100 個零的數字。個零的數字。Google Google 使用這個詞代表公司想征

12、服網上無使用這個詞代表公司想征服網上無窮無盡資料的雄心。窮無盡資料的雄心。 GoogleGoogle支持支持100100多種語言,目前已增長多種語言,目前已增長至上千億網頁,其對網頁進行整理,為世至上千億網頁,其對網頁進行整理,為世界各地的用戶提供便捷的網上信息查詢。界各地的用戶提供便捷的網上信息查詢。 GoogleGoogle概況概況 優點:優點:信息量大,信息量大,更新快,能給用戶更新快,能給用戶最全面最廣泛的搜索結果。最全面最廣泛的搜索結果。 缺點:有很多缺點:有很多無關信息出現無關信息出現,降低相,降低相應的命中率,必須從結果中再篩選。應的命中率,必須從結果中再篩選。提供的查詢結果提供

13、的查詢結果重復鏈接重復鏈接較多。較多。 2006年年4月在中國更名月在中國更名“谷歌谷歌” 2012年年12月月12日,谷歌關閉在日,谷歌關閉在中國大陸中國大陸市場搜索服務,搜索服務由中國內地轉市場搜索服務,搜索服務由中國內地轉至香港至香港 檢索途徑檢索途徑( (網頁、圖片、視頻、新聞、音樂等網頁、圖片、視頻、新聞、音樂等) )檢索途徑檢索途徑檢索入口檢索入口 高級檢索頁面高級檢索頁面 檢索功能檢索功能 GOOGLE GOOGLE提供基本搜索和高級搜索兩種搜索方式:提供基本搜索和高級搜索兩種搜索方式: 1 1、基本檢索、基本檢索 就是直接在主頁的檢索框內輸入檢索詞和短語提就是直接在主頁的檢索框

14、內輸入檢索詞和短語提問,自由檢索,直接獲取檢索結果。問,自由檢索,直接獲取檢索結果。 2 2、高級檢索、高級檢索 搜索結果區中的四種匹配方式依此表示搜索結果區中的四種匹配方式依此表示andand、精、精確短語檢索、確短語檢索、oror、notnot。每個檢索框只能輸入檢索。每個檢索框只能輸入檢索詞,不能輸入運算符。同時還可進行時間、語言、詞,不能輸入運算符。同時還可進行時間、語言、網域等的限制。網域等的限制。 基本基本檢索語法規則檢索語法規則( (記住第記住第1 1、4 4條)條) (1 1)默認檢索:)默認檢索:輸入多個檢索詞以輸入多個檢索詞以空格空格分隔,默分隔,默認為認為ANDAND匹配

15、。最多可輸入匹配。最多可輸入1010個檢索詞。即不需使個檢索詞。即不需使用用ANDAND或或“+ +”號,其會在關鍵詞之間自動添加號,其會在關鍵詞之間自動添加ANDAND。空格表示邏輯空格表示邏輯“與與”。 (2 2)邏輯)邏輯“或或”檢索:檢索:用大寫用大寫OROR連接多個檢索詞。連接多個檢索詞。高級檢索中仍然有相當高級檢索中仍然有相當OROR邏輯關系的字段。邏輯關系的字段。 (3 3)邏輯)邏輯“非非”檢索:檢索:檢索詞前加上檢索詞前加上減號減號“- -”(減號前必須留一空格),表示邏輯(減號前必須留一空格),表示邏輯“非非”,搜,搜索索不包含不包含該檢索詞的網頁該檢索詞的網頁基本基本檢索

16、語法檢索語法規則規則(4 4)短語檢索:)短語檢索:用半角的用半角的雙引號雙引號括起詞組或括起詞組或短語,進行精確短語匹配。如:短語,進行精確短語匹配。如:“Kidney Kidney failurefailure”. .(5 5)GOOGLEGOOGLE不區分英文字符大小寫:不區分英文字符大小寫:“GoDGoD”和和“godgod”搜索的結果是一樣的。不支持搜索的結果是一樣的。不支持“* *”搜索搜索 (6)(6)不支持不支持“通配符通配符”( (* *) ) 搜索搜索: : 也就是說,也就是說,Google Google 只搜索與輸入的關鍵詞完全一樣的只搜索與輸入的關鍵詞完全一樣的字詞字詞

17、基本檢索中的限定檢索基本檢索中的限定檢索 (1)site: (1)site:限定在某個特定的網域或站點中進限定在某個特定的網域或站點中進行檢索。行檢索。 命令格式:檢索詞命令格式:檢索詞 site:site:域名域名 例:三峽旅游例:三峽旅游 site:comsite:com,表示在商業網站,表示在商業網站中搜索含中搜索含“三峽旅游三峽旅游”的網頁。的網頁。 基本檢索中的限定檢索基本檢索中的限定檢索 (2)intitle: (2)intitle:表示限定在網頁標題中搜索表示限定在網頁標題中搜索. . 命令格式:命令格式:intitle:intitle:檢索詞檢索詞 例:例:intitle: i

18、ntitle: 王菲寫真,王菲寫真,表示在網頁中表示在網頁中搜索包含搜索包含“王菲寫真王菲寫真”的網頁的網頁. . 基本檢索中的限定檢索基本檢索中的限定檢索 (3) Filetype (3) Filetype:用來限定命中文件的類型用來限定命中文件的類型。 命令格式:命令格式: 關鍵詞關鍵詞 filetype:filetype:文件類型文件類型 例:例:文獻檢索文獻檢索 filetype:ppt filetype:ppt,表示在網頁表示在網頁中搜索包含中搜索包含“文獻檢索文獻檢索”內容的內容的PPTPPT文件文件. . 基本檢索中的限定檢索基本檢索中的限定檢索 (4)inurl:)inurl:

19、在網頁的在網頁的urlurl內搜索指定的內容。內搜索指定的內容。 inurlinurl后面的關鍵詞則可以出現在網頁的文后面的關鍵詞則可以出現在網頁的文檔中。檔中。URLURL中文叫統一資源定位器。中文叫統一資源定位器。 命令格式:命令格式: inurl:inurl:限定的字符串檢索詞限定的字符串檢索詞 例:例:inurl:MP3 inurl:MP3 宋祖英,宋祖英,表示宋祖英可以表示宋祖英可以出現在網頁的任何位置,而出現在網頁的任何位置,而MP3 MP3 則必須出則必須出現在網頁的現在網頁的URLURL中。中。 舉例:搜索三峽旅游相關網頁舉例:搜索三峽旅游相關網頁 用用Site:Site:限定

20、查三峽大學畢業論文格式限定查三峽大學畢業論文格式如果不限定檢索也可以查到,但是查準率低如果不限定檢索也可以查到,但是查準率低 方法方法: 檢索詞直接輸入基本檢索框檢索詞直接輸入基本檢索框 檢索結果檢索結果=138000條條 搜索王菲的照片搜索王菲的照片(intitle: intitle: 王菲寫真)王菲寫真)搜索宋祖英的搜索宋祖英的MP3MP3音樂音樂 ( (inurl:MP3 inurl:MP3 宋祖英宋祖英) )在論壇上查教育技術博士點高校有哪些在論壇上查教育技術博士點高校有哪些(教育技術博士點教育技術博士點 inurl:bbs) Google基本檢索指令表基本檢索指令表符符號號功能說明功

21、能說明舉例舉例注意事項注意事項“ ”“ ”將整個引號中的將整個引號中的內容作為一個整內容作為一個整體體“Wuhan University引號最好用半引號最好用半角角空格空格 表示邏輯與表示邏輯與 Wuhan University Wuhan UniversityOROR表示邏輯或表示邏輯或Wuhan OR Wuhan OR UniversityUniversityOROR是大寫字母是大寫字母- -表示邏輯非表示邏輯非Wuhan -UniversityWuhan -University操作符與后面操作符與后面的關鍵字之間的關鍵字之間不能有空格不能有空格, ,與與前面的詞之間前面的詞之間有空格有空

22、格 基本檢索一般方法舉例基本檢索一般方法舉例 例例1 1:查找查找中國人壽司歌中國人壽司歌的歌曲名稱的歌曲名稱 第一種檢索方法第一種檢索方法 、將、將中國人壽司歌中國人壽司歌作為檢索詞作為檢索詞直直接輸入接輸入基本檢索框基本檢索框結果:搜索引擎自動將結果:搜索引擎自動將中國人壽中國人壽司歌司歌分隔成分隔成中國人中國人和和壽司壽司兩個檢索兩個檢索詞進行查找詞進行查找. . 第一種檢索方法第一種檢索方法 沒有在前沒有在前10條中發現答案(條中發現答案(2006年結果)年結果) 第二種檢索方法第二種檢索方法 、用戶主動使用、用戶主動使用空格分隔空格分隔,默認,默認為為ANDAND 中國人壽中國人壽

23、司歌司歌作為兩個檢索詞用作為兩個檢索詞用空格隔開并輸入。空格隔開并輸入。 檢索結果如下:檢索結果如下: 主動使用空格的檢索效果主動使用空格的檢索效果 結果在第三條就看到了結果在第三條就看到了結果在這里結果在這里 第三種檢索方法第三種檢索方法 、用、用半角雙引號半角雙引號括起詞組或短語,進括起詞組或短語,進行精確短語匹配行精確短語匹配 將其用半角雙引號括起將其用半角雙引號括起“中國人壽司中國人壽司歌歌”,輸入到檢索框中。輸入到檢索框中。 檢索結果一目了然(檢索結果一目了然(2006年結果)年結果) 2007年數據庫更新完善后的檢索情況年數據庫更新完善后的檢索情況 數據更新完善后的檢索情況數據更新

24、完善后的檢索情況 2011年年2月檢索情況月檢索情況 高級檢索高級檢索 高級檢索高級檢索 搜索結果區中提供四種邏輯匹配方式搜索結果區中提供四種邏輯匹配方式依此表示依此表示andand、精確短語檢索、精確短語檢索、oror、notnot。每個檢索框只能輸入檢索詞,不能輸入運每個檢索框只能輸入檢索詞,不能輸入運算符。算符。 同時還提供了語言、更新時間、檢索詞同時還提供了語言、更新時間、檢索詞位置、網域等限定,另外還可通過位置、網域等限定,另外還可通過“類似類似網頁網頁”搜索相關網站。搜索相關網站。 高級檢索高級檢索將搜索范圍限制在某個特定的網站中 排除某個特定網站的網頁 將搜索限制于某種指定的語言

25、 查找鏈接到某個指定網頁的所有網頁 查找與指定網頁相關的網頁 示例示例1 1:查找微軟網站上關于:查找微軟網站上關于“windows2000windows2000的安全的安全”課題資料課題資料。 高級檢索高級檢索 高級檢索界面高級檢索界面securitysecurityWindows 2000Windows 2000MM 檢索結果檢索結果高級檢索中的含義解釋高級檢索中的含義解釋1 1、包含以下全部的字詞、包含以下全部的字詞: :相當于詞間相當于詞間“與與”關系,關系, 2 2、包含以下的完整字句、包含以下的完整字句: :相當于相當于“ ”字符串檢字符串檢索,索,3 3、包含以下任何一個字詞、包

26、含以下任何一個字詞: :相當于詞間相當于詞間“或或”關關系系4 4、不包括以下字詞、不包括以下字詞: :相當于詞間相當于詞間“非非”關系關系高級檢索舉例高級檢索舉例 示例示例2 2:搜索:搜索“醫學論文寫作醫學論文寫作”方面的方面的網頁及網頁及PPTPPT課件課件 包含以下全部的字詞包含以下全部的字詞 結果結果=1500,000=1500,000條條 包含以下的完整字句包含以下的完整字句 結果結果=384,000條條 不包括以下字詞不包括以下字詞 結果結果=1440,000條條 搜索醫學論文寫作方面的搜索醫學論文寫作方面的PPTPPT課件課件PDFPDFPPTPPTDOCDOCXLSXLSSW

27、FSWF 檢索結果檢索結果=620條條 Google Google 的特殊功能的特殊功能 查找某文檔類型網頁:查找某文檔類型網頁:PDFPDF、PPTPPT、swfswf、DOC DOC PostScript (ps)PostScript (ps)等等. . 網頁快照:網頁快照:單擊單擊“網頁快照網頁快照”即可即可. . 定位檢索功能:定位檢索功能:通過通過“手氣不錯手氣不錯”鍵實現鍵實現. . 類似網頁:類似網頁:點擊點擊“類似網頁類似網頁”鍵實現鍵實現. . Google Google 的特殊功能的特殊功能 1 1、查找某文檔類型網頁:、查找某文檔類型網頁:GoogleGoogle已經可以

28、支持已經可以支持1313種非種非HTMLHTML文件的搜索。除文件的搜索。除PDFPDF、DOCDOC、PPTPPT、 xlsxls文文檔外(百度可以),檔外(百度可以),GoogleGoogle現在還可以搜索、現在還可以搜索、Shockwave Flash (swf)Shockwave Flash (swf)、PostScript (ps)PostScript (ps)和其它和其它類型文檔。如果您只想查找類型文檔。如果您只想查找PDFPDF或或FlashFlash文件,而不文件,而不要一般網頁,只需搜索要一般網頁,只需搜索“關鍵詞關鍵詞 filetype:pdffiletype:pdf” 或

29、或“關鍵詞關鍵詞 filetype:swffiletype:swf”就可以了。就可以了。 舉例(舉例(1 1)流氓兔流氓兔 filetype:swffiletype:swf (2 2)查查lung cancerlung cancer的的PDFPDF外文全文文獻外文全文文獻 lung cancer filetype:pdflung cancer filetype:pdf /document/misc/rabbit/rabbit-6action.swf GoogleGoogle的特殊功能的特殊功能 2 2、網頁快照、網頁快照 Google Google 在

30、訪問網站時,其會在訪問網站時,其會將看過的網頁復制一份網頁快照,以備在將看過的網頁復制一份網頁快照,以備在找不到原來的網頁或原地址打開很慢時找不到原來的網頁或原地址打開很慢時使使用。單擊用。單擊“網頁快照網頁快照”時,您將看到時,您將看到 Google Google 將該網頁編入索引時的頁面。而百將該網頁編入索引時的頁面。而百度的度的“網頁快照網頁快照”不全面。不全面。 作用:你可以根據這些快照來分析網頁上作用:你可以根據這些快照來分析網頁上的內容,大致了解是否符合您的需求。的內容,大致了解是否符合您的需求。 武漢大學網頁快照武漢大學網頁快照網頁快網頁快照照 武漢大學網頁快照武漢大學網頁快照

31、GoogleGoogle的特殊功能的特殊功能 3 3、定位檢索功能、定位檢索功能 檢索方法很簡單,直接檢索方法很簡單,直接將與檢索提問詞將與檢索提問詞最相關的網站最相關的網站推薦給用戶,推薦給用戶,提高檢索效率。通過提高檢索效率。通過“手氣不錯手氣不錯”功能鍵功能鍵實現。實現。 舉例(舉例(1 1)查找)查找“北京大學北京大學”,可直接進入可直接進入北京大學主頁。北京大學主頁。 定位檢索功能定位檢索功能手氣不錯手氣不錯 北京大學主頁北京大學主頁 GoogleGoogle的特殊功能的特殊功能 4 4、類似網頁、類似網頁通過點擊通過點擊“類似網頁類似網頁”或或在高級檢索界面在高級檢索界面“區域區域

32、”中輸入所需中輸入所需的網址,會得到類似的全部網頁。的網址,會得到類似的全部網頁。 作用:作用:了解這了解這一類一類網站的狀況及介紹,網站的狀況及介紹,幫助提高檢索效率。幫助提高檢索效率。 例例: :查看武漢大學類似網頁查看武漢大學類似網頁 點擊類似網頁點擊類似網頁 類似網頁結果類似網頁結果 GOOGLE結果顯示技術結果顯示技術 GOOGLE GOOGLE搜索結果排序的核心技術就是其獨搜索結果排序的核心技術就是其獨創的創的網頁級別網頁級別PageRankTMPageRankTM專利技術,根據專利技術,根據網頁被鏈接的次數來評定某一網頁的重要網頁被鏈接的次數來評定某一網頁的重要性,決定排名次序,

33、使排名較為性,決定排名次序,使排名較為客觀公正客觀公正,將最相關的結果最先呈現給用戶將最相關的結果最先呈現給用戶, ,節約用戶節約用戶時間。而百度等可用錢買排名,有時使結時間。而百度等可用錢買排名,有時使結果失去公正。果失去公正。 1.21.2、百度搜索引擎、百度搜索引擎 百度搜索引擎簡介百度搜索引擎簡介 百度搜索百度搜索是海外留學的學子們回國創辦的。是海外留學的學子們回國創辦的。19991999年底成立于美國硅谷,年底成立于美國硅谷,20002000年年1 1月開始,月開始,相繼在北京、上海、深圳成立了百度網絡相繼在北京、上海、深圳成立了百度網絡技術(北京)有限公司和辦事處。搜索范技術(北京

34、)有限公司和辦事處。搜索范圍涵蓋了中國大陸、香港、臺灣、澳門、圍涵蓋了中國大陸、香港、臺灣、澳門、新加坡等華語地區以及北美、歐洲的部分新加坡等華語地區以及北美、歐洲的部分站點。目前已經擁有站點。目前已經擁有世界上最大的中文信世界上最大的中文信息庫。百度目前主要提供中文(簡息庫。百度目前主要提供中文(簡 / /繁體)繁體)網頁搜索服務。網頁搜索服務。 百度主頁百度主頁從更多進入從更多進入 更多檢索(詞典、百科等)更多檢索(詞典、百科等) 百度幫助百度幫助 專業文檔搜索專業文檔搜索 很多有價值的資料,在互聯網上并非是普通的網很多有價值的資料,在互聯網上并非是普通的網頁,而是以頁,而是以WordWo

35、rd、PowerPointPowerPoint、PDFPDF等格式存在。等格式存在。百度支持對百度支持對OfficeOffice文檔(包括文檔(包括WordWord、ExcelExcel、PowerpointPowerpoint)、)、Adobe PDFAdobe PDF文檔、文檔、RTFRTF文檔進行了文檔進行了全文搜索。全文搜索。 方法為:在方法為:在“Filetype:Filetype:”后跟以下文后跟以下文件格式:件格式:DOCDOC、XLSXLS、PPTPPT、PDFPDF、RTFRTF。例如,查找。例如,查找張五常關于交易費用方面的經濟學論文。張五常關于交易費用方面的經濟學論文。“

36、交易交易費用費用 張五常張五常 filetype:docfiletype:doc”, 您也可以通過您也可以通過 百度文檔搜索界面百度文檔搜索界面(http:/ ,直接使用專業,直接使用專業文檔搜索文檔搜索 百度文檔搜索界面百度文檔搜索界面入黨申請書范文入黨申請書范文 檢索結果檢索結果基本檢索基本檢索基本檢索規則基本檢索規則 輸入多個詞語搜索輸入多個詞語搜索(不同字詞之間用一個(不同字詞之間用一個空格隔開,可以獲得更精確的搜索結果空格隔開,可以獲得更精確的搜索結果) )。在百度查詢時不需要使用符號在百度查詢時不需要使用符號“ANDAND”或或“+ +”,百度會在多個以空格隔開的詞語之,百度會在多

37、個以空格隔開的詞語之間自動添加間自動添加“+ +”。并把最相關的網頁排在。并把最相關的網頁排在前列。前列。 高級搜索語法高級搜索語法 1 1、intitle:intitle:把搜索范圍限定在網頁標題中把搜索范圍限定在網頁標題中 例如,找在網頁標題中含有北京聯合大學例如,找在網頁標題中含有北京聯合大學的網頁,查詢格式:的網頁,查詢格式: intitle:intitle:北京聯合大學北京聯合大學 注意,注意,intitle:intitle:和后面的關鍵詞之間,不和后面的關鍵詞之間,不要有空格要有空格。 高級搜索語法高級搜索語法 2 2、site:site:把搜索范圍限定在特定站點中把搜索范圍限定在

38、特定站點中. .使使用的方式,是在查詢內容的后面,加上用的方式,是在查詢內容的后面,加上“site:site:站點域名站點域名”。例如,天空網下載軟件查詢格式:例如,天空網下載軟件查詢格式: msn site:msn site: 注意,注意,“site:site:”后面跟的站點域名,不要后面跟的站點域名,不要帶帶“http:/http:/”;另外,;另外,site:site:和站點名之間,和站點名之間,不要帶空格。不要帶空格。高級搜索語法高級搜索語法 3 3、雙引號、雙引號-精確匹配精確匹配如果輸入的查詢詞很長,百度在經過分析后,給如果輸入的查詢詞很長,百度在經過分析后,給出的搜索結果中的查詢

39、詞,可能是拆分的。如果出的搜索結果中的查詢詞,可能是拆分的。如果您對這種情況不滿意,可以嘗試讓百度不拆分查您對這種情況不滿意,可以嘗試讓百度不拆分查詢詞。給查詢詞加上雙引號,就可以達到這種效詢詞。給查詢詞加上雙引號,就可以達到這種效果。果。例如,搜索例如,搜索 上海大學上海大學,如果不加雙引號,搜索結如果不加雙引號,搜索結果被拆分,效果不是很好,但加上雙引號后,果被拆分,效果不是很好,但加上雙引號后,“上海大學上海大學”,獲得的結果就全是符合要求的了。獲得的結果就全是符合要求的了。 高級搜索語法高級搜索語法 4 4、書名號、書名號-精確匹配精確匹配 書名號是百度獨有的一個特殊查詢語法。加上書書

40、名號是百度獨有的一個特殊查詢語法。加上書名號的查詢詞,有兩層特殊功能,一是書名號會名號的查詢詞,有兩層特殊功能,一是書名號會出現在搜索結果中;二是被書名號擴起來的內容,出現在搜索結果中;二是被書名號擴起來的內容,不會被拆分。不會被拆分。 書名號在某些情況下特別有效果。書名號在某些情況下特別有效果。 例如,查名字很通俗和常用的那些電影或者小說。例如,查名字很通俗和常用的那些電影或者小說。比如,查電影比如,查電影“手機手機”,如果不加書名號,很多如果不加書名號,很多情況下出來的是通訊工具情況下出來的是通訊工具手機,而加上書名手機,而加上書名號后號后, ,手機手機結果就都是關于電影方面的了結果就都是

41、關于電影方面的了. . 高級搜索語法高級搜索語法 5 5、減號語法、減號語法-要求搜索結果中不含特定要求搜索結果中不含特定查詢詞查詢詞. .例如,搜例如,搜 神雕俠侶神雕俠侶,希望是關于武俠小,希望是關于武俠小說方面的內容,卻發現很多關于電視劇方說方面的內容,卻發現很多關于電視劇方面的網頁。那么就可以這樣查詢:面的網頁。那么就可以這樣查詢:神雕俠神雕俠侶侶 - -電視劇。電視劇。 注意,前一個關鍵詞,和減號之間必須有注意,前一個關鍵詞,和減號之間必須有空格,減號和后一個關鍵詞之間,有無空空格,減號和后一個關鍵詞之間,有無空格均可。格均可。 限定在標題中檢索(限定在標題中檢索( intitle:

42、):) 限定在標題中檢索(限定在標題中檢索( intitle:):) 2、目錄搜索引擎、目錄搜索引擎目錄目錄索引類索引類搜索引擎簡介搜索引擎簡介 目錄索引雖然有搜索功能,但嚴格意義講算不目錄索引雖然有搜索功能,但嚴格意義講算不上上是真正的搜索引擎是真正的搜索引擎。僅僅是按目錄分類的網站鏈僅僅是按目錄分類的網站鏈接列表而已。為便于檢索,目錄同時提供關鍵詞接列表而已。為便于檢索,目錄同時提供關鍵詞檢索,檢索,但搜索保存的是互聯網上各網站的站名、但搜索保存的是互聯網上各網站的站名、網址和內容提要網址和內容提要 。由于是人工編輯,其信息量相由于是人工編輯,其信息量相對較小,更新速度較慢,查全率不高。目

43、錄索引對較小,更新速度較慢,查全率不高。目錄索引中最具代表性的莫過于久負盛名的中最具代表性的莫過于久負盛名的 YahooYahoo(雅(雅虎)。虎)。國內的搜狐、新浪、網易搜索也都屬于這國內的搜狐、新浪、網易搜索也都屬于這一類。一類。 20062006年以后年以后YahooYahoo(雅虎)與(雅虎)與GOOGLEGOOGLE形成伙伴關形成伙伴關系,成為混合型搜索引擎。即:有目錄搜索引擎系,成為混合型搜索引擎。即:有目錄搜索引擎功能,也有全文搜索引擎功能。功能,也有全文搜索引擎功能。 YAHOO YAHOO搜索引擎搜索引擎( (http:/ ) Yahoo Yahoo是是最著名的目錄索引類搜索

44、引擎。最著名的目錄索引類搜索引擎。19941994年年斯坦福大學的兩位電子工程學博士生開始編制一斯坦福大學的兩位電子工程學博士生開始編制一個自己感興趣的個自己感興趣的 InternetInternet上的站點目錄,這就是上的站點目錄,這就是最原始的最原始的 YahooYahoo,19951995年成立年成立 YahooYahoo公司。在全公司。在全球共有球共有2424個網站,個網站,1212種語言版本。種語言版本。雅虎中國網站雅虎中國網站()()于于19991999年年9 9月正式開通,月正式開通,是雅虎在是雅虎在全球的第全球的第2020個網站。個網站。 可以通過兩種方式在上面查找信息,一是通

45、常可以通過兩種方式在上面查找信息,一是通常的關鍵詞搜索,一是按分類目錄逐層查找。的關鍵詞搜索,一是按分類目錄逐層查找。 3、元搜索引擎 3 3、元搜索引擎、元搜索引擎 元搜索引擎元搜索引擎不同于傳統的獨立的搜索引擎,其本不同于傳統的獨立的搜索引擎,其本身沒有搜索引擎的網頁搜尋機制,身沒有搜索引擎的網頁搜尋機制,也沒有自己獨也沒有自己獨立的索引數據庫立的索引數據庫,而只是定制統一的檢索界面,而只是定制統一的檢索界面,通過調用其他搜索引擎的檢索功能來實現查詢。通過調用其他搜索引擎的檢索功能來實現查詢。 原理:原理:接受查詢請求,向多個搜索引擎遞交,將接受查詢請求,向多個搜索引擎遞交,將結果進行去除重復,重新排序等處理后,返回給結果進行去除重復,重新排序等處理后,返回給用戶。用戶。 特點:特點:沒有自己的數據,返回的結果信息量更大、沒有自己的數據,返回的結果信息量更大、更全,但不能充分使用所有搜索引擎的功能。更全,但不能充分使用所有搜索引擎的功能。 3 3、元搜索引擎、元搜索引擎 萬緯搜索引擎萬緯搜索引擎是上海萬緯信息技術有限公司開發是上海萬緯信息技術有限公司開發的一個中文的一個中文元搜索引擎,集成了英

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論