




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
因特網信息資源檢索因特網中的信息檢索信息檢索工具的工作原理1.3因特網信息資源檢索本環節主要內容主要學習各種搜索引擎及其發展趨勢,并在此基礎上進一步分析了搜索引擎的工作原理。搜索引擎是什么?A.網頁B.網站C.一組程序
D.access√√搜索引擎——是一種用于幫助因特網用戶查詢信息的搜索工具,它以一定的策略在因特網中搜集、發現信息,對信息進行理解、提取、組織和處理,并為用戶提供檢索服務,從而起到信息導航目的。注意的問題搜索引擎并不真正搜索互聯網,它搜索的實際上是預先整理好的網頁索引數據庫。搜索引擎,也不能真正理解網頁上的內容,它只能機械的匹配網頁上的文字。因特網信息資源檢索1.目錄索引類搜索引擎2.全文搜索引擎3.特色信息檢索工具4.其它信息檢索工具5.元搜索引擎1.3因特網信息資源檢索搜索引擎——指用于因特網信息查找的網絡工具。1.目錄索引類與全文搜索引擎(1)目錄索引類搜索引擎(其搜索方式也稱為分類搜索)目錄搜索引擎——將收取到的各個網站(網頁)的信息按照目錄分類,建
立索引數據庫供人們分類查找。代表網站:搜狐()
新浪()
網易()
雅虎()
搜網)目錄索引類搜索引擎的基本工作原理
目錄索引類搜索引擎一般采用人工方式采集和存儲網絡信息,依靠手工為每個網站確定一個標題,并給出大概的描述,建立關鍵字索引,將其放入相應的類目體系中。信息檢索工具的工作原理特點:在查詢信息時,不用事先確定信息檢索目標(即關鍵詞),可以通過瀏覽主題了解某一主題的相關資源。優點:目錄索引類搜索引擎的網頁由人工精選,網頁內容豐富,學術性較強。缺點:更新速度慢。專題目錄鏈接網站總目錄信息檢索工具的工作原理搜索的例子:選擇題1.目錄索引類搜索引擎一般采用什么方式采集和存儲信息()。A.人工方式B.蜘蛛程序C.關鍵字檢索D.檢索工具A(2)全文搜索引擎(其使用方法也稱為關鍵詞查詢)全文搜索引擎——用代表所需信息主題的關鍵詞進行信息查詢。谷歌google:()百度:()北大天網:)特點:通過從因特網上提取的各個網站的信息(以網頁文字為主)而建立的索引數據庫。1.3因特網信息資源檢索信息檢索工具的工作原理組成部分負責工作搜索器負責定期地自動到各個網站上,把網頁抓下來,并順著上面的鏈接,持續不斷地抓取網頁。索引器把搜索器抓來的網頁進行分析,按照關鍵詞句進行索引,并存入服務器的數據庫中。檢索器面向用戶,接收用戶提交的查詢字串,在索引數據庫中查詢,并將結果反饋給用戶。搜索引擎的組成全文搜索引擎的工作原理購物描述商品特征取貸交給顧客查找信息輸入描述信息的關鍵詞在數據庫中檢索結果呈現全文搜索引擎的工作原理:信息檢索工具的工作原理查詢結果用戶查詢輸入查詢表達式
檢索器查詢結果顯示查詢信息排序
索引器
搜索器篩選信息采集索引排序索引數據庫采集結果上半部下半部全文搜索引擎的工作過程是什么?課本P72-73
搜索引擎的工作過程①從互聯網上“抓取”網頁②建立索引數據庫③在索引數據庫中搜索排序④用戶接口:查詢和響應全文搜索引擎輸入關鍵字查詢信息排序索引數據庫用戶查詢查詢結果檢索搜索下列不屬于搜索引擎中“搜索器”工作程序的是()。A.網絡機器人B.蜘蛛C.爬蟲D.CuteFTPD2.特色信息檢索工具1.3因特網信息資源檢索
我們經常使用的一般是綜合信息檢索工具,而當們我們要查找圖片、地圖等信息時,使用綜合搜索引擎會找到很多無用的信息,而且搜索的效率和有效性都不高。這時就可以使用特色搜索引擎(有時是綜合檢索工具中的一個功能)一類以FTP、Telnet、Usenet(UsesNetwork的縮寫——新聞討論組,是全世界最大的電子布告欄系統)等資源為檢索對象的檢索工具,如北大天網、Archie等。1.3因特網信息資源檢索3.其他信息檢索工具4.其他信息檢索工具以FTP、Telnet、Usenet等資源為檢索對象。5.元搜索引擎1.3因特網信息資源檢索
一般的網絡檢索工具局限在本引擎的數據庫內進行搜索,由于不同的搜索引擎各自的信息收集方式和范圍、檢索算法和結果排序方法都各不相同,因此檢索結果也不盡相同。為了獲得較好的結果,1995年出現了元搜索引擎,元搜索引擎能方便地檢索多個搜索引擎,擴大檢索范圍,提高檢索的全面性。但是由于元搜索引擎出現的時間短,一些搜索引擎強大的檢索功能還不能實現。元搜索引擎——這是一種搜索引擎之上的(強調邏輯關系、邏輯結構)搜索引擎,它可以同時檢索多個成員搜索引擎的數據庫。常用元搜索引擎
1、Ithaki()
支持包括中文在內的14種語言檢索。2、Ixquick()
可搜索網站、MP3、新聞、圖象等多種網絡資源3、)
4、Turbo10/)
5、)
6、)
7、)
1.3因特網信息資源檢索下列不屬于元搜索引擎特點的是()。A.搜索時,用戶必須多次提交搜索請求B.可同時搜索多個數據庫C.一般支持AND、OR、NOT等操作D.一般只使用簡單、直接的搜索策略A三、因特網資源檢索策略
搜索內容引擎選擇一般信息資源綜合性的(百度、google)圖片、視頻特色的,也可以用綜合搜索引擎的某個功能專業性較強專業搜索引擎全面了解網上信息資源元搜索引擎
四、網上信息檢索技巧
1、使用空格
輸入更多的關鍵詞,只要在關鍵詞中間留空格, 這相當于多個關鍵詞之間的關系是邏輯“與”。
練習1,查找“出門在外”的歌曲
2、使用減號.
要避免搜索某個詞語,可以在這個詞前面加上 一個減號(“-”,
英文字符).但在減號之前必須留一空 格.如要了解搜索引擎歷史,可以這樣輸入關鍵字:搜 索引擎
宗教
-佛教
-基督教
3、添加英文雙引號.
雙引號中的詞語在查詢到的文檔中將作為一個整體出現.這一方法在查找名言警句或專有名詞時顯得格外有用.
練習2,請你比較應用下面兩組關鍵詞的搜索結果有什么不同
1,理科的學習方法
2,“理科的學習方法”
4,查找特定格式的文件.
Google可以
直接搜索13種非HTML文件.其中包括Flash的
swf
文檔,Microsoft
Office的(doc,
ppt,
xls,
rtf)
,pdf和其它類型文檔.格式是:關鍵詞
filetype:類型名.
(梅花三弄filetype:swf)
四、網上信息檢索技巧
5、標題搜索.
當我們需要搜索一篇關于某個主題的文章時,可以用以下的關鍵字:“intitle:關鍵字”.如“intitle:南瓜餅”
對比“intitle:南瓜餅”和“南瓜餅”的查找結果
6、網頁快照.
在訪問網站時,會將看過的網頁復制一份網頁快照,以備在找不到原來的網頁時使用.
四、網上信息檢索技巧五.
因特網信息檢索發展趨勢
(1)多媒體信
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2019-2025年基金從業資格證之私募股權投資基金基礎知識練習題(二)及答案
- 2025年企業租賃合同及注意事項
- 2025資產移交合同范本
- 農村集體物業出租合同樣本
- 冬儲保價合同樣本
- 農貿市場轉讓合同樣本
- 2025汽車買賣合同示范樣板
- 2025關于計算機軟件開發合同的范本
- 出海服務合同樣本
- 公司承包印刷合同樣本
- 放療皮膚反應分級護理
- 2025年03月內蒙古鄂爾多斯市東勝區事業單位引進高層次人才和緊缺專業人才50人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 小學消防知識教育
- 沖壓工理論知識試題(附答案)
- 全媒體運營中的用戶畫像構建試題及答案
- 2025年第三屆天揚杯建筑業財稅知識競賽題庫附答案(601-700題)
- 2025年四川綿陽市投資控股(集團)有限公司招聘筆試參考題庫附帶答案詳解
- 華北電力大學丁肇豪:多主體數據中心算力-電力跨域協同優化
- 顱內出血護理操作
- (二調)棗莊市2025屆高三模擬考試歷史試卷(含答案)
- 2024-2025學年下學期初中歷史八年級第二單元A卷
評論
0/150
提交評論