




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、百度相關性評估培訓:基礎篇本篇講述評估的概念、原則、要點等基本事項,是后面各項工作的基礎,請務必認真閱讀。看完后,您將了解如何推斷用戶搜索的意圖、怎么判斷搜索結果好壞的知識。目錄 TOC o 1-5 h z HYPERLINK l bookmark0 o Current Document 百度相關性評估培訓:基礎篇 1 HYPERLINK l bookmark2 o Current Document 為什么要搜索 1 HYPERLINK l bookmark4 o Current Document 相關性評估:是什么,怎么評,有何用 1 HYPERLINK l bookmark6 o Curr
2、ent Document 介紹幾個名詞 2如何推斷需求 3推斷 Query 背后的用戶需求 3 HYPERLINK l bookmark13 o Current Document 站在大多數用戶的角度,把握Query 的主要需求 3 HYPERLINK l bookmark15 o Current Document 評估時要考慮的七個維度 4 HYPERLINK l bookmark17 o Current Document 相關性:說的是不是一回事 4 HYPERLINK l bookmark19 o Current Document 需求比例:抓住主要需求 5 HYPERLINK l bo
3、okmark21 o Current Document 豐富程度:詳細全面 5 HYPERLINK l bookmark23 o Current Document 有效性:能否真正滿足 5 HYPERLINK l bookmark25 o Current Document 時效性:快,更快些 6 HYPERLINK l bookmark27 o Current Document 便捷性:找到目標信息要花多少時間和成本 6 HYPERLINK l bookmark29 o Current Document 權威度:英雄也要問出處 6評估原則 6站在大多數用戶的角度 6 HYPERLINK l b
4、ookmark34 o Current Document 不同 Query 需求類型,影響需求滿足的關鍵維度不同 7 HYPERLINK l bookmark36 o Current Document 結果滿足的程度和互聯網資源豐富程度有關 7 HYPERLINK l bookmark38 o Current Document 用戶需求的滿足是一個完整的過程 7 HYPERLINK l bookmark40 o Current Document 需求用戶的語種優先 7 HYPERLINK l bookmark42 o Current Document 需求用戶的地域優先 7 HYPERLINK
5、 l bookmark44 o Current Document 本篇小結 7. 為什么要搜索“百度一下” ,已經滲透到網民的生活當中。遇到什么問題,下意識地就想百度一下。百度一下已成為搜索的代名詞。那我們為什么要搜索?搜索是希望找到某些東西,這些“東西” ,我們稱為“信息” 。人們搜索,有著明確的目標,想找到信息,解答疑問,或獲取資源。. 相關性評估:是什么,怎么評,有何用本篇說的評估,是指判斷搜索結果的質量,衡量結果的好壞。評估的標準是看搜索結果是否能提供用戶想找的信息,滿足了用戶的需求,以及在多大程度上滿足了用戶的需求。這里面包含兩個層次:.搜索結果是否可以提供用戶想找的信息。如果結果正
6、是用戶所找,可以滿足用戶需求,則 是好結果;如果結果里沒有用戶想要的信息,沒有用戶關心的內容,則是差結果。.多大程度上滿足了用戶的需求。在能滿足用戶需求的前提下,用戶獲取信息的成本越低越 好,成本包括花費的時間、操作的步驟、用戶需要的信息是否可以明顯的展現出來等。百度的使命是“讓人們最便捷地獲取信息,找到所求”,目標是最大程度的滿足用戶信息需求,不斷完善搜索質量。相關性評估是提升搜索質量的一個基礎且核心步驟,我們需要通過評估來發現 目前的缺陷,以提高搜索質量。搜索引擎相關性評估工作的成果,將影響到包括您在內的數億百度 用戶的搜索體驗。.介紹幾個名詞為了便于講述,引入幾個名詞。Query,也可稱
7、查詢詞、關鍵詞、搜索詞,指用戶輸入到搜索框想要查找的字詞。以后出現 的Query,都會用括起來。用戶需求,簡稱“需求”,是人們輸入 Query想要尋找的信息。如搜索【新浪微博】,那用戶需求是找http:/。搜【如何減肥】,是想減肥,找減肥的方法產品活動等。結果,或搜索結果,指百度根據Query返回的搜索結果,可以指具體某一條,也可以指所有的結果。URL,統一資源定位符,也稱為網頁地址,簡稱網址。百度主頁的url是 “ HYPERLINK /_ / 。本文用url指代一條結果,指打開后的頁面。 HYPERLINK / / 表示新浪主頁。相關搜索,位于搜索結果頁下面,跟您的Query相似的一系列查
8、詢詞。搜【新浪】,其相關搜索如下圖所示。相關搜索新浪微博新淚博客新浪郵箱新浪微薄新浪網新浪體育新浪微波新浪財經新浪視頻新浪博登一搜索框提示,指輸入 Query的過程中,搜索框下方會自動出現提示詞。如下圖:%Bmi邯百度 斷聞 網頁 睡現道組圖左視頻幽 更箜*周|百度一下周杰倫周杰倫超時代演唱會周杰倫副本周杰倫副本歌詞周杰倫演唱會周杰倫新歌周杰倫科比周杰倫電影周杰倫微博周杰倫中文網.如何推斷需求推斷Query背后的用戶需求用戶為搜尋信息而來,推斷用戶的需求是評估的先決條件。只有準確地判斷出用戶需求,用戶 搜索的目的,才能合理地衡量結果的質量、好壞程度。劇情】、多數Query,本身表述清楚,含義明
9、確,以其表達出來的意思為準。如【讓子彈飛 體在線轉換】、【舞蹈教學視頻】等。有些Query,要依靠個人的知識、經驗、甚至搜索結果來輔助推斷。個人的知識、經驗每個人掌握的不同,通過查看搜索結果學習了解背景知識后,便能判斷出搜索的目的。比如如【bl怎么去諾森德】,如果您不玩魔獸世界,單看Query,很難弄明白其搜索意圖。通過查看幾個搜索結果后,就能知道用戶是找魔獸世界部落的玩家怎么去諾森德。因此,建議遇到不了解的Query,在判斷用戶需求的時候,先拿 Query到百度、Google等搜索引擎上搜索了解一下。我們需要盡量揣摩Query背后的搜索意圖,在個別情況下,有些搜索詞實在無法判斷用戶想找什么信
10、息,如【asdfasdfasdf,可以跳過(拋棄)這些詞。站在大多數用戶的角度,把握 Query的主要需求百度的用戶數以億計,搜索同一個Query,不同人可能有著不同的需求。這要求評估時要盡量掙脫個人局限,盡可能站在大多數用戶的角度來衡量,把握主要需求。但我們能看到的只是用戶搜索的Query,那怎么推斷 Query背后的主需求呢?推薦百度的搜索框提示和相關搜索。借助有關的查詢詞,輔助推斷用戶需求。舉個例子,【天龍八部】有多個含義,游戲、小說、電視劇、佛教本義等,那到底哪個是主需求呢。看搜索框提示,多是游戲相關,前兩個“天龍八部2”、“天龍八部2官網”,而“天龍八部2”也是網游??聪嚓P搜索,多數
11、是關于網游的,那么可以推斷搜【天龍八部】的主要需求是找網絡游 戲。天龍八部的搜索框提示:天龍八部1天龍八部2天龍八部2官兩 天龍八部黃日華版 天龍人部2 1BB8代金卡 天加K部官周天左人部2下裝 天龍凡部單機版 天龍”部下載 天龍八部海戲 天在八部攻喑天龍八部的相關搜索:相關搜索 天龍八部2現I故官網寶龍兒部官網大花人部落戲劫,二潼理也量下載天之邨黃日至版天加兒颯厚天花幾右的裱F栽天高八部單機版.評估時要考慮的七個維度評估,即評價結果的質量,判斷結果的好壞程度,看結果能給用戶帶來多少的幫助和價值。影 響用戶獲取信息的因素很多,我們列出常見的七種。相關性:說的是不是一回事相關性,是指結果跟用戶
12、需求的匹配程度,兩者說的是不是一回事,有沒有跑題。相關,是一 個好結果最基本的要求。后面其它的因素都建立在其之上。如果不相關,那肯定是糟糕的結果。不相關的典型情況有下面三種。掉了 Query中的重要成分。搜【閾怎么發音】,“閾”沒了。甚于共振峰襟式的漢語普通話中豹琦發音水平客觀測試方法的近究二I【摘荽】;鹿出了一坤以元音的共振國嘎式為特征基于支若向量嘰算法的分桀評怙方法一用以時漢語普通話中的韻母及育家三進行客觀測試q此算法為每個箭母分別訓完全分 美WW.cnki.C(X/Artic Ie -CJFDTCitaI-XIBA2DO 20 -4-。-百責共隱搜【查看 net Framework版本】
13、,用戶是找怎么查看 net Framework的版本。而結果里查看沒出現。根比。50代徵歟必匚。與口白匕三T二iarTiE。巾蛆件最學F2。萱石二)文亞微MicrosoftflttttMicrosoft.NFT FmmEWork用戶眾多r肝有的Mkosdft建造程序都靛修在建詁之摹網站找到下莪,快速的下效讓陽仃8巾用戶滿意r驅劭之家還提供詳盡的的Microsoft/ariversi 3.5-5435C 2011-4-14 -百店怕嚅拆散了 Query,意思完全偏離。查【林字有多少筆畫】,出來“爨字共有多少筆”你婦嚏寰,字共專冬)單三衛?而容攻咯 驢嗎嗎族濤攻陛旅游攻珞旅濤攻略旅游攻略傷加道蜜字
14、共有多少之畫 村名要底下的震宇,我肓三 十第I援CUAH音標字常、K字下面現火整,尢此燒林r越居盛興r巨不guide /20llf0111/1222S3 rtml 2011-S-3 -百度快照含意轉變。搜【李文】,出來“李文和”。李文和案新聞中心新浪網一年前的g月1曰,華裔科學家李文和為自己洗脫了T司諜罪的不白之冤r芝w了監壇, 但根據他向法庭1是出的保證.frt他將不得不隨時凄受聯邦調宜居的問訊一一 n ews sinax om. c n/wona/l iw h/ 2011-1-21 - 百就噓搜【介詞】,需求是找語法中的介詞,而出來的是“介詞的電影”。介諭的電導十介詞的電影看過門S部)介詞
15、的影評篇無措符于,音了電影其后h其后,其后有 什么?百合在,或者一個投在白堵上的人哥?有邁克的文字在先.事da.cQn00005 2010-li-05 十需求比例:抓住主要需求搜同一個 Query,不同用戶的需求可能不同。此時,要站在多數用戶的角度來判斷,越多人查 找的需求越重要。主要需求是最多人找的,滿足主要需求的結果,是最好的結果。搜【天龍八部】 主要需求是網絡游戲,其官方網站“ HYPERLINK / / ”比其它結果都要好。豐富程度:詳細全面多數的查詢,越詳細的資料內容越好。搜【感動的作文】,通常用戶會參考多篇作文,這是提供多篇結果比一篇好。找某個新聞事件,專題要比單篇好。搜索某部電視
16、劇,如【一起又看流星雨】 全集通常比某一集好。搜索【電腦無法開機】,由于原因有多種,分析地越詳盡越好。有效性:能否真正滿足用戶需求的滿足是完整的過程。一定要注意用戶搜索的最終需求是什么,這個結果能不能滿足 最終的需求。搜軟件下載,不能看到頁面上出現這幾個字就到此為止。用戶需求是下載安裝使用該 軟件,要準確地評估,必須嘗試下載,看其是否真實可用。若是冒牌偽裝,或者有病毒木馬,當然 非常糟糕。搜【小學數學教學論文】,出來列表頁,都是小學數字方面的論文,怎么樣,很好吧,先別急,要點擊一兩篇論文,看看其是否完整有效。要得到某些資源,有時面臨著限制,不能直接獲取。如找某文檔,要注冊、或花錢才能下載; 想
17、看電影,要裝插件。多數用戶都希望直接、免費、快速地得到;裝軟件、注冊、花錢,大大增加 了用戶的成本,不能算質量高。如果稀缺資源甚至唯一,那用戶可能愿意用更多的成本來獲取資源。舉個嚴重的例子, 這個頁面( HYPERLINK / / ),從標題到正文都是酷狗,立即下載 的鏈接指向“ HYPERLINK /%e9%85%b7%e7%8b%972010.exe /酷狗2010.exe”。搜【酷狗下載】,出這個頁面,怎么樣,挺 好吧。可惜的是,它不是酷狗而是酷我。更要命的是,下載后只要一點擊軟件,馬上自動安裝,不 能中止!時效性:快,更快些有些查詢,對時間有著較高的要求,期望得到最新的信息。常見的是突
18、發新聞的搜索。哪怕沒有明確指定什么新聞,給出最新的內容也是很好的。搜【上海大火】 ,自20101115后相當長一段時 間,都是找20101115發生的膠州路大火。20110228前后幾天搜索【奧斯卡】,主要需求是找83屆奧 斯卡金像獎。招聘、交易等對時效性要求高,內容的生成時間極其重要。如果過期了,是陳舊的信息,那對 用戶通常沒什么價值。找某方面的招聘信息,若招聘已結束,自然沒什么用。幾個月前的物品交易 信息,很可能交易已完成,現在找到沒多大價值。找【電腦組裝配置單】,兩年前的配置單,給用戶的幫助很小。搜【U盤價格】,一年前的價格很難維持到現在。便捷性:找到目標信息要花多少時間和成本便捷性,指
19、從打開頁面開始,到尋找到所需信息、達到最終目的,所要花費的時間和成本。如 果頁面有十來屏,所需信息不在第一屏,很多人立馬放棄。如果頁面凌亂,或廣告晃眼,或廣告很 多,同樣影響用戶。好的結果應當在第一屏顯著位置給出目標信息,讓用戶輕易地看到。權威度:英雄也要問出處權威性考察的是內容發布在不同網站、或內容貢獻者的身份給用戶的不同感覺。同樣的軟件, 都能下載,用戶更傾向點擊自己認識的華軍、天空、多特、太平洋等知名軟件下載站上的結果。同 樣一篇新聞,出現在新浪新聞、新華網上,跟bbs、個人博客上的轉載相比,前者當然更權威。醫治健康、法律相關問題,醫生、律師的回答,肯定更讓人們信服。官方網站發布的信息,
20、比其它網站 更可信。.評估原則站在大多數用戶的角度評估結果的質量,最重要的是站在大多數用戶的角度。從大多數用戶需求出發,能讓用戶快速找到所需,才算好結果。同一個 Query,不同用戶可能會有不同的需求,需要分析預判各類需求中, 大多數用戶更需要哪類需求,其次是哪類需求等。能滿足大多數人的需求,即主要需求的結果,好 于僅滿足小眾需求的結果。不同Query需求類型,影響需求滿足的關鍵維度不同上文1.5講述了評估時要考慮的七個維度,對于不同Query需求類型,影響用戶需求滿足的關鍵維度不同。搜軟件,有效性是關鍵。找范文例文,豐富程度是關鍵。尋新聞事件,時效性是關鍵。判斷時,要識別把握住關鍵維度。結果
21、滿足的程度和互聯網資源豐富程度有關評估時,要考慮互聯網上已有資源的多少。搜某人的資料,如果網上到處都有,有很多豐富的 內容,如果某結果只是簡單的介紹,那它不算好;如果網上關于該人的信息極少甚至沒有,那簡短 的介紹也很不錯。用戶需求的滿足是一個完整的過程用戶需求的滿足是一個完整的過程,評估時,要跟隨用戶的腳步,走到最后一步,關注結果是 否真正地對用戶有幫助。如搜電視劇,出來視頻列表頁,要隨便點擊幾個,判斷能不能看。如搜軟 件下載,要嘗試下載,看其是不是有效的。需求用戶的語種優先百度面向中文用戶服務。一般情況下,中文結果要優于外文結果。國際企業,如【舊M】、【諾基亞】、【香奈兒】等,往往既有英文官
22、方網站,也有中文的,那么搜索企業名稱時,優先給出中文 官方網站更好。當然明確需要查找外文網站的需求除外,如【bbc英文網站】。需求用戶的地域優先有些網站,各地有分站或頻道,如 58同城、中國移動等。搜索這些網站時,通常給出搜索者所在地的結果更好。如在北京的用戶,查【中國移動】 ,結果里給出中國移動北京分公司的信息要比給 其他省份的好,如 HYPERLINK /index/service/ /index/service/ 。.本篇小結人們借助搜索引擎進行信息搜索,是想低成本高效率的找到所需的信息。百度的使命是提高搜 索質量,讓人們更便捷地找到所求。評估結果的質量,能幫助百度發現當前需求滿足過程中的問題, 以改進搜索結果質量,更好的為網民服務。評估,是從用戶需求出發,評價結果是否滿足以及多大程度滿足了用戶的需求。評估的前提是準確地推斷出用戶需求。多數Query本身含意明確,少數不能確定Query用戶需求的情況,可以借助查看百度、Google的結果來了解背景知識。當同一個 Query可能有多樣的需求時,可通過搜索框提示和相關搜索來推測大多數用戶需要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 多維經營績效管理體系建設
- 安徽省阜陽市太和中學2025屆高三第二次檢測試題數學試題試卷
- 股權分配的協議書二零二五年
- 專業愛情合同范例
- 涉法涉訴信訪培訓
- 七中語文考試卷子及答案
- 七下道法期中試卷及答案
- 礦山碎石施工方案
- 商業物業消防安全管理思路
- 尼龍圍欄施工方案
- 2025-2030年中國CAE軟件行業市場行情監測及發展前景研判報告
- 2025江西南昌市江銅產融社會招聘1人筆試參考題庫附帶答案詳解
- (二統)昆明市2025屆“三診一?!备呷龔土暯虒W質量檢測地理試卷(含答案)
- Unit 3 Keep Fit Section A 2a-2e 教學設計 2024-2025學年人教版(2024)七年級英語下冊
- 2025徽縣輔警考試題庫
- (一模)2025年廣東省高三高考模擬測試 (一) 卷數學試卷(含官方答案)
- 腦心健康管理師的學習匯報
- 樹木移植合同范本
- 2025年開封大學單招職業技能測試題庫新版
- 2025年張家界航空工業職業技術學院單招職業技能測試題庫及參考答案
- 財政投資評審咨詢服務預算和結算評審項目投標文件(技術方案)
評論
0/150
提交評論