探索Google搜索的未來_第1頁
探索Google搜索的未來_第2頁
探索Google搜索的未來_第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

探索Google搜索的未來

但是Goolge的未來搜索技術將完全是另外一番面貌。在一次開放的座談會上,Singhal,一個在搜索領域工作了20年之久的人,曾經大概描繪過將來的搜索將不僅僅是文字檢索,而是要理解每一個字節的意思和他們之間的關系。這也就是說,Goolge的未來搜索引擎將不僅僅理解你的關于湖的問題,而且明白湖是什么意思(有水的地方),甚至會告訴你每個湖的更多細節,例如深度,表面積,溫度或者是鹽濃度。要想理解Google的未來會是什么樣,必須先懂得她過去是什么樣。Singhal說搜索以前是基于語義,然后進行關鍵詞索引,這種情況一直到20世紀中葉的后期也沒多大改變。互聯網的出現才使她發生一些改變。突然,搜索有了一個新的朋友:鏈接。Amit說Google是第一個把鏈接看作“推薦代理”的。在早些年,Google的搜索結果是基于鏈接的數量和這些鏈接的權重的。現在,Google增加了內容和關鍵詞的比重,或者是一個準確的問答也是能增加權重的。最終,Google將從單純的檢索關鍵詞變成解釋關鍵詞。Google能夠意識到單詞“New”和“York”出現在一起的時候,會突然改變他們單獨的意思。Google發展統計部門把這種詞組看成是一個新單詞。然而,Google現在還不能理解NewYork是一個有地域有人口的城市。詞序和詞義是現在Google能夠識別的,但是這對于剛剛被選為國家工程院士的Singhal和Google都是不夠的。大的改變Google想要把文章里面的句子變成單個字節來理解它們的意思甚至是引申含義,這正是我們的大腦經常做的。但是對于計算機來說,這還屬于人工智能的范疇。Singhal說Google將要建立一個巨大的內部知識庫,來儲存世界上每一個字節和詞組,然后理解你搜索這些字節的目的。這是一個相當有挑戰性的任務,但是這項工作已經開始做了。Google在2010年收購了Freebase,它是一個社區共同創建知識的網站,包含了12000000個權威的詞條。一千兩百萬是一個好的開始,但是Singhal說Google已經投巨資建立一個更龐大的知識庫,包含了相關的字節和他們的引申含義。基于單詞的檢索變成這種基于知識圖表的檢索是一個根本性的轉變,這將急速增大搜索結果的威力,當然也增加算法的復雜程度。Singhal解釋說單詞的檢索從本質上來講就同你在印刷書的后面找到的檢索一樣,而基于知識圖標的檢索要比單詞檢索龐大的多而且將不斷更新和改進。Singhal告訴我現在Google正在建設基礎設施和購置更多地計算機以應對將來更為復雜的搜索。這些計算機幫助這個搜索巨人建立知識庫,它包含了多達2億條字符,對于這個你只能表示很無語。起初,大部分只是知道一點點。雖然這種人工智能已經開始在Google的搜索結果中開始顯示,但是大部分人沒有注意到過它。知識庫在Google搜索框中輸入“莫奈”,在以往的標準結果下面你會發現一小塊新區域:“克勞德·莫奈的藝術作品”。這里有他的五個或者是六個代表作的縮略圖。Singhal說這表示Goolge已經開始懂得莫奈是一個畫家而且對一個畫家而言最重要的是他的繪畫作品。當我說道這個新的搜索結果并沒有使整個搜索變得面目全非也沒有被置于普通搜索結果之前時,Singhal謹慎的說判斷這種搜索結果的權重就像判斷一個畫家一兩歲時的作品一樣難。這也可以被看作是Google對她的主要競爭對手——微軟的必應——的反擊。這個軟件巨人有一套嚴苛的商業法則,他們批評某搜索公司顯示的結果缺乏內容相關性,大部分人都知道這個批評是針對Google的,而Google現在正努力提高的她的搜索結果的質量。當我問Singhal他是否曾經考慮過必應的批評,或者意識到必應一直宣稱他們的搜索結果與有用的答案關聯度更高而不是鏈接。他拒絕回答,說他不會對必應也許做了或者也許沒做的事情做出評論。值得注意的是數以百萬的人認為他們通過蘋果的iphone4S和Siri接觸到了人工智能,它通過手機和互聯網能夠回答人的語音問題。不管Google的知識圖標能做什么,她都必須超越Siri才行。集中精力瞄準未來搜索也許對于Singhal來說有點難,他說我們也在制造大型強子對撞機,我現在不能預測他將來會產生什么樣的粒子。Singhal在另一方面也承認建立星級迷航式的計算機是他的夢想。在上世紀六十年代科幻電視播出的《星際迷航》中的電腦就像Siri,你可以問它任何問題然后獲得一個正確的答案。他說建設這個龐大的知識庫和基礎設施能夠幫助他們更好的處理搜索問題,這也將是他們建立星際迷航式計算機的重要一步。超越搜索說到星際迷航,Singhal說有另外一個科技前沿將受益于Google的知識庫:機器人學。他說現在還沒有任何專家注意到機器人學雖然處于機械工程和計算科學的交叉路口,但是即將引來語言功能的巨大轉變。他說我相信我們正處于機器人學習語言合作的時期,而這在將來會變成人機交互合作。作為一個機器人的狂熱愛好者,對我來說這是一個令人興奮的想法。我開始描繪一幅雖然Singhal并不認同的畫面:未來的機器人將會配置Google的這種基于字符的搜索功能,他們甚至能夠理解他們照顧的小寶寶(什么?你不準備把小寶寶留給機器人照看?)很小,很脆弱而且總會感到饑餓。機器人能夠知道什么時候喂小寶寶,因為在他們的理解中“小寶寶”和“總是饑餓”是聯系在一起的,而且它們將組成一個知識庫中的一個字符,這個字符還

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論