




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
人工智能技術基礎計算機與軟件學院第六章知識圖譜01什么是知識圖譜02知識圖譜架構03知識圖譜構建04知識圖譜應用01什么是知識圖譜機器知識庫自動推理輔助決策人腦知識庫人類思維決策知識圖譜人腦思維知識圖譜是知識工程的一個分支,是以知識工程中的語義網(wǎng)絡作為理論基礎,結合了機器學習、自然語言處理、知識表示和知識推理等相關技術,以結構化的形式來描述客觀世界中的各種概念和實體間的關系,使機器在信息表達方面能夠更加接近人類的思維方式。什么是知識圖譜:一般定義傳統(tǒng)的搜索引擎主要采用基于關鍵詞的搜索技術,搜索結果是一個包含關鍵詞的網(wǎng)頁列表。基于知識圖譜的搜索引擎采用語義網(wǎng)絡的搜索技術,搜索結果直接給出用戶需要的答案,極大改善了用戶體驗。搜索結果直接給出了答案給出了人物的關系圖譜什么是知識圖譜:語義搜索知識圖譜本質上是一種叫做語義網(wǎng)絡(SemanticNetwork)的知識庫,是一個采用有向圖結構建立起來的知識庫,旨在描述真實世界中存在的各種實體或概念及其關聯(lián)關系,其構成一張巨大的語義網(wǎng)絡圖。
節(jié)點表示概念或者實體,邊則由關系和屬性構成。高質量的搜索效果歸功于搜索引擎背后的知識圖譜什么是知識圖譜:語義網(wǎng)絡知識的一個經(jīng)典定義來自于柏拉圖:一條陳述能稱得上是知識則必須滿足三個條件,即知識一定是被驗證過的、正確的、被人們相信的,這也是科學與非科學的區(qū)分標準。數(shù)據(jù)是反映客觀事物運動狀態(tài)的信號通過感覺器官或觀測儀器感知而形成的文本、數(shù)字、事實或者圖像等符號形式的記錄。數(shù)據(jù)是原始的記錄,未被加工解釋,沒有回答特定的問題,與其他數(shù)據(jù)之間沒有建立相互聯(lián)系。信息是對數(shù)據(jù)進行加工處理,使數(shù)據(jù)之間建立相互聯(lián)系,形成回答了某個特定問題的文本,以及能夠被解釋成有具體意義的數(shù)字、事實、圖像等。信息是隱藏在數(shù)據(jù)背后的規(guī)律,需要人類的挖掘和探索才能夠發(fā)現(xiàn)。數(shù)據(jù)信息知識來源于數(shù)據(jù)和信息,但不是數(shù)據(jù)和信息的簡單積累。知識是可用于指導實踐的信息,是人們在改造世界的實踐中所獲得的認識和經(jīng)驗的總和,是人類對物質世界以及精神世界探索的結果總和,是數(shù)據(jù)和信息更加高級抽象的概念。知識什么是知識圖譜:知識的定義本體通常用來描述領域知識,是從客觀世界中抽象出來的一個概念模型,這個模型包含了某個學科領域內(nèi)的基本術語和術語之間的關系,或者稱為概念以及概念之間的關系。本體表示法知識表示的方法有很多種,而在知識圖譜中應用最為廣泛的是本體表示法和語義網(wǎng)絡表示法概念是某一領域內(nèi)相同性質對象集合的抽象表示形式。例如在教育領域的本體中,教師、學生、課程都是概念實例是概念中的特定元素,一般都對應著客觀世界的具體事物,例如《人工智能技術基礎》課程是課程概念的一個實例關系是概念與概念之間或者概念與實例之間的關系類型,例如羊和綿羊這兩個概念之間存在概念與子概念的層次關系,綿羊屬于羊什么是知識圖譜:知識表示(1)語義網(wǎng)絡是一種通過概念及其語義聯(lián)系來表示知識的有向圖,其基本單元是節(jié)點和邊。節(jié)點表示事物、概念、情況、屬性、狀態(tài)、事件和動作等,邊表示節(jié)點之間的聯(lián)系或關系。語義網(wǎng)絡表示法知識表示的方法有很多種,而在知識圖譜中應用最為廣泛的是本體表示法和語義網(wǎng)絡表示法什么是知識圖譜:知識表示(2)豬和羊是動物豬和羊都是哺乳動物野豬是豬,生活在森林里山羊是一種羊,頭上長著角綿羊是羊,能夠生產(chǎn)羊毛語義網(wǎng)絡描述的是事實/知識第六章知識圖譜01什么是知識圖譜02知識圖譜架構03知識圖譜構建04知識圖譜應用02知識圖譜架構
數(shù)據(jù)層(DataLayer)是將事實以“實體-關系-實體”或“實體-屬性-屬性值”三元組的形式進行存儲,形成一個網(wǎng)狀的知識庫。在知識圖譜的數(shù)據(jù)層,用節(jié)點表示實體,用邊表示實體間關系或實體的屬性。舉例:(中國,首都,北京)模式層(SchemaLayer)是知識圖譜的概念模型和邏輯基礎,對數(shù)據(jù)層進行規(guī)范約束,多采用本體作為知識圖譜的模式層,借助本體定義的規(guī)則和公理來約束知識圖譜的數(shù)據(jù)層,即按照模式層的規(guī)范來組織和管理數(shù)據(jù)層。舉例:(國家,擁有,人口)數(shù)據(jù)層模式層數(shù)據(jù)層存儲和管理的是以事實為單位的知識;模式層位于數(shù)據(jù)層的上層,是知識圖譜的核心層,存儲和管理的是經(jīng)過提煉和抽象的知識。知識圖譜架構:邏輯架構知識抽取從原始數(shù)據(jù)中抽取知識要素知識表示將知識單元表示成計算機可以理解和處理的形式知識融合將不同來源的知識整合起來質量評估對不準確或者錯誤的知識進行修正知識推理模擬人類思維的推理方式,挖掘隱含的知識從最原始的數(shù)據(jù)出發(fā),采用一系列自動或者半自動的技術手段,從原始數(shù)據(jù)和第三方知識庫中提取知識事實,并將其存入知識庫的數(shù)據(jù)層和模式層知識圖譜架構:技術架構第六章知識圖譜01什么是知識圖譜02知識圖譜架構03知識圖譜構建04知識圖譜應用03知識圖譜構建根據(jù)知識圖譜的邏輯架構,知識圖譜的構建過程就是模式層和數(shù)據(jù)層的實現(xiàn)過程。
知識圖譜的構建是以原始數(shù)據(jù)為輸入,依次經(jīng)過數(shù)據(jù)處理、知識抽取、知識融合、知識存儲、知識計算和知識服務多個流程,最終通過服務接口對外提供服務,支撐各行各業(yè)的知識應用。知識圖譜構建(1)知識圖譜的核心是基于語義網(wǎng)絡的知識庫,一條條知識是以計算機能夠處理和理解的形式保存在知識庫中,數(shù)據(jù)是知識的來源和基礎,特別是來自互聯(lián)網(wǎng)的數(shù)據(jù)具有豐富性和多樣性的特點,因此要求知識圖譜能夠處理大規(guī)模的異構數(shù)據(jù)。
按照不同類型數(shù)據(jù)的特點,通常將數(shù)據(jù)分為三類:結構化數(shù)據(jù)、非結構化數(shù)據(jù)和半結構化數(shù)據(jù)。1.原始數(shù)據(jù)結構化數(shù)據(jù)關系數(shù)據(jù)庫二維表半結構化數(shù)據(jù)HTMLXMLJSON非結構化數(shù)據(jù)文檔圖片聲音視頻結構化數(shù)據(jù)示例半結構化數(shù)據(jù)示例知識圖譜構建(2)知識建模的理論基礎是本體論,根據(jù)概念間的上下位關系將概念組織成樹結構或者有向圖無環(huán)結構,根據(jù)概念間的上下位關系及其組織結構能夠進行知識推理。知識圖譜對接外部數(shù)據(jù)源進行原始數(shù)據(jù)的采集和處理,包括結構化數(shù)據(jù)、半結構化數(shù)據(jù)、非結構化數(shù)據(jù)。
針對不同類型的原始數(shù)據(jù),有著不同的處理技術。2.知識建模3.數(shù)據(jù)處理知識抽取主要是從數(shù)據(jù)中抽取構成知識的基本元素,主要包括實體、關系、屬性、屬性值以及事件信息,將知識元素組織成知識條目。4.知識抽取知識圖譜構建(3)知識融合的目的就是將不同來源的知識進行合并整合,消除知識之間的不一致性、歧義性、沖突性、冗余性。
知識融合所涉及的技術主要包括實體對齊、實體消岐和指代消解。經(jīng)過知識融合和質量評估處理之后,得到的是最終確定的高質量的知識,需要存儲到知識庫中永久保存。
通常采用兩種知識存儲的方式:RDF三元組和屬性圖。5.知識融合6.知識存儲受到當前技術水平的限制,從外部公共開放域采集并抽取的知識有可能存在質量問題,甚至可能存在錯誤,同時通過知識推理產(chǎn)生的新知識也可能不準確,因此知識在存儲到知識庫之前,需要有一個質量評估的過程。7.知識管理知識圖譜構建(4)知識圖譜的語義網(wǎng)絡知識庫是一個龐大的圖形結構的知識網(wǎng)絡,在各種圖算法的支持下,提供了強大的圖計算能力,能夠高效地進行圖遍歷、路徑計算、社群計算、相似子圖計算、本體推理、規(guī)則推理等一系列的計算。知識服務是將知識圖譜的知識計算能力封裝成一種服務能力,提供給上層的知識應用,上層應用可以通過服務API接口調(diào)用知識圖譜的能力,從而支撐應用實現(xiàn)相應的業(yè)務場景。8.知識計算9.知識服務目前基于知識圖譜的應用非常廣泛,已滲透到各行各業(yè)。例如搜索引擎的語義搜索、語音助理的智能問答、電子商務網(wǎng)站的個性化推薦、公安機關的情報分析、金融行業(yè)的風險控制等,都是知識圖譜大顯身手的領域。10.知識應用知識圖譜構建(5)第六章知識圖譜01什么是知識圖譜02知識圖譜架構03知識圖譜構建04知識圖譜應用04知識圖譜應用行業(yè)應用金融證券公安電商生活娛樂農(nóng)業(yè)醫(yī)療制造其他智能語義搜索金融反欺詐智能制造
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年惠州貨運從業(yè)資格證考題
- 2025年柔性自動化裝備項目合作計劃書
- 2025年紹興從業(yè)資格證應用能力考些啥
- 2025年宜賓貨運從業(yè)資格證考試模擬考試
- 2025年呼和浩特貨運資格證題庫及答案
- 2025年電力計量儀表項目建議書
- 2024年2月份儲油罐靜電消除裝置迭代升級項目書
- 漸進式上下文交互與注意力機制在混凝土路面裂縫檢測中的應用
- 極端天氣下風光互補發(fā)電系統(tǒng)的平穩(wěn)性研究及輸電規(guī)劃建議
- 2025年含油子仁項目合作計劃書
- 2025年全國中小學生安全教育日專題
- 滬教版小學五年級數(shù)學下冊全冊單元試卷
- 中俄技術創(chuàng)新合作的必要性和領域選擇
- 表B旅游民宿一般要求評分表
- 河北省中等職業(yè)學校專業(yè)設置管理辦法實施細則
- 醫(yī)院物業(yè)運送服務專項方案
- 氯化銨安全技術說明書MSDS
- 河海大學材料力學第五章彎曲應力
- 關于建立涉農(nóng)貸款專項統(tǒng)計制的通知銀發(fā)號
- 螺桿設計說明書
- 國家開放大學《理工英語3》章節(jié)測試參考答案
評論
0/150
提交評論