Graph+AI:立足DB-GPT社區探索GraphRAG未來架構_第1頁
Graph+AI:立足DB-GPT社區探索GraphRAG未來架構_第2頁
Graph+AI:立足DB-GPT社區探索GraphRAG未來架構_第3頁
Graph+AI:立足DB-GPT社區探索GraphRAG未來架構_第4頁
Graph+AI:立足DB-GPT社區探索GraphRAG未來架構_第5頁
已閱讀5頁,還剩54頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

全球機器學習技術大會主辦方合作伙伴異步社區wwwwnuhitwww.epuDl.Co清華大學出版社TSINGHUAUNIVERSITYPRESS清華大學出版社TSINGHUAUNIVERSITYPRESSCHINAMACHINEPRESS2025技術會議一技術人的思想盛宴2025技術會議一技術人的思想盛宴全球機器學習04月18-19日上海10月17-18日北京全球產品經理大會6月6-7日北京Summit全球軟件研發8月15-16日上海全球全球C++及系統軟件技術大會12月12-13日北京SoftwareSummitAIGC怏空2024長沙中國12024長沙中國1I111!!!2020-2024產品評測客戶案例活動整理專題權威出版大模型驅動軟件開發智能化的四大誤區《新程序員》聚集全球技術大師、行業技術先鋒,從前沿技術到《中國開發者調查報告》中國樣本豐富的開發者調查報告,目前已成為完整準確了解中國開發者市場的重要參考資料。CSDNCSDN掃碼購買最新版程序員雜志Al掃碼購買最新版程序員雜志MLML-Summit2024全球機器學習技術大會范志東螞蟻圖計算開源負責人范志東圖計算布道師,負責TuGraph的開源技術演進、社區運營和商業化等工作。TuGraphMaintainer、DB-GPTGraphRAG作者、《自己動手構造編譯系統》作者。先后就職于騰訊、阿里云、螞蟻,從事大數據平臺、云數據庫、圖計算相關的產品設計和技術建設。在分布式計算、數據安全管理、數據中臺架構、開源布道等領域有豐富的開發和實踐經歷薛明薛明架、數據挖掘與分析等領域。于2024年7月創立Al產品團隊,負責基于大模型的應用產品演講主題:Graph+AI:立足Graph+AI:立足DB-GPT未來架構螞蟻集團螞蟻集團"ANTGROUP全球機器學習技術大會Graph+Al:立足DB-GPT社區探索范志東螞蟻圖計算開源負責人薛明Percena創始人兼CEO全球機器學習技術大會ANTGROUPML-Summit2024全球機器學習技術大會Graph+Al技術浪潮圖(Graph):圖譜的圖由頂點和它們之間的邊構成的數據結構 頂點表示實體或概念好友好友員工F員工A坦2項目x表模型員工E公司2員工D好友公司1受雇受雇項目員工員工ID名宇職位|電話②DFE員工關系親屬關系全球機器學習技術大會 ·事物的普遍聯系性,面向真實世界建模螞蟻集團ANTANTGROUPML-Summit2024全球機器ML-Summit2024全球機器學習技術大會RequiredPrompt:"{pastPrompt:"{past_messages}{question}"Outputparser:regex("Answer:(.*)"){"question":...}Outputparser:regex("Answer:(.*)"){"question":...}Modelmultiplemodulesoptimization記憶CollborativeFine-optimization記憶Index/pre-retrieval/post-rAlloftheabove{"past_messages":[.J}GeneratorFine-GeneratorFine-tuninge.g.CoT,ToTArXivBingArXivBingSearchRequiredGGoogletoolGGoogleOHuggingFaceTOOLSQLTOOLSQLYoutubeYoutube函數調用函數調用反思ObservationsObservationsReasonOnlylegReasonOnlyleg.Chain-ofthought)/螞蟻集團ML-Summit2024ML-Summit2024全球機器學習技術大會應用智能體知識圖譜圖系統優化圖系統優化圖基礎模型圖采樣圖數據構建圖基礎模型知識表示圖數據增強大模型浪潮下的圖計算全國智能計算標準化工作組圖計算研究組編著2024年11月數據全國智能計算標準化工作組圖計算研究組編著2024年11月螞蟻集團國505寸在JT目全球機器學習技術大會不85(感知思維)控制強化學習智能控制具身智能決策樹神經網絡學習符號主義連接主義(具象思維)ML-Summit2024全球機器學習技術大會ML-Summit2024全球機器學習技術大會Howdidtheartisticmovementsofthe19thcenturyimpactthedevelopmentofmodernartinthe20thcentury?Theartisticmovementsofthe19thcenturyinfluencedmodernartinthe20thcenturybyencouragingexperimentationwithcolor,form,andsubjectmatter.Thesemovementspavedthewayforabstraction,expressionism,andotherinnovative.Howdidtheartisticmovementsofthe19thcenturyimpactthedevelopmentofmodernartinr1.ImpressionistartistslikeClaudeMonetintroducednewtechniquesthatrevolutionizedthedepictionoflightandcolor.2.TheImpressionisttechniquesinfluencedlaterartmovements.3.PabloPicassopioneeredtransformedtheapproachtovisualrepresentation.4.Cubismemergedintheearly20thcenturyandchallengedtraditionalperspectivesonart.…ImpressionistartistslikeClaudeMonetinthe19thcenturyintroducednewtechniquesthatinfluencelaterartmovements.PabloPicassopioneeredCubismrelativityintheearly20thcentury.WHowdidtheartisticmovementsofthe19thcenturyimpactthedevelopmentofmodernartinthe20thcenturyW-(ClaudeMonet)-[introduced]→(newtechniques)-(newtechniques)-[revolutionized]→(depictionoflightandcolor)-(Impressionisttechniques)-[influenced]→(laterartmovements)-(PabloPicasso)-[pioneered]→(Cubism)-(Cubism)-[emergedin]→(early20thcentury)Monetintroducednewtechniquesthatrevolutionizedthedepictionoflightandcolor.HisImpressionisttechniquesinfluencedlaterartmovements,includingPicasso'sCubism,whichemergedintheearly20thcentury.ThisinfluencehelpedshapePicasso'sinnovativeapproachtofragmentedperspectives.螞蟻集團螞蟻集團ANTGROUPMI-Summit2024結果O查詢搜索搜索相關文檔索引螞蟻集團螞蟻集團""ANTGROUP全球機器學習技術大會知識圖譜+知識圖譜+AlHarrionHarrion/kg#1016feat:KGRAGqueryengine,enableGraphRAGonexistingKGs#7204DarrenEdge,HaTrinh,NewmanCheng,JoshuaBradley,AlexChao,ApurvaMody,StevenTruitt,JonathanLarson#arxivfeat:addGraphRAGframeworkandintegrateTuGraph#15062024.05.27Camel(Cam2024.05.27Camel(Camfeat:knowledgegraphagent#566Graphviewfrominfomodel#369Amodulargraph-basedRetrieval-AugmentedGeneration(RAG)system#githubAddgraphrag#1793BociPeng,YunZhu,YongchaoLiu,XiaoheBo,HaizhouShi,ChuntaoHong,YanZhang,SiliangTang#arxivANTGROUPML-Summit2024全球機器學習技術大會架構設計EmbeddingModelDocumentsLoadertext—Splitter-chunks-Embeddingvectors—VectorStoreML-Summit2024全球機器學習技術大會 AnswerLLM—prompt—(synthesizer)relevantchunks—-chunks-Extractor—triplets—GraphStoreQuestionExtractor—keywords—TraverserAnswerLLM—prompt—synthesizer)—subgraph— ·圖譜上下文"text—索引的通用架構Vector+Text+Graph索引的通用架構Vector+Text+Graph KnowledgeGraphload|search|delete|…chat|embedding|…GraphStoreupsert|traverse|query|delete|….中國圖數據庫國外圖數據庫DatabasesthatsupportDatabasesthatsupportvectorsearchDedicatedvectordatabasesmarqomarqovespa中阿里云騰訊云&GFLAxYeHSEAgensCroh寒HGraphDBvespa中阿里云騰訊云&GFLAxYeHSEAgensCroh寒HGraphDBO·Milvus中方電畫Fabarta金山云華為云huapGraphredis云Guure桌flureeGraphStoreBase(ABC)(dbgpt.storage.graph_store.base)fluree電網口泰凡科技Thutmose電網口泰凡科技ThutmosePineconeTHiTopGraphgrAphbase.aiVelociyDB?◎MemoryGraphStore(Graph TuGraphStore(GraphStoreBase)( TuGraphStore(GraphStoreBase)(dbgpt.storage.graph知識庫配置2知識庫類型知識庫配置2知識庫類型3上傳4分片*知識庫名稱*存儲類型知識圖譜小微軟GraphRAGText:summaryofTextchunks2.Summarization53679678ML-Summit2024全球機器學習技術大會arXivarXiv:2404.16130SourceSourceDocumentsGlobalAnswerIndexingTimePipelineStageQueryTimeElementSummariesElementInstances基于社區摘要解決QFS問題arXiv:2404.16130螞蟻集團螞蟻集團ANTGROUP由元素摘要、社區摘要全局檢索、本地檢索甲Token開銷大、延遲高甲框架復雜、擴展困難社區摘要&文檔結構&混合檢索全球機器學習技術大會ML-Summit2024DocumentsLoadertextSplitter-chunks—GraphExtractorchunks/triplets/summaries—CommunityDiscoverysearchKeywordExtractor)—CommunityDiscoverysearchKeywordExtractor)—keywords-TraverserglobalsearchMetaStoreSummarizersynthesizerAnswerglobalsearchMetaStoreSummarizersynthesizerAnswerLLM—prompt—TimeTokensAgentAgent人個行Text人個行意圖識別GQL意圖識別VectorCypherTuVector→ML-Summit2024ML-Summit2024全球機器學習技術大會similarsearchsave·chunkcμnUKchunkcμOJKcμnuKANTGROUPANTGROUP小圖社區摘要小圖社區摘要全球機器學習技術大會 ·社區摘要:主題識別、流式、增量總結保存摘要:高效召回社區摘要loadGraphStoreGraphStorecommunitiescowwru!fλD!ecoAGLλcowwru!f!e2cowwru!fλD!ecoAGLλcowwru!f!e2gH!GL9Lcμλ全球機器學習技術大會全球機器學習技術大會基于混合檢索的多路搜索traversetraversewwroc9|269LCμANTroc9|269LCμANTGROUPANTGROUPML-Summit2024全球機器學習技術大會從社區來到社區去小社區->朋友->伙伴Vector|Graph:螞蟻首個開源GraphTuGraph源碼解讀-微軟GraphRAG框架GraphRAG技術交流(69)明哥說AIML-Summit2024全球機器學習技術大會v0.6.0·Supporthigher-orderoperators(#1984)·AddDAGvariablestowebflow(#1981)·AddGraphRAGwebstatics(#1943)·+feat(GraphRAG):enhanceGraphRAGbygraphcommunitysummary(#1801)·Unifiedfrontendcodestyle(#1923)·Supportqianfanembeddingandresolvesanissue(#1819)v0.6.1Latestgithub-actionsreleasedthis2weeksago8commitstorefs/heads/mains·Passingstopparametertoproxyllm(#2077)·Adddocumentstructureint·UpdateOceanBaseStoretobecompatiblewithoceanbase-(#2074)·AddevaluationservicemoduleforRAGandAgent(#2070)·SupportQwen2.5models(#2030)ML-Summit2024全球機器學習技術大會ML-Summit2024全球機器學習技術大會 收獲:技術支持和代碼優化建議,吸引更多開發者加入收獲:技術支持和代碼優化建議,吸引更多開發者加入收獲:公司專家和社區伙伴專業指導,提升技術價值觀公司個人螞蟻集團ANTANTGROUPANTGROUPML-Summit2024全球機器學習技術大會小知識圖譜增強"人物":["周杰倫",""人物":["周杰倫","JayChou"],instruction=你是專門進行實體抽取的專家。請從input中抽取出符合schema定義的實體,不存在的實體類型返回空列表。請按照JSON字符串的格式回答。schema=["人物”,“專輯”,"電影","組織",“職業"]“周杰倫","object":"臺灣省新北市"}],周杰倫","object":"福建省永春縣"}]中抽取出符合schema定義的關系三元組,不存在的關系返回空列表。請按照JSON字符串的格式回答。schema=【"出生地點”,“祖籍"]“人物”:{"周杰倫":{instruction=你是一個圖譜實體知識結構化專家。根據輸入實體類型(entitytype)的schema描述,從文本中抽取出相應的實體實例和其屬性信息,不存在的屬性不輸出,屬性存在多值就返回列表,并輸出為可解析的json格式。["出生地點","出生日期","祖籍","職業"1}]“發行事件“:[中抽取出符合schema定義的事件,不存在的事件返回空列表,JSON字符串的格式回答。schema=[{"event_type":"發行事件","trigger":True,"arguments":["主體","客體","時間"1}]周杰倫(JayChou),1979年1月18日出生于臺灣省新北市,祖籍福建省永春縣,華語流行樂男歌手、音樂人,畢業于淡江中學。2000年,發行個人首張音樂專輯《Jay》."出生地點":"臺灣省新北市","出生日期":"1979年1月18日","祖籍":"福建省永春縣","職業":["華語流行樂男歌手","音樂人"]"電影":[1,"組織":["淡江中學"1,“職業":["華語流行樂男歌手",“音樂人“]"主體":"周杰倫(JayChou)","客體":"個人首張音樂專輯《Jay》","時間";"2000年""出生地點":[{"subject":祖籍":[{"subject":""arguments":{ML-Summit2024全球機全球機器學習技術大會Retrievedinformation&meOneKE:知識抽取微調模型arXivarXiv2409.01854AgentRE:知識抽取智能體AlignmentPlanningRetrieval&ReasoningLLMReasoningKnowledgeGraphReasoningKAG-ModelNLUNLINLGKAG:知識增強生成螞蟻集團arXiv:2409.13731Documents小構建融合索引全球機器學習技術大會DatabasewarehousesReal-timeReal-timedatabasebuiltforthecloudUser-facinganalyticsRecommendationsGeospatialsearchTuGr2ph”·表索引:提供傳統的關系型數據查詢與分析能力,實現基于表數據的過濾、分析、聚合等能力。 其他:例如多模態數據的索引,如圖片、音頻、視頻等。螞蟻集團ANTANTGROUP小高維圖特征全球機器學習技術大會直接的圖特征計算方式,提供節點的鄰居信息,如節點公共鄰居、鄰居聚合指標等。 項目貢獻請輸入Giub倉庫名稱基于知識圖譜洞察開源數據名Qad+名Qad+Dwer夕伙伴貢獻生態社區InterestPartnerContributio恩且Dwpr興趣OSGraph開源知識圖譜的關鍵圖特征螞蟻集團螞蟻集團Spark的開源社區圖譜小多模態小多模態Question?Table(Col-CellPairs)SchemaQQAnswer3arXiv2410.04739Part2:HierarchicalTripleModelingKGCLossScoresRepresentation個Cross-modalEntityEncoderVisual個Token全球機器學習技術大會Part3:Fine-grainedContrastiveLearningCross-modalEntityEncoder(CMEE)MyGO:多模態知識圖譜Part1:ModalityTokenizationGraphsVisuaCodebookTextualTokenizationjVisualTextualMulti-modalTokensarXiv:2404.09468Layer個TextualTokenEncoder(CTE)TokenEmbeddings②Question:ComparedevelopmenttrendsofcompanyA,BandDocumentslKnowledgeDescriptionreportsofContent:FinancialCompanyA,B,C.DocumentsDocumentslKnowledgeDescriptionreportsofContent:FinancialCompanyA,B,C.ATomBJerryLondonC780SpikeNew2016QuestionQuestion+CoreContentiOptimalTypeisTableiTableincludesinformationofi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論