【大數據百家講壇】2025年DeepSeek、Manus與AI+Agent行業現狀報告_第1頁
【大數據百家講壇】2025年DeepSeek、Manus與AI+Agent行業現狀報告_第2頁
【大數據百家講壇】2025年DeepSeek、Manus與AI+Agent行業現狀報告_第3頁
【大數據百家講壇】2025年DeepSeek、Manus與AI+Agent行業現狀報告_第4頁
【大數據百家講壇】2025年DeepSeek、Manus與AI+Agent行業現狀報告_第5頁
已閱讀5頁,還剩95頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

=<>大數據百家講壇第135期2025.03.29王吉偉,《一本書讀懂AIAgent:技術、應用與商業》作者,AIGC&超自動化分析師,知名科技博客王吉偉頻道創始人。多年來持續關注互聯網+、IoT、產業互聯網、產業升級及數字化轉型,專注業務流程、人工智能、超自動化與RPA,致力于探索IOT時代產業升級新機會,為企業經營和創業創新提供前沿技術、商業模式及方法論的解讀與分享。目前重點觀察與研究AIGC、AIAgent及超自動化在各行業的落地應用與創業創新。已撰寫各類文章上千篇,作品見諸內容平臺、學術網站及雜志。AIAgentDeepSeekAIAgent行AIAgent如AIAgent的AIAgent的=<>Agent2023年3月AutoGPT橫空出世,7月OpenAI的翁麗蓮發表名紹基于LLM的AIAgent,給出了AIAgent的理想技術架構。關于AIAgent(智能體)的概念很多,很多組織都給出了定義基于大語言模型的AIAgent推薦類Agent對話型Agent推薦類Agent對話型Agent…………2023年3月AutoGPT橫空出世,7月OpenAI的翁麗蓮發表名2023年3月AutoGPT橫空出世,7月OpenAI的翁麗蓮發表名紹基于LLM的AIAgent,給出了AIAgent的理想技術架構。大模型聚焦語言處理,以文本交互被動響應指令,應用于內容生成等場景;AIAgent以LLM為核心,具備多模態交互和自主執行能力,可完成跨場景復雜任務。還有很多人在問,AIAgent與大模型的區別。兩者的區別,可以體現在以下幾個方面:從單智能體到多智能體智能體的四種設計方式吳恩達教授提出的智能體設計方法有四種:反Collaboration多智能體協作正是其中之一。從這四種設計方式而言,現在的大語言模型尤其是推理模型能夠反思、規劃和進行簡單的工具使用,都可以算是智能體。=<>DeepSeek等推理模型對AIAgent前面簡單介紹最近兩年AIAgent發展的基本路徑。其實所有問題的原點,最終還要回到大模型上。LLMBasedAgent的能力與功能取決于LLM的性能,如果大模型能力足夠強大,智能體也就能做到勝任更多業務場景。當然大模型足夠強大了,可能也就不需要智能體了,這個涉及到了模型即應用,后面會講。一言X1、混元T1這樣的高質推理模型的出現,對AIAgent性能與功能的提升有著很大的賦能,這里總結了幾點。?市場格局:DeepSeek的技術突破推動中國從AI規則接受者轉變為標準共治者,其開源策略和國產化優勢可能重塑全球AIAgent市場的競爭與合作模式。=<>Manus通用智能體帶來的行業啟示多代理協同架構:規劃代理通過MCTS算法拆解任務為DAG結構,執行代理調用工具鏈完成操作,驗證代理檢測邏輯矛盾并核對數據源。模型調度與優化:整合Claude3.5、DeepSeek等模型,降低調用成本,支持高并發任務調度,任務執行準確率達98%。動態任務調度引擎:動態分配算力資源,支持邊緣計算與云端協同,響應時間控制在50ms以內,記憶模塊優化后續任務路徑。安全與穩定支撐:采用聯邦學習保障數據隱私,攔截惡意攻擊,異常處理模塊自動修正偏差,確保任務執行成功率。?Manus技術架構通過工具鏈整合優化而非底層模型創新,實現了從任務理解到結果交付的全鏈路自主執行,同時兼顧效率與成本優勢。?從官方視頻展示來看,Manus可以用于零售與電商、金融、教育與研究等領域的多種應用場景。我在書里介紹了智能體在多個領域的應用,在技術部分提到了相關技術架構,在智能體技術發展趨勢和應用發展趨勢方面也有介紹多智能體,可以幫助讀者理解這種智能體。?Manus在工程化方面下了很大功夫,率先產品化了,能夠一步到位給與用戶想要的直接結果。可以給到普通用戶更多智能體應用的感知和更好的體驗,這是目前依托那些智能體平臺構建的智能體尚未實現的,也是需要努力方向。Manus技術架構通過工具鏈整合優化而非底層模型創新,雖然大家對它的評價褒貶不一,但作為通用智能體還是為行業帶來了不少的啟示Manus的出圈也證明了能夠自主執行相對復雜任務的智能體在現階段是可行的,雖然需要耗費很多的token和時間。接下來肯定會有更多同類產品出現,也會進行更多優化與迭代。加上大語言模型快速發展,今年內這類智能體體驗應該能有很大提升。=<>AIAgent行業現狀1智能體應用現狀51智能體應用現狀5225.8%,反映了小型企業在資源有限下對AI43個人用戶使用的AIAgent,主要依賴Coze、文心智能體等AIAgent構建平臺上Agent或者使用一些廠商提供的開箱即用AIAgent成品,部分用戶使用一些支持AIAgent的AI應用客戶端,還有一部分懂技術的用戶會在本地部署一套包括大模型在內的AIAgent系統,比如Dify、Ragflow等。lAI輔助放射學報告的生成將關鍵發現檢測的準確性和速度提高了20%(NCBI,2018年)。lAIAgent自動執行89%的臨床文檔任務,顯著提高醫療保健提供者的效率(NCBI,2023年)。l用于斑塊檢測的CT圖像處理中的AIAgent達到97%的準確率,有助于心臟病的早期診斷(NCBI,2024年)。lAIAgent可以將初始簡歷篩選所花費的時間減少75%,使人力資源專業人員能夠專注于戰略計劃(OdinAI,2024年)。l94%的人力資源專業人士認為,AIAgent通過識別最佳候選人來改進招聘流程(ScienceDirect,2023年)。l96%的人力資源領導者認為AIAgent可以提供個性化的學習和發展機會,培養一支更加敬業和熟練的員工隊伍(Getodin.AI,2024年)。lAIAgent通過自動化日常任務和提高流程效率來幫助降低HR的運營成本,從而節省高達25%的成本(Getodin.AI,2024年)。l收入增長:69%使用AIAgent的零售商報告說,由于個性化和預測分析的改進,收入顯著增長(Statista,2024年)。l降低成本:利用AIAgent提供客戶服務的零售商的運營成本降低了72%(Salesforce,2024年)。l增加收入:69%使用AIAgent的零售商觀察到年收入增加,其中一些報告增長了5%到15%不等(OdinAI,2024年)。l高達91%的財務專業人士對AIAgent持中立態度,專注于他們在欺詐預防、風險評估和簡化財務流程方面的作用。l8%的人表示樂觀,這凸顯了AIAgent提供個性化客戶體驗并通過實時分析改進決策的能力。l82%的金融機構報告說,由于實施了AIAgent,運營成本降低了(OdinAI,2024年)。l客戶體驗增強:34%的金融機構利用AIAgent通過聊天機器人、虛擬助手和推薦系統改善客戶體驗(ScienceDirect,2024年)。l提高運營效率:43%的金融專業人士觀察到使用AIAgent提高了運營效率(福布斯顧問,2024年)。l根據HSO的說法,AIAgent可以以95%的準確率預測設備故障,顯著減少停機時間和維修成本高達40%。lAIAgent優化生產計劃和調度,將生產吞吐量提高20-30%,并將庫存和人員成本降低高達20%(OdinAI,2024年)。l分析實時數據流的AIAgent可以及早檢測到異常,將報廢和返工成本降低10-30%(OdinAI,2024年)。l實施AIAgent可以將工廠生產力提高多達50%,并將生產吞吐量提高20%(OdinAI,2024年)。lAIAgent將產品開發時間縮短了30-50%,從而提高了產品性能并降低了成本(OdinAI,2024年)。企業級解決方案企業級解決方案……AIAgent的產品及服務形態,主要有以下幾種常見Agent產品包括聊天助手、編碼助手、AI搜索等當前的AIAgent具有以下產品通性AI搜索、編碼助手是比較成功的AIAgent產品,目前ChatGPT、Kimi、通義千問等基于大語言模型的聊天AI搜索、編碼助手是比較成功的AIAgent產品,目前為用戶提供企業級的AIAgent解決方案。當然企業軟為用戶提供企業級的AIAgent解決方案。當然企業軟市面上的AIAgent大多基于特定知識庫或數據構建,雖在問答交互方面表現出色,但在程序聯動和操作方市面上的AIAgent大多基于特定知識庫或數據構建,雖在問答交互方面表現出色,但在程序聯動和操作方智能體構建平臺產品,已經成為智能體應用構建與承載的中流砥柱。更多智能體平臺面向開發者,普通用戶想要構建想要的智能體還有門檻,當然用起來沒有問題。Coze等智能體構建平臺初步把智能體改造成了基于LLM的低代碼平臺,低代碼平臺也正在積極融合Agent技術升級為Agent構建平臺。?Agent市場由主要科技公司和越來越多的初創公司主導,競爭環境激烈。?AIAgent市場正在顯著擴展,主要受到自動化和效率需求的推動。?marketsandmarkets報告數據顯示,該市場從2024年的51億美元增長到預計2030年的471億美元,復合年增長率為44.8%。?初創公司和細分市場參與者:CBInsights市場地圖識別出超過170家初創公司,包括Harvey,該公司在2025年30億美元估值融得3億美元,專注于法律AI代理TheAI?其他值得注意的初創公司包括CrewAI(40%的財富500強企業使用其多代理協調功能)和ServiceNow(最近推出AIAgentOrchestrator,用于自定義代理部署)大公司的各種動作,最能彰顯技術及市場動向。最近幾個月科技巨頭公司在AIAgent方面動作頻頻,有些公司已經取得了不錯產品成果與市場進展。頭部的大語言模型創業公司,也都在重點開拓AIAgent領域。大公司的各種動作,最能彰顯技術及市場動向。最近幾個月科技巨頭公司在AIAgent方面動作頻頻,有些公司已經取得了不錯產品成果與市場進展。頭部的大語言模型創業公司,也都在重點開拓AIAgent領域。月之暗面……AIAgent全景圖:隨著更多AIAgent產品與解決方案的推出,越來越多涉足AIAgent的公司與創業團隊浮出吹面,AIAgent的行業版圖也在逐漸清晰。左邊是NewEconomies繪制的6月份市場全景圖,右邊insightpartners給出的12月市場全景圖。AIAgent全景圖:隨著更多AIAgent產品與解決方案的推出,越來越多涉足AIAgent的公司與創業團隊浮出吹面,AIAgent的行業版圖也在逐漸清晰。左邊生態圖譜來自甲子光年4月份報告,右邊來自infoQ第二季度報告。智能體應勢而生:單從AIAgent構建平臺來說,5月份王吉偉頻道盤點了全球80多個Agent構建平臺,現在的數量已經遠遠超過這個數字,國內就已經有十數個。詳見公眾號文章《AI智?大語言模型(LLM)是AIAgent的核心,提供強大的自然語言處理能力,支持多語言和多領域任務。??大語言模型(LLM)是AIAgent的核心,提供強大的自然語言處理能力,支持多語言和多領域任務。?AIAgent具備多模態能力,整合圖像、音頻和視頻處理,適用于智能家居、醫療診斷和內容創作。?AIAgent通過高級規劃和推理技術進行自主決策,能夠調用外部工具和API,擴展其功能。?AIAgent現可調用外部工具和API,如搜索引擎、數據庫或軟件接口,顯著擴展其功能。?記憶和學習機制使其能夠存儲和檢索信息,增強學習?AIAgent的架構通常包括感知、認知和行動三個組件,支持多種分類和多代理協作。GPT-4o、谷歌的Gemini2.0和Anthropic的CGemini2.0原生支持工具使用。這一特征使AIAgentAIAgent通常包括感知(輸入處理)、認知(決策)和行動(任務執行組件。分類包括反應式Agent(即時響應)、基于模型的Agent(預和學習型Agent(自適應優化)。多代理系統(如OpenAISwarm)技術現狀:AIAgent技術正朝著多個創新方向發展,以提升性能和用戶體驗。增強多模態交互未來將更好地處理視頻、3D數據和觸覺輸入,應用于智能家居、醫療診斷和虛擬現實。例如,Meta的Llama3支持多模態輸入,擴展了應用場景。提高自主性和可靠性增強多模態交互未來將更好地處理視頻、3D數據和觸覺輸入,應用于智能家居、醫療診斷和虛擬現實。例如,Meta的Llama3支持多模態輸入,擴展了應用場景。提高自主性和可靠性讓AIAgent更獨立,減少錯誤,專注于復雜任務的自校正和魯棒性。例如,Anthropic的Claude3.5強調安全性和可靠性,適合企業關鍵任務。多Agent協作開發多代理系統,多個AIAgent合作完成共同目標,模擬人類團隊協作。例如,OpenAI的Swarm平臺支持多Agent協同優化供應鏈。邊緣計算與端側部署將AIAgent部署到智能手機、PC等邊緣設備,提升隱私和響應速度。例如,蘋果的Siri正在向端側處理方向發展。可解釋性和信任增強決策過程的透明度,開發解釋性AI技術以構建用戶信任。例如,IBM的ExplainableAI工具幫助用戶理解Agent決策。個性化與適應根據用戶偏好和行為調整AIAgent,提供定制化體驗。例如,亞馬遜的Alexa通過學習用戶習慣優化交互。?提高自主性和可靠性:使AIAgent更獨立,減少錯誤,專注于復雜任務的自校正和魯棒性。例如,Anthropic的Claude3.5強調安全性和可靠性,適合企業關鍵任務。?多Agent協作:開發多代理系統,多個AIAgent合作完成共同目標,模擬人類團隊協作。例如,OpenAI的Swarm平臺支持多Agent協同優化供應鏈。?邊緣計算與端側部署:將AIAgent部署到智能手機、PC等邊緣設備,提升隱私和響應速度。例如,蘋果的Siri正在向端側處理方向發展。?可解釋性和信任:增強決策過程的透明度,開發解釋性AI技術以構建用戶信任。例如,IBM的ExplainableAI工具幫助用戶理解Agent決策。?個性化與適應:根據用戶偏好和行為調整AIAgent,提供定制化體驗。例如,亞馬遜的Alexa通過學習用戶習慣優化交互。技術現狀:這些當前的熱門技術,可以多關注熱門技術AIAgent技術棧:AIAgent技術發展到現在,技術生態基本已經成型,用于構建AIAgent的各種技術正在不斷完善。左邊是去年AuraVentures整理的市場全景,右邊是Letta在今年11月推出最新技術棧統計。圖源:AuraVentures《TheRiseofAutonomousAIAgents;DebundlingtheMarket圖源:Letta《TheAIagentsstack》AIAgent技術生態圖:把翁麗蓮的AIAgent框架圖用技術和企業進行具象化,可以看到下面這張由ActivantCapital繪制的技術供應商角度的AIAgent生態系統圖。圖源:activantcapital,詳見圖書第15.2.4節AIAgent技術進展:基于大語言模型的AIAgent技術,正在快速發展與迭代可用的大型語言模型一般用例特定實現可用的大型語言模型一般用例特定實現模型基礎工具最終用戶UI大語言模型發展前景圖七種流行的RAG技術架構AIAgent技術進展:AIAgent技術框架不斷推陳出新Jules技術框架/方案名稱描述AIAgent開源項目與閉源項目:已經推出AIAgent技術框架、產品及解決方案的開源與閉源項目來源:e2bGithub倉庫awesome-ai-agents問題與不足:雖然AIAgent已經逐漸在很多領域實現商用,受限于現階段的技術、生態、用戶接受度等因素,仍然存在一些問題和不足。程穩定性上存在隨機輸出和異常處理問題。安全性和隱私保護面臨數據泄說明AIAgent遇到的系列行業問題,可以參考圖書第11章:AIAgent行業應用挑戰。及缺乏可重用的基礎設施。碎片化的工具、集成問題和可擴展性問題使流程進一步圖源:langbase《state-of-ai-agents》報告面臨的挑戰具體描述調研類場景容忍度較高。多任務場景下錯誤容面臨的挑戰具體描述調研類場景容忍度較高。多任務場景下錯誤容或高含知識任務時失敗率高。單次生成結果議標準化作業(如MCP規范滲透性差)。覽器與專業報表工具)。生產環境中模型易受對抗樣本攻擊(如利用FG?錯誤容忍度問題:在不同場景下的錯誤容忍度差異顯著。例如在代碼生成場景中錯誤容忍度極低(需專業程序員介入),而調研類場景容忍度較高。多任務場景下錯誤容易被累積放大,直接影響最終輸出質量。?記憶與上下文管理瓶頸:大模型依賴上下文窗口提供歷史信息模擬記憶,但超大上下文窗口性能不足(如模型處理長文本時表現下降)。RAG技術面臨嵌入質量與召回準確率的挑戰,難以實現有效記憶。?模型智能程度的限制:復雜場景下模型能力急劇下降,例如處理多文件代碼或隱含知識任務時失敗率高。單次生成結果的質量直接影響Agent整體表現,模型需更高精度。?自我評估能力的缺失:現有Agent缺乏結果自檢能力,無法判斷任務是否達到預期目標,需依賴外部反饋或人工干預。?工具集成與協調難題:工具調用成功率低(約50%失敗率),且缺乏統一協議標準化(如MCP被質疑適配性差)。跨環境操作能力不足,Agent難以自由切換不同應用軟件(如瀏覽器與專業報表工具)。?數據相關挑戰:垂直領域樣本稀缺,需依賴對比學習、元學習等技術,但數據合成成本高。多模態對齊困難,文本、圖像、語音的異構性導致信息整合效率低。?魯棒性與安全性風險:生產環境中模型易受對抗樣本攻擊(如利用FGSM算法生成的惡意輸入),需引入驗證機制降低風險。實時監控與熱更新機制不足,難以應對數據分布偏移問題。面臨的問題:模型即應用是挑戰也是機會?現在有一個很明顯的趨勢:模型即應用(服務模型本身直接構成最終產品或服務,而非通過應用層(如API或第三方軟件)二次開發。比如OpenAI的DeepResearch模型能夠端到端自主完成研究報告生成,無需外部工具調用或人工干預,ClaudeSonnet3.7可直接完成復雜任務(如代碼庫管理)而非僅作為生成代碼的工具,還有很多大模型推出的DeepResearch等功能。?這個趨勢,可能會造成2個結果:一是API時代將被終結,大模型廠商(如OpenAI、DeepSeek)將停止對外提供API,轉為直接提供模型作為產品,這個時間可能也就兩年。二是應用商直接集成能力的功能淘汰。AIAgent-Agenticworkflow-AgenticAI:AIAgent向AgenticWorkflow的發展以及AgenticAI的興起,正推動行業效率提升和數字化轉型。這些技術改變了企業運營模式,改善了客戶體驗,并為決策支持和自動化服務帶來革命性變化。同時,它們也延伸了應用價值鏈,改變了行業業態,盡管面臨技術挑戰,但為行業帶來了前所未有的發展機遇。):的智能實體。它基于預設的目標或任務,在給定的環境中通過獨立思考和調用工具逐步完成任務。AIAgent可以模擬人類對話,以自然且直觀的方式與人類交互,并在多個領言模型(LLM)調用靜態完成任務的工作流。在這個工作流中,AIAgent作為一個自主做出決策、采取行動、解決復雜問題,并在訓練機器學習模型的數據之外與外部環境進=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論