




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
TOC\o"1-2"\h\z\u 什么是AI 圖2:AIAgent的工作流 圖3:AlphaGo戰(zhàn)勝柯 圖4:OpenAIFive戰(zhàn)勝《Dota2》世界冠 圖5:大語(yǔ)言模型浪 圖6:大模型的能力涌現(xiàn)現(xiàn) 圖8:由LLM驅(qū)動(dòng)的自主智能體系統(tǒng)的架 圖10:AIAgent的反思框 圖14:GPT模型函數(shù)調(diào)用功能示 圖16:AIAgents領(lǐng)域動(dòng) 圖20:網(wǎng)頁(yè)版 圖24:西部世界小鎮(zhèn)中Agents的架 圖32:HyperWritePersonalAssistant交互界 圖33:HyperWritePersonalAssistant的思考與執(zhí)行操作過(guò) 圖37:個(gè)人AI助理 圖39:Pi的幽默 圖43:Agent的可能用 圖45:瀾碼科技打造企業(yè)級(jí)Agent平 表3:AIAgent可能的應(yīng)用領(lǐng) 什么是AIAIAgent(人工智能代理)是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。不同于傳統(tǒng)的人工智能,AIAgent具備通過(guò)獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力。比如,告訴AIAgent幫忙下單一份外賣(mài),它就可以直接調(diào)用APP選擇外賣(mài),再調(diào)用支付程序下單支付,無(wú)需人類去指定每一步的操作。AgentMinsky1986年出版的《思維的社會(huì)》一書(shū)中提出,Minsky認(rèn)為社會(huì)中的某些個(gè)體經(jīng)過(guò)協(xié)商之后可求得問(wèn)題的解,這些個(gè)體就是Agent。他還認(rèn)為AIAgents缺乏必要的現(xiàn)實(shí)條件。1:HyperwriteAIAgent大語(yǔ)言模型和Ient的區(qū)別在于Ient可以獨(dú)立思考并做出行動(dòng),和RPA的區(qū)別在于它能夠處理未知環(huán)境信息。PT誕生后,I從真正意義上具備了和人類進(jìn)行多輪對(duì)話的能力,并且能針對(duì)相應(yīng)問(wèn)題給出具體回答與建議。隨后各個(gè)領(lǐng)域的“piot”推出,如icost365pilt、itbilot、dbeielyI成為了辦公、代碼、設(shè)計(jì)等場(chǎng)景的“智能副駕駛”。Igent和大模型的區(qū)別在于,大模型與人類之間的交互是基于pompt實(shí)現(xiàn)的,用戶pomt是否清晰明確會(huì)影響大模型回答的效果,例如hatGTpilot都需要明確任務(wù)才Ignt的工作僅需給定一個(gè)目標(biāo),它就能夠針對(duì)目標(biāo)獨(dú)立思考并做出行動(dòng),它會(huì)根據(jù)給定任務(wù)詳細(xì)拆解出每一步的計(jì)劃步驟,依靠來(lái)自外界的反饋和自主思考,自己給pomptpilotgent則可以算得上一個(gè)初級(jí)的“主駕駛”。和傳統(tǒng)的RPA相比,RPA程來(lái)進(jìn)行工作的處理,在出現(xiàn)大量未知信息、難以預(yù)測(cè)的環(huán)境中時(shí),RPA是無(wú)法進(jìn)行工作的,gent2:AIAgentAgent的最終發(fā)展目標(biāo):通用人工智能Ient并不是一個(gè)新興的概念,早在多年前就已在人工智能領(lǐng)域有了研究。例如04年由epindlphaoIgent207pnAIDota2pnAIie,209epind2phaSrIIgntIgent進(jìn)行訓(xùn)練,主要應(yīng)用場(chǎng)景是在游戲這類具有對(duì)抗性、有明顯輸贏雙方的場(chǎng)景中。但如果想要在真實(shí)世界中實(shí)現(xiàn)通用性,基于當(dāng)時(shí)的技術(shù)水平還難以實(shí)現(xiàn)。 圖4:OpenAIFive戰(zhàn)勝《Dota2》世界冠 大語(yǔ)言模型的浪潮推動(dòng)了Ient相關(guān)研究快速發(fā)展。IgentIgent量人類行為數(shù)據(jù),為模擬類人的交互打下了堅(jiān)實(shí)基礎(chǔ);另一方面,隨著模型規(guī)模不斷增大,大模型涌現(xiàn)出了上下文學(xué)習(xí)能力、推理能力、思維鏈等類似人類思考方式的多種能力。將大模型作為AIAgent的核心大腦,就可以實(shí)現(xiàn)以往難以實(shí)現(xiàn)的將復(fù)雜問(wèn)題拆解成可實(shí)現(xiàn)的子任務(wù)、類人的自AIAgent的發(fā)展。 數(shù)據(jù)來(lái)源:Wei,etal.《EmergentAbilitiesofLargeLanguageModels》,東方通往I的道路仍需探索,Ient是當(dāng)前的主要路線AI經(jīng)過(guò)了一段時(shí)間后,大家對(duì)大模型真實(shí)的能力邊界有了清晰的認(rèn)知,發(fā)現(xiàn)大模型仍存在大量的問(wèn)AIIgentgentAI的道路。penAIdejapahypenAIIensIgentIea的一季度財(cái)報(bào)電話會(huì)上提到,eaIgens7AIAgentAIAgentL4階段,距離真正實(shí)現(xiàn)仍有差距。根據(jù)甲子光年報(bào)告,AI與人ChatGPTL2級(jí)別自動(dòng)駕AIAI不直接參與工作;Copilot這類副駕駛工具可以類比為L(zhǎng)3級(jí)別AI共同協(xié)作完成工作,AIprompt生成初稿,人類僅需進(jìn)行修改調(diào)整;而Agent則進(jìn)一步升級(jí)為L(zhǎng)4,人類給定一個(gè)目標(biāo),Agent可以自己完成任務(wù)規(guī)劃、工具調(diào)用等。但就如同L4級(jí)別的自動(dòng)駕駛還未真正實(shí)現(xiàn)一樣,AIAgents容易想象和演示,卻難以實(shí)現(xiàn),AIAgents的真正應(yīng)用還在不確定的未來(lái)。AIAI人類完成絕大部分工作。人類向AI人類和AI進(jìn)行協(xié)作,工作量相當(dāng)。AIprompt完成工作初稿,人GitHubCopilot、Jasper等完全無(wú)需人類監(jiān)督,AI自主拆解目AIAgent系統(tǒng)可以拆分為大模型、規(guī)劃、記憶與工具使用四個(gè)組件部分。6月,OpenAILilianWengAIAgent可能會(huì)成為新時(shí)代的開(kāi)端。AgentLLMLLMAgent的“大腦大模型+規(guī)劃:Agent的“大腦”,通過(guò)思維鏈能力實(shí)現(xiàn)LLM具備邏輯推理能力,AgentLLM的邏輯推理能力激發(fā)出來(lái)。當(dāng)模型規(guī)模足夠大的時(shí)候,LLM本身是具備推理能力的。在簡(jiǎn)單推理問(wèn)題上,LLM已經(jīng)達(dá)到了很好的能力;但在復(fù)雜推理問(wèn)題上,LLM有時(shí)還是會(huì)出現(xiàn)錯(cuò)誤。事實(shí)上,很多時(shí)候用戶無(wú)法通過(guò)LLM獲得理想的回答,原LLM提問(wèn)的時(shí)候追加“Let’sthinkstepbystepGSM8K上的推prompt,可以更好地激發(fā)大模型的推理能力。數(shù)據(jù)來(lái)源:Kojimaetal.《Largelanguagemodelsarezero-shotreasoners對(duì)于需要更多步驟的復(fù)雜任務(wù),AgentLLM通過(guò)思維鏈能力實(shí)現(xiàn)任務(wù)分解與規(guī)劃AIAgent(ChainofThoughtsCoT)能力,通過(guò)提示模型“逐步思考”,利用更多的計(jì)算時(shí)間來(lái)將困難10:AIAgent數(shù)據(jù)來(lái)源:Noahetal.《ReflexionLanguageAgentswithVerbalReinforcementLearning通過(guò)反思與自省框架,es可以不斷提升任務(wù)規(guī)劃能力。AIgent可以對(duì)過(guò)去的行為進(jìn)行自我批評(píng)和反思,從錯(cuò)誤中學(xué)習(xí),并為未來(lái)的步驟進(jìn)行完善,從而提高最終結(jié)果的質(zhì)量。自省框架gents能夠修正以往的決策、糾正之前的失誤,從而不斷優(yōu)化其性能。在實(shí)際任務(wù)執(zhí)行中,嘗試和錯(cuò)誤是常態(tài),反思和自省兩個(gè)框架在這個(gè)過(guò)程中起到了核心作用。對(duì)I智能體系統(tǒng)的輸入會(huì)成為系統(tǒng)的記憶,與人類的記憶模式可實(shí)現(xiàn)一一映射用于獲取、存儲(chǔ)、保留以及隨后檢索信息的過(guò)程。人腦中有多種記憶類型,如感覺(jué)記憶、短期記憶和長(zhǎng)期記憶。而對(duì)于AIgent系統(tǒng)而言,用戶在與其交互過(guò)程中產(chǎn)生的內(nèi)容都可以認(rèn)為是gent的記憶,和人類記憶的模式能夠產(chǎn)生對(duì)應(yīng)關(guān)系。感覺(jué)記憶就是作為學(xué)習(xí)嵌入表示的原始輸入,包括文本、圖像或其他模態(tài);短期記憶就是上下文,受到有限的上下文窗口長(zhǎng)度的限制;長(zhǎng)gentgetPDF聞等。任務(wù)與結(jié)果會(huì)儲(chǔ)存在記憶模塊中,當(dāng)信息被調(diào)用時(shí),儲(chǔ)存在記憶中的信息會(huì)回到與用戶的對(duì)話中,由此創(chuàng)造出更加緊密的上下文環(huán)境。2AIAgent學(xué)習(xí)原始輸入的嵌入表示,包括文本、圖像或其他形式,短暫保留感覺(jué)看一張圖片,然后在圖片消失后能夠上下文學(xué)習(xí)(prompt中的信息),處理復(fù)雜任務(wù)的臨時(shí)存儲(chǔ)在進(jìn)行心算時(shí)記住幾個(gè)數(shù)字,但短期記憶是有限的,只能暫時(shí)保持幾個(gè)項(xiàng)在查詢時(shí)Agent可以關(guān)注的外部向量存儲(chǔ),具有快速檢索和基本無(wú)限的存儲(chǔ)學(xué)會(huì)騎自行車后,多年后再次騎起來(lái)時(shí)仍能掌握這項(xiàng)技能,這要?dú)w功于長(zhǎng)向量數(shù)據(jù)庫(kù)通過(guò)將數(shù)據(jù)轉(zhuǎn)化為向量存儲(chǔ),解決大模型海量知識(shí)的存儲(chǔ)、檢索、匹配問(wèn)題。向量是AImbeding非結(jié)構(gòu)化數(shù)據(jù)抽象、轉(zhuǎn)換為多維向量,由此可以結(jié)構(gòu)化地在向量數(shù)據(jù)庫(kù)中進(jìn)行管理,從而實(shí)現(xiàn)快速、高效的數(shù)據(jù)存儲(chǔ)和檢索過(guò)程,賦予了get“長(zhǎng)期記憶”。同時(shí),將高維空間中的多模態(tài)數(shù)據(jù)映射到低維空間的向量,也能大幅降低存儲(chǔ)和計(jì)算的成本,向量數(shù)據(jù)庫(kù)的存儲(chǔ)成本比存到神經(jīng)網(wǎng)絡(luò)24meddig技術(shù)和向量相似度計(jì)算是向量數(shù)據(jù)庫(kù)的核心Embeding頻等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)能夠識(shí)別的語(yǔ)言的方法,例如常見(jiàn)的地圖就是對(duì)于現(xiàn)實(shí)地理的Embedig,現(xiàn)實(shí)的地理地形的信息其實(shí)遠(yuǎn)遠(yuǎn)超過(guò)三維,但是地圖通過(guò)顏色和等高線等來(lái)最大化Embeding以通過(guò)數(shù)學(xué)方法來(lái)計(jì)算兩個(gè)向量之間的相似度,即可實(shí)現(xiàn)對(duì)文本的比較。向量數(shù)據(jù)庫(kù)強(qiáng)大的檢索功能就是基于向量相似度計(jì)算而達(dá)成的,通過(guò)相似性檢索特性,針對(duì)相似的問(wèn)題找出近似匹配的結(jié)果,是一種模糊匹配的檢索,沒(méi)有標(biāo)準(zhǔn)的準(zhǔn)確答案,進(jìn)而更高效地支撐更廣泛的應(yīng)用場(chǎng)景。 AIAgent與大模型的一大區(qū)別在于能夠使用外部工具拓展模型能力。懂得使用工具是人類最顯著ChatGPT的一大缺點(diǎn)在于,其訓(xùn)練數(shù)據(jù)只截止到了2021年底,對(duì)于更新一些的知識(shí)內(nèi)容它無(wú)法OpenAIChatGPT更新了插件功能,能夠調(diào)用瀏覽器插件來(lái)訪問(wèn)最新的信息,但是需要用戶來(lái)針對(duì)問(wèn)題指定是否需要使用插件,無(wú)法做到完全自然的回答。AIAgent則具備了自主調(diào)用工具的能力,在獲取到每一步子任務(wù)的工作后,Agent都會(huì)判斷是否需要通過(guò)調(diào)用外LLM,進(jìn)行下一步子任務(wù)的工作。OpenAI6GPT-4GPT-3.5更新了函數(shù)調(diào)用的功能,開(kāi)發(fā)者現(xiàn)在可以向這兩個(gè)大JSON對(duì)象。這是一種更可靠地將GPTAPI相連的新方法,允許開(kāi)發(fā)者更可靠地從模型中獲得結(jié)構(gòu)化的數(shù)據(jù)AI開(kāi)發(fā)者提供了方便。AIAgent。20234HuggingGPT,它可以連接不AI模型,以解決用戶提出的任務(wù)。HuggingGPTHuggingFace中成百上千的模型和HuggingFaceAI數(shù)據(jù)來(lái)源:Shen,etal.《HuggingGPTSolvingAITaskswithChatGPTanditsFriendsinHuggingFace》,東方證券研三、AIAgentAIAgent發(fā)展迅速,出現(xiàn)多款“出圈”級(jí)研究成果。20233月起,AIAgent領(lǐng)域迎來(lái)了第一AIAgent領(lǐng)域的關(guān)注。16:AIAgentsAutoGPTAIAgentAutoGPTGPT-4完全自主運(yùn)行的最早示例之一,AutoGPTAIAIAgent領(lǐng)域的研究GitHub14.7star。 開(kāi)源項(xiàng)目點(diǎn)燃開(kāi)發(fā)者熱情,基于AutoGPT的案例應(yīng)用層出不窮。基于GPT-4的強(qiáng)大能力和AutoGPTAgentAutoGPT實(shí)現(xiàn)了很多有趣的應(yīng)用案例,例如自動(dòng)實(shí)現(xiàn)代碼debug、自主根據(jù)財(cái)經(jīng)網(wǎng)站信息進(jìn)行投資掙錢(qián)、自主完成復(fù)雜網(wǎng)站建設(shè)、進(jìn)行科技AutoGPT開(kāi)發(fā)了網(wǎng)頁(yè)版本——AgentGPT,僅需給定大模APIAIAgent。 AutoGPT仍存在成本高、響應(yīng)慢、出現(xiàn)死循環(huán)bug等缺點(diǎn)。Auto-GPT采用的是GPT-3.5GPT-4APIGPT-4tokenGPT-3.51520(理想狀況下),step4KtokensGPT-4使用量,prompt和回復(fù)的平均每一千=出現(xiàn)需要拆分出幾十上百個(gè)step的任務(wù),這時(shí)單個(gè)任務(wù)的處理成本就會(huì)難以接受。而且GPT-4的GPT-3.5stepAutoGPT在遇到GPT-4stepprompt和輸出,造成 們發(fā)表了名為《GenerativeAgents:InteractiveSimulacraofHumanBehavior》的論文,展示了一個(gè)由生成代理(GenerativeAgents)組成的虛擬西部小鎮(zhèn)。這是一個(gè)交互式的沙盒環(huán)境,在小25AIAgent啡,和同事分享當(dāng)天的新聞。甚至一個(gè)智能體想舉辦情人節(jié)排隊(duì),這些智能體在接下來(lái)的兩天里,會(huì)自動(dòng)傳播派對(duì)邀請(qǐng)的消息,結(jié)識(shí)新朋友,互相約對(duì)方一起去派對(duì),還會(huì)彼此協(xié)調(diào)時(shí)間,在正確gentIgentgentget數(shù)據(jù)來(lái)源:Parketal《GenerativeAgents:InteractiveSimulacraofHumanBehavior記憶流是西部世界小鎮(zhèn)中Ies的架構(gòu)核心gents記憶、反思和規(guī)劃,相比第二章提到的幾個(gè)核心組件略有調(diào)整。這三大基本要素都基于一個(gè)核心:記憶流(emoryeam)gentgent自己的行為或從其他人那里感知到的行為。為了檢索最重要的記憶以傳遞給語(yǔ)言模型,研究者確定了檢索過(guò)程中需要考慮的三個(gè)因素:最近性、重要性和相關(guān)性。通過(guò)確定每條記憶基于這三個(gè)因素的分?jǐn)?shù),最后加總起來(lái)得到權(quán)重最高的記憶,作為pmpt的一部分傳遞給大模型,以此來(lái)決定gent的 數(shù)據(jù)來(lái)源:Park,etal.《GenerativeAgents:InteractiveSimulacraofHuman
數(shù)據(jù)來(lái)源:Park,etal.《GenerativeAgents:InteractiveSimulacraofHumanoaer是第一個(gè)大模型驅(qū)動(dòng),可以終身學(xué)習(xí)的游戲智能體。223年5月,英偉達(dá)開(kāi)源了oageroager有強(qiáng)加一個(gè)預(yù)定的最終目標(biāo)或固定的故事情節(jié),而是提供了一個(gè)具有無(wú)限可能性的獨(dú)特游樂(lè)場(chǎng)。gent發(fā)現(xiàn)合適的任務(wù),能夠根據(jù)反饋學(xué)習(xí)和完善技能,不斷探索世界。英偉達(dá)采用了“無(wú)梯度”的gentP-4oager3.3倍,行2.315.3倍。 Voyagerprompt機(jī)制三個(gè)新型組件構(gòu)成。Voyager的架構(gòu)與第二章Agent狀態(tài)使得探索實(shí)現(xiàn)Voyager逐步建立起一個(gè)技能庫(kù),未來(lái)可以在類似情況下進(jìn)行檢索。這些技能是用可執(zhí)行的代碼Voyager的能力隨著時(shí)間的推移迅速增強(qiáng),并緩解“災(zāi)難性遺忘”問(wèn)題;迭代prompt機(jī)制引入了環(huán)境反饋、執(zhí)行錯(cuò)誤和檢查任務(wù)是否成功的自我驗(yàn)證三種類型的反饋,根據(jù)這些反饋,GPT-4可以自己去迭代更新promptprompt足以去完成當(dāng)前任務(wù)。Voaer的性能顯著強(qiáng)于別的ent框架,但成本也高居不下。英偉達(dá)的研究者們系統(tǒng)對(duì)比了oagergentoager的gent框架相比,oager(木制工具→石制工具→鐵制工具→鉆石工具)的速度最快,且是唯一能夠解鎖鉆石等級(jí)科技樹(shù)的模型。oaer的探索地圖范圍也是別的gent框架的2.3倍,發(fā)現(xiàn)新知識(shí)的能力大大增強(qiáng)。雖然oager具備強(qiáng)大的性能,oager需要使用P-4法降下來(lái)。同時(shí)大模型的“幻覺(jué)”問(wèn)題仍然存在,比如自動(dòng)課程會(huì)提出一些無(wú)法完成的任務(wù)等。oagerIgentAI又更近了一步。 HyperWrite:推出首個(gè)個(gè)人AI助理HyperWriteAIAgent。202383HyperWrite正式推出了AIAgent的應(yīng)用PersonalAssistant,希望可以成為人類的“數(shù)字助手”。作為HyperWriteAICohereAidanGomez表示:“我們將開(kāi)AIAgent,它可以幫助用戶整理郵箱并起草回復(fù)、AI能力無(wú)縫接入到用戶的日常生活和工作31:HyperWriteAIPersonalersoalsssant可以自主在瀏覽器中完成指定任務(wù)。esonlAsisant展插件的形式來(lái)提供服務(wù)的,用戶在安裝完插件并注冊(cè)賬戶后即可開(kāi)始試用。其初始頁(yè)面類似于wing這樣的搜索引擎,僅提供一個(gè)自然語(yǔ)言交互的聊天框。用戶輸入其想要完成的目標(biāo)后,該插件就會(huì)新建一個(gè)瀏覽器頁(yè)面,并在頁(yè)面以側(cè)邊欄形式展示其進(jìn)行的每一步操作與思路。以“Igent2圖32:HyperWritePersonalAssistant交互界 圖33:HyperWritePersonalAssistant的思考與執(zhí)行操作過(guò) AI助理能力仍舊有限,但潛力可期HyperWritePersonalAssistant0.01版Agent自此邁出了走向個(gè)人消費(fèi)者領(lǐng)域的第一步,隨著未來(lái)大模型能力的進(jìn)一步提升,以及算力AI助理的發(fā)展?jié)摿χ档闷诖odelScopeGPT:阿里云推出國(guó)內(nèi)首個(gè)大模型調(diào)用工具M(jìn)odelScopeGPT(GPT),是一個(gè)能實(shí)現(xiàn)大小模型協(xié)Agent系統(tǒng)20237月的世界人工智能大會(huì)上,阿里云推出了面向開(kāi)發(fā)者們的大模型調(diào)用工具魔搭GPT。魔搭GPT的理念類似于浙大和微軟團(tuán)隊(duì)推出的HuggingGPT,通過(guò)魔搭A(yù)gent。 ModelcopePT是阿里云aaS范式在模型使用層的重要映射,旨在建立大模型生態(tài)odelScopePT的數(shù)據(jù)集和訓(xùn)練方案將會(huì)對(duì)外開(kāi)放,供開(kāi)發(fā)者自行調(diào)用,開(kāi)發(fā)者可以根據(jù)需要對(duì)不同的大模型和小模型進(jìn)行組合,幫助開(kāi)發(fā)者多、快、好、省地使用大模型。目前I開(kāi)發(fā)者圈,魔搭社區(qū)已成中國(guó)大模型第一門(mén)戶。所有模型生產(chǎn)者都可以上傳自己的模型,驗(yàn)證模型的技術(shù)能力和商業(yè)化模式,并與其他社區(qū)模型進(jìn)行協(xié)作,共同探索模型應(yīng)用場(chǎng)景。odelScopePT則實(shí)現(xiàn)了將模型生產(chǎn)力進(jìn)行自由組合,繼續(xù)強(qiáng)化阿里云在大模型生態(tài)建設(shè)中的領(lǐng)先地位。InflectionAIAI——InectinI推出主打情感陪伴的個(gè)人I——i。necionI22240penI2235月IiatGT不同,Pi從未以專業(yè)性與替代人工作為宣傳。它不能寫(xiě)代碼,也不能幫我們生產(chǎn)原創(chuàng)內(nèi)容,與時(shí)下流行的通用聊天機(jī)器人相反,i只能進(jìn)行友好的對(duì)話,提供簡(jiǎn)潔的建議,甚至只是傾聽(tīng)。它的主要特征是富有同情心、謙虛好奇、幽默創(chuàng)新,具有良好的情商,可以根據(jù)用戶的獨(dú)特興趣和需求提供無(wú)限的知識(shí)與陪伴。nlcini開(kāi)始,就iersoalneliene)圖37:個(gè)人AI助理 PiInflection-1GPT-3.5。Inflection-1InflectionAI推出的大模型,根據(jù)公司的評(píng)估測(cè)試,Inflection-1在多任務(wù)語(yǔ)言理解、常識(shí)問(wèn)題等多項(xiàng)測(cè)試中的性司的差異化競(jìng)爭(zhēng)所在,PiAgent并不需要擁有很強(qiáng)的代碼和輔助工作和輔助工作的ent不同,i能夠滿足更多的情感陪伴需求Ient,iI的口吻。i的回復(fù)非常貼近生活,語(yǔ)氣十分得體,而它對(duì)你當(dāng)下?tīng)顟B(tài)和事態(tài)發(fā)展的關(guān)心就像心理醫(yī)生或者你最好i吻去冒犯用戶。它甚至?xí)诨貜?fù)中使用eojiiiiIent存在著較大的市場(chǎng)空間。 39:Pi的幽默AgentBench:LLM39:Pi的幽默清華大學(xué)聯(lián)合團(tuán)隊(duì)提出世界首個(gè)大模型Ient能力的評(píng)估標(biāo)準(zhǔn)AIAILLMget的智能水平。2038月,清華大學(xué)、俄亥俄州立大學(xué)、加州大學(xué)伯克利分校的研究團(tuán)隊(duì)便提出了首個(gè)系統(tǒng)性的基準(zhǔn)測(cè)試——gennchLLMgent8個(gè)不同環(huán)境中的能力表現(xiàn)(如推理和決策能力)。這88個(gè)環(huán)境,研究團(tuán)隊(duì)設(shè)計(jì)了不同的真實(shí)世 數(shù)據(jù)來(lái)源:Liuetal.《AgentBenchEvaluatingLLMsasAgents》,東方證券研
數(shù)據(jù)來(lái)源:Liuetal.《AgentBenchEvaluatingLLMsasAgents》,東方證券研GPT-4性能遙遙領(lǐng)先,開(kāi)源模型能力顯著弱于閉源模型25來(lái)進(jìn)行Agent能力評(píng)估,涵蓋了閉源模型(如OpenAI的GPT-4、GPT-3.5等)相差不大,而常見(jiàn)的一些開(kāi)源模型Vicuna、Dolly等由于尺寸和閉源模型相差了至少一個(gè)數(shù)量級(jí),LLMNLP上達(dá)到基本的類人水平,Agent重要能力上的LLMAIAgent的發(fā)展空間仍具潛力。AIAgent具備很強(qiáng)的能力,但是其性能的發(fā)揮卻主要依賴于用戶寫(xiě)的prompt是否足夠合適。AIAgent則將promptAIAgent就能夠?yàn)榇驦LM能力邊界的不斷發(fā)展,AIAgent展現(xiàn)出了豐富的功AgentAgent研究的不斷發(fā)展,AgentAIAgent的自動(dòng)化如在游戲領(lǐng)域,AgentNPC都具有自己的思考能力與行動(dòng)路
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 有機(jī)肥料在提升土壤微生物對(duì)作物生長(zhǎng)調(diào)節(jié)物質(zhì)產(chǎn)生中的作用考核試卷
- 簡(jiǎn)易呼吸器的使用 2
- 靜脈血液標(biāo)本采集指南
- 遼寧輕工職業(yè)學(xué)院《大學(xué)生創(chuàng)新創(chuàng)業(yè)與就業(yè)指導(dǎo)》2023-2024學(xué)年第一學(xué)期期末試卷
- 洛陽(yáng)職業(yè)技術(shù)學(xué)院《計(jì)算機(jī)網(wǎng)絡(luò)管理與安全》2023-2024學(xué)年第二學(xué)期期末試卷
- 江蘇省啟東市2024-2025學(xué)年高三下學(xué)期第二次模擬考試(期中)數(shù)學(xué)試題含解析
- 江蘇電子信息職業(yè)學(xué)院《大學(xué)生職業(yè)生涯規(guī)劃與就業(yè)指導(dǎo)(二)》2023-2024學(xué)年第二學(xué)期期末試卷
- 期貴州省畢節(jié)市重點(diǎn)中學(xué)2025屆初三第一次質(zhì)量檢測(cè)試題物理試題含解析
- 遼寧省丹東33中學(xué)2024-2025學(xué)年初三下學(xué)期模擬(二)測(cè)試英語(yǔ)試題含答案
- XX學(xué)校課程改革與校本課程開(kāi)發(fā)實(shí)施匯報(bào)范文
- 2024年天津市武清區(qū)國(guó)有資產(chǎn)經(jīng)營(yíng)投資有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 《動(dòng)物生理學(xué)》課程教學(xué)大綱
- 社會(huì)穩(wěn)定風(fēng)險(xiǎn)評(píng)估 投標(biāo)方案(技術(shù)方案)
- 高檔KTV裝修工程施工組織設(shè)計(jì)方案
- 第13課《警惕可怕的狂犬病》 課件
- 地鐵智慧運(yùn)維技術(shù)培訓(xùn)
- 急診科的孕產(chǎn)婦高危與急癥處理
- 《聲樂(lè)演唱》課程標(biāo)準(zhǔn)
- 高中英語(yǔ)高考讀后續(xù)寫(xiě)巧用動(dòng)作鏈專項(xiàng)練習(xí)(附參考答案和解析)
- 腦機(jī)接口與人工智能-第1篇
- 酒店公司章程范本
評(píng)論
0/150
提交評(píng)論