Chatting or Acting?-DeepSeek的突破邊界與“浙大先生”的未來圖景_第1頁
Chatting or Acting?-DeepSeek的突破邊界與“浙大先生”的未來圖景_第2頁
Chatting or Acting?-DeepSeek的突破邊界與“浙大先生”的未來圖景_第3頁
Chatting or Acting?-DeepSeek的突破邊界與“浙大先生”的未來圖景_第4頁
Chatting or Acting?-DeepSeek的突破邊界與“浙大先生”的未來圖景_第5頁
已閱讀5頁,還剩148頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

工工R—DeepSeek的突破邊界與浙大先生的未來圖景浙江大學信息技術中心浙江大學人工智能教育教學研究中心2025年02月17日這玩意兒憑啥這么強這玩意兒憑啥這么強?成本這么低,西湖之光不用了吧?DeepSeek關鍵詞DeepSeek突破邊界——DeepSeek的突破邊界與浙大先生的未來圖景DeepSeek席卷全球?DeepSeek-R1已發布并開源,性能對比OpenAIo1正式版。首,與世界上最先進的閉源模型不分伯仲。度在140多個國家的應用商店下載排行首億注冊用戶的APP。DeepSeek模型架構創新——采用MoE架構并解決路由崩潰難題DeepSeek模型架構創新——MLA多頭潛在注意力機制降低成本、提高效率柏拉圖表征假說隱馬爾卡夫鏈神經網絡時代神經網絡時代Transfoermer時代DeepSeek模型架構創新——MLA多頭潛在注意力機制降低成本、提高效率神經網絡時代Transfoermer時代神經網絡時代神經網絡時代Transfoermer時代神經網絡時代DeepSeek模型架構創新——MLA多頭潛在注意力機制降低成本、提高效率隱馬爾卡夫鏈神經網絡時代神經網絡時代Transformer時代DeepSeek模型架構創新——MLA多頭潛在注意力機制降低成本、提高效率隱馬爾卡夫鏈神經網絡時代隱馬爾卡夫鏈神經網絡時代Transfoermer時代DeepSeek模型架構創新——MLA多頭潛在注意力機制降低成本、提高效率隱馬爾卡夫鏈神經網絡時代神經網絡時代DeepSeek模型架構創新——MLA多頭潛在注意力機制降低成本、提高效率DeepSeek工程優化lDualPipelDualPipe流水線并行:雙向流水線設計(同時從兩端饋送micro-batch),顯著減少流水線氣泡,GPU利用率提升30%+重計算策略(反向傳播時重新生成中間結果)、CPU存儲EMA參數,顯存占用減少20%節點限制路由(每個Token最多跨4節點)、定制化All-to-All通信內核,結合Warp專業化調度,降低跨節點通信開銷DeepSeek預訓練數據與策略l數據構建:14.8萬億Token多樣化語料,數學與編程數據比例提升,支持多語言任務l通多Token預測(MTP同時預測多個未來Token,訓練效率提升1.8倍,推理加速顯著l長上下文擴展:兩階段擴展訓練(4K→32K→128K),結合YaRN方法,支持128K上下文窗口DeepSeek低精度訓練與成本控制llFP8混合精度訓練:對激活值和權重細粒度量化(1×128Tile-Wise),中間累加保留FP32精度,顯存占用減少40%ll選擇性高精度組件:關鍵模塊(如Embedding、Attention)保留BF16/FP32計算,平衡效率與精度ll訓練成本:總成本550萬美元(2.788MH800GPU小時),預訓練效率達每萬億Token僅180KGPU小時DeepSeek訓練方法創新DeepSeek訓練方法創新通過微調建立初始推理框架,解決純RL初期低效問題推理任務專項優化,新增語言一致性獎勵(解決多語言混雜問題)學/編程)與模型評估獎勵(開放問答DeepSeek訓練方法創新推理能力蒸餾與開源生態使用R1生成的80萬條數據對Qwen/Llama系列蒸餾,Qwen-7B在AIME準確率提升至55.5%,超越同類模型2倍使用R1生成的80萬條數據對Qwen/Llama系列蒸餾,Qwen-7B在AIME準確率提升至55.5%,超越同類模型2倍開源6個蒸餾模型(1.5B-70B),API定價僅為OpenAI的3%,實現推理性能與成本的極致平衡阿里云、騰訊云、騰訊云、百度智能云、天翼云(中國電信)、移動云(中國移動)、聯通云(中國聯通)、火山引擎(字節跳動)、京東云、青云科技、云軸科技等戰略拐點:人工智能的拐點已經從成長期到產業化轉換技術能力第三階段第四階段第五階段第一階段第二階段技術能力第三階段第四階段第五階段AI所處的位置成長期產業化成熟期成長期產業化成熟期技術大爆炸看得到新技術看得懂新技術算力拐點:DeepSeek的出現,意味著算力效率拐點顯現 訓練算力(petaFLOPs)1.E+101.E+10GPT-3175B(davinci)●liBaichuan2-13B1.E+06BERT-LargeDeepSeek-R1-671BDeepSeek-R1-DeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Qwen-1.5BBTransformerTransformer ALexNet數據拐點:AI基礎大模型的參數量迎來拐點2025年發布的大模型,都具有低參數量的特征,為本地化部署到AI終端運行提供了可能Large2018年6月2018年10月2019年2月2019年7月2020年6月高參數量低參數量DeepSeek-R1-671BMiniMax-Test-014560MiniMax-VL-014560DeepSeek-R1-DeepSeek-R1-Distill-Qwen-1.5B,Distill-Qwen-32B,Phi-4.140153202025年1月2025年1月2025年1月2025年1月2025年1月2025年1月技術路徑的循環:算法創新再次成為新的突破點AI技術創新一直在圍繞核心三要素在動態循環,2025年再次進入算法創新階段?算法創新算力創新數據創新算法創新算法創新時間時間不能因為唐僧克服千難萬險步行到西天取到真經——DeepSeek的突破邊界與浙大先生的未來圖景有了大模型(LLM)為什么還需要智能體(Agent)?AI發展過程AI大模型正迎來從簡單推理到深度思考的時代起源期起源期萌芽期成長期成熟期2011年Apple公司推出人臉識別等CV技術得到廣泛使用。2021年ChatGPT發布,以其自然語言交互與多場景內容生成能力為核心的LLM技術得到廣泛關注。2024年,以DeepSeekR1/OpenAIo1為代表的深度思考模型破圈,人類離AGI時代的到來又近了一步。翰·麥卡錫提出“人工智能”概念,并將“AI”首次作為一個學科被提出。1959年ArthurSamuel首次提出“機器學習”概念。優化大模型表現的幾大手段大模型在場景落地時,會存在部署推理成本高、專業知識不足、幻覺問題嚴重等問題因此在專業級市場,需要基于以下手段,提升大①模型蒸餾①模型蒸餾②模型微調②模型微調身能力”,但可以作為外掛,提升大從大模型到智能體,AI應用交互的進化的必然之路?通過語言用戶界面,依賴用戶給出的清晰明確的指令來完成任務?通過對話式給出輸出,但是無法直接完成用戶的目標,即只具備“你問我答能力”,無法實現“你說我做”Agent:具備自主能力的新一代AI應用?具備推理和規劃能力,無需用戶給出非常明確的指令?并非輔助用戶完成特定任務,而是基于用戶提出的目標,自動理解目標并完成用戶的任務有了大模型,還需要智能體LLM通常是基于對輸入文本的理解來生成響應,缺乏明確的目標導向和主動執行任務的能力。Agent智Agent智能體可以根據用戶設定的會議安排目標,自動查詢參會多模態與環境交互現實世界中的很多任務需要與多種模態的信息進行交互,如視覺、聽覺、物理環境等,體可以配備各種傳感器和執行器,實現與多模態環境的交互。比如在智能家居控制中,Agent智能體可以通過攝像頭識別環在復雜和動態的環境中,需要有自主性和決策能力來應對各種情況。Agent智能體具有自主性,能夠根據自身的知識、經驗和當前環境狀態,獨立地做出決策并采取行動。例如在自動駕駛場景中,Agent智能體需要根據實時的路況、交通信號、行用戶在與智能系統交互時,往往希望得到個性化的服務和長期的陪伴。Agent智能體可以建立用戶模型,記錄用戶的偏習慣和歷史交互信息,從而提供更加個性化的服務和更加連貫的長期交互。比如在智能教育領域,Agent智能體可以根據學生的學習進度、知識掌握情況,為其量身定制學習計劃和輔導個性化與長期交互系統整合與協作在實際應用中,往往需要整合多個系統和資源來完成復雜的任務。Agent智能體可以作為一個中間協調者,與不同的系統和服務進行交互和協作。例如在醫療領域,Agent智能體可以連接電子病歷系統、醫學影像系統、醫生的診斷工具等,協調各大模型與智能體的螺旋共生關系智能體(AI大模型與智能體的螺旋共生關系智能體(AIAgent)由Instruction、Knowledge、Action、Memory等多個模塊組建助理成功后,可以通過聊天、事件感知、定時等多種觸發方式發起對AI助理的運行,在接受輸入、思考、輸出AgentAgent智能體開發時代的到來智能體開發?從“開發”轉為“創作”,真正的人人都是AI創作者的時代智能體開發?通過多模態能力,讓智能體的交互體驗比肩APP智能體開發?多個智能體通過“工作流”的定義,實現相互協同,共同完成復雜任務把助理們拉到一個協在群里和助理們做協同智能體開發?基于平臺能力,賦能師生構建不同“段位”的智能體應用。+5分鐘創建一個應用5分鐘創建一個應用為應用裝上記憶和手腳讓應用像人一樣思考人人都是AI創作者時代,用Agent重塑工作方式DeepSeek多場景全面接入?三大基礎運營商、超過15家芯片廠家、200多家企業(涉及云服務、網絡科技、金融等領域)、多個手機廠商和車企,以及地方政府政務系統等。此外,世界級的云計算巨頭如微軟、英偉達、亞馬遜也宣布接入DeepSeek。?DeepSeek的“朋友圈”不斷擴大?在AI領域的創新性和實用性DeepSeek多場景全面接入Agent雙螺旋式智能演進提供認知底座處處用AI,人人會AI——以“浙大先生”為例——DeepSeek的突破邊界與浙大先生的未來圖景2025春天來了懂浪漫的“浙大先生”——基于DeepSeek與Carsi賦能智慧教育新生態發布會于2025年2月14日圓滿落幕發布“浙大先生+DeepSeek+發布“浙大先生+DeepSeek+CARSI”AI聯盟賦能教育發展CARSI助力浙江大學成為第三個解鎖“校建資源提供者”身份的高校,可借助CARSI全球化渠道,將學校自建的特色應用資源“大先生”提供CARSI聯盟高校和全球聯盟eduGAIN資源的應用范圍和影響力。聯盟以“共享、協創、普惠”為核心目標,旨在促進AI技術與教育的深度整合,構建一個多層次的AI教育合作發展生態。在AI教育研究、應用、推廣與連接面向,通過推動AI技術在教育領域的深入應用和廣泛普及。理事會AI智能體聚合中心執行委員會理事會AI智能體聚合中心執行委員會AI大模型共享倉庫牽手CARSI賦能教育發展牽手CARSI賦能教育發展“浙大先生”智能體開發平臺()與CARSI對接中新模型:提供創建基于DeepSeek模型的智能問答對話的服務能力門戶升級:智能體廣場集成更多校園全場景的智能體應用門戶升級:開發者中心門戶升級:智創工坊門戶升級:智匯任務臺應用升級:學在浙大應用升級:應用升級:學在浙大應用升級:應用升級:學在浙大應用升級:學在浙大應用升級:學在浙大應用升級:學在浙大應用升級:學在浙大AI賦能的學習門戶和AI學伴多意圖AI會話學習知識講解意圖知識講解意圖應用升級:智云課堂AI規劃個性化學習內容題型自主測驗應用升級:ETalk-口語對話平臺觀止ETalk觀止ETalk口語對話平臺是一款基于多模態大模型技術的口語學習指導工具,通過動態適配全校本科生的語言理解、口語水平的差異,同步課堂教學進度、引導學生運用、記憶所學內容。基于海量教學案例及對話語料,實現高校口語教學領域的專業模型訓練及微調。該平臺圍繞主題對話、腳本練習、語句潤色及自由對話四大應用場景,為學生提供便捷高效的口語對話訓練案例及指導。主題教學實現內容分級,圍繞教學主題與腳本練習水平測試試模擬真實對話場景浙江大學外國語學院實踐案例應用升級:Etalk—口語對話平臺接入DeepSeek賦能,基于外語學院口語對話場景負載測試個性化、多主題、高響應的對話場景測試維度DeepSeekV3LLama3-8b??動態上下文緩存機制:長對話場景內存占用減少40%?量化壓縮技術:模型體積壓縮?ROI對比:相同預算下,V3可?長文本場景運維人力節省35%(自動緩存明顯可取代人工優成本大幅降低超長對話緩存10ktokens上下文準確率98%超5ktokens后準確率下降40%●非標準表達誤判率超25%打造你心中的“AI校園”場館活動搜索學校活動社團活動課程搜索邀請課AI校園辦事辦事流程查看新生向導新人入學引導場館百事通場館預約找人人事圖表使用平臺能力,可根據各自在校的日常需求,開發食堂、圖書館、社團等專屬于浙大的智能體應用,一起打造AI生態!打造你心中的“AI校園”大先生平臺與浙大師生深度合作,以教學、生活等多元場景為核心,完善校園應用場景知識庫。融合DeepSeek-R1,全方位打造高效智慧的AI校園應用生態,賦能校園智能化升級。場景建設案例—AI輔助機械設計課前AI-ADAI-ADAI輔助機械設計未來場景建設—AI創意創作大先生平臺結合DeepSeek-R1,利用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論