




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
DeepSeek應用與部署山東大學經濟學院教授山東大學國家治理研究院研究員李鐵崗聽聽真我數字人講DeepSeekAIGC發展歷程AIGC2014-2024自然語言處理與語言模型大語言模型LLM:2018—2024DeepSeek介紹DeepSeek:2023—DeepSeek:技術創新——模型架構|V2(Multi-Head
Latent
Attention)DeepSeek:技術創新—模型架構|V3DeepSeek:技術創新—推理模型|RL強化學習讓智能體(Agent)在環境(Environment)中不斷嘗試、學習,并優化自己的策略(Policy),最終獲得最大化的獎勵(Reward)。PPO:ProximalPolicyOptimizationGRPO:GroupRelativePolicyOptimizationDeepSeek應用場景DeepSeek的能力層級1.基礎能力層多模態數據融合與結構化理解,包括跨模態語義對齊(文本、圖像、音頻、視頻、代碼、傳感器數據統一語義)和動態數據治理(解決數據缺失、噪音干擾、概念飄逸等),支持200多種數據格式自動解析。
2.中級能力層領域問題建模與復雜推理,包括領域自適應學習(建立醫、教育、金融垂直應用于模型)、因果推理引擎(建立因果圖模型)和多目標優化決策(求解帕累托最有解)。
3.高級能力層復雜系統建模與自主決策,包括數字孿生仿真系統(構建物理于數字融合虛擬環境模擬天氣等)、多智能體協同優化(將每個個體作為智能體通過聯邦學習模擬群體行為)和元認知調控機制(實施監控自身決策、動態分配資源、自動觸發行為)。
4.終極能力層自主進化與創造性突破,包括概念空間探索(通過對抗網絡探索新合金成分等)、范式轉移預警(監控跨領域知識流、識別技術革命前兆)和自編程能力(自動模塊設計、代碼編寫、測試用例)。DeepseekV3DeepseekR1Deepseekr1鞅的證明Deepseekr1
Roy安全準則組合模型推理Deepseekr1推理玻尿酸配方DeepSeek提示詞工程提示詞工程Deepseek十類提示詞1.內容生成類:文本生成、代碼生成、創意生成和數據模擬。
2.信息處理類:文本摘要、信息抽取、情感分析和多語言翻譯。
3.對話交互類:角色扮演、多輪對話、反問引導。
4.技能應用類:數學計算、代碼解釋、邏輯推理。
5.個性化定制類:風格遷移、知識庫綁定、偏好記憶。6.系統操作類:模式切換、資源優化、記憶管理。7.知識查詢類:事實核查、概念解釋、溯源檢索。8.教育與研究類:題目生成、論文潤色、實驗設計。9.多模態處理類:圖文互譯、表格解析、視頻腳本。10.倫理與安全類:內容審核、價值觀對齊、風險預警。DeepSeek部署方案Deepseek部署全線圖本地部署蒸餾小模型第三方UI客戶管接入服務云端網站接入服務移動手機應用DeepseekDeepseek模型及蒸餾模型API接入API及蒸餾模型API及蒸餾模型ChatboxAPI及網絡調用本地網絡調用ChatboxAPI及網絡調用DeepseeK替代部署方案本地部署蒸餾小模型:可通過ollama平臺、LMStudio平臺快速本地部署基于Llama和Qwen蒸餾的DeepSeek-R1推理模型,涵蓋多種不同參數規模,適合想在本地運行模型的用戶。第三方UI客戶管接入服務:可通過AnythingLLM、CherryStudio、Chatbox等選擇API接入。秘塔AI搜索:接入滿血版DeepSeek-R1推理模型,無廣告且搜索結果直達。以學習JDK21新特性為例,能詳細給出學習計劃,包括快速預覽、深入學習核心特性、實戰與總結等階段。硅基流動:注冊即送2000萬Tokens,提供多個基于DeepSeek-R1蒸餾訓練的模型,如DeepSeek-R1-Distill-Llama-70B等,在推理能力上表現出色。阿里云百煉:提供多個DeepSeek系列模型,如DeepSeek-V3、DeepSeek-R1-Distill-Qwen-1.5B等,部分限時免費,涵蓋文本生成等功能。百度智能云:千帆ModelBuilder全面支持DeepSeek-R1/V3調用,且限時免費,其模型在百科知識、數學推理等任務表現突出。英偉達:可通過特定接口調用DeepSeek-R1
671B全量模型,獲取APIKey后能進行相關操作。DeepSeek
API調用API調用方法DeepSeekAPImodel='deepseek-chat'即可調用DeepSeek-V3model='deepseek-reasoner',即可調用DeepSeek-R1。Token用量計算token是模型用來表示自然語言文本的基本單位,也是我們的計費單元,可以直觀的理解為“字”或“詞”;通常1個中文詞語、1個英文單詞、1個數字或1個符號計為1個token。一般情況下模型中token和字數的換算比例大致如下:1個英文字符≈0.3個token。1個中文字符≈0.6個token。但因為不同模型的分詞不同,所以換算比例也存在差異,每一次實際處理token數量以模型返回為準,您可以從返回結果的usage中查看。阿里云部署Deepseek以DeepSeek-R1滿血版為例進行演示,通過百煉模型服務進行DeepSeek開源模型調用,可以根據實際需求選擇其他參數規模的DeepSeek模型。百煉平臺的API提供標準化接口,無需自行搭建模型服務基礎設施,且具備負載均衡和自動擴縮容機制,保障API調用穩定性。搭配Chatbox可視化界面客戶端,進一步簡化了調用流程,無需在命令行中操作,通過圖形化界面即可輕松配置和使用DeepSeek模型。https://chatboxai.app/zh#downloadDeepSeekDeepSeekDeepSeek-R1-Ditill-Qwen-1.5BDeepSeek-R1-Ditill-Qwen-7BDeepSeek-R1-Ditill-Qwen-14BDeepSeek-R1-Ditill-Qwen-32BDeepSeek-R1-Ditill-Ollama-7BDeepSeek-R1-Distill-Ollama-7BDeepSeek-R1DeepSeek-V3騰訊云部署流程CloudStudio:登錄騰訊云官網,進入CloudStudio,可一鍵部署,即開即用,能快速體驗7B以下DeepSeek-R1蒸餾模型。云原生構建:登錄騰訊云,云原生構建相關服務,一鍵體驗DeepSeek,無需等待下載,支持1.5b/7b/8b/14b/32b多款模型。TI平臺:登錄騰訊云TI平臺,提供專屬算力、多種尺寸模型、0代碼模型部署等功能。HAI:登錄騰訊云HAI控制臺,新建DeepSeek-R1應用,創建完成后可通過站內信獲取密碼,選擇可視化界面(ChatbotUI)或命令行(JupyterLab)直接調用DeepSeek-R1模型。云應用:登錄騰訊云找到云應用服務,直接購買成品DeepSeek應用,或利用云應用定制化軟件功能,快速部署AI應用或定制傳統軟件。搜索方案:大模型知識引擎:注冊并登錄騰訊云,在控制臺搜索“大模型知識引擎”體驗”開通服務。新建應用并配置基礎信息,選擇DeepSeek-R1/V3模型,即可在右側調試窗口提問搜索。API接口:申請騰訊云DeepSeekAPI接口,獲取APIKey后,可在自己的應用或程序中通過調用API來實現DeepSeek模型的搜索功能。騰訊云API調用開發者首選,DeepSeek部署簡單、直觀、高效!HAI提供GPU算力和ollama環境,支持1.5B,7B,8B,32B等多個DeepSeek-R1蒸餾模型。企業級首選,DeepSeek部署穩定、安全、易用!騰訊云智能全棧AI服務上架DeepSeek系列模型創建應用華為云+silconflow通過創建APIkey調用邀請碼:z0sI0urY邀請鏈接:/i/z0sI0urY華為云模型微調對話模型微調生圖模型微調模型微調工程DeepSeek:推理模型|推理能力蒸餾模型蒸餾工程老師模型學生模型DeepSeek蒸餾模型老師模型和學生模型小模型:相當于一枚小學生,知識面非常有限,但是勝在沒教授那么大譜,給個板凳坐著就夠了(部署成本低,推理成本低)。大模型:像一位見多識廣、知識儲備龐大的“大教授”,無所不知,但是“供養”他很貴。什么是模型蒸餾?“模型蒸餾”就是把大模型學到的本領,用“濃縮”的方式教給小模型的過程,在保證一定精度的同時,大幅降低運算成本和硬件要求。模型蒸餾蒸餾是一種機器學習技術,其中較小的模型(“學生模型”)被訓練來模仿較大、預訓練模型(“教師模型”)的行為。1.數據蒸餾在數據蒸餾中,教師模型生成合成數據或偽標簽,然后這些數據用于訓練學生模型。
2.Logits蒸餾在logits蒸餾中,學生模型被訓練來匹配教師模型的logits,而不僅僅是最終的預測。這種方法保留了更多關于教師模型置信水平和決策過程的信息。
3.特征蒸餾特征蒸餾涉及將教師模型中間層的知識轉移到學生模型中。通過對齊兩個模型的隱藏表示,學生模型可以學習到更豐富和更抽象的特征。蒸餾、微調、RAG蒸餾:是學生通過模仿老師的解題思路,達到和老師相似的知識水平。微調:又叫精調,相當于學生意識到自己某門課有短板,然后自己找參考書惡補了一下,從而補上短板。蒸餾、微調、RAGRAG:直譯過來叫做“檢索增強生成”。相當于這題我不會,但是我有“小抄”,我回答的時候,就看一眼小抄,然后再綜合我腦子里的已有知識,進行回答。DeepSeek本地部署1.GPU要求推薦NVIDIA顯卡(RTX3090/4090/A100等)顯存要求:■7B模型:至少16GB顯存■13B/20B模型:至少24GB顯存■70B模型:需多卡并行(如2xA100)支持CUDA11.7+和cuDNN8.5+DeepSeek本地部署-硬件環境準備2.系統要求Linux(Ubuntu20.04+)或WindowsWSL2Python3.8+,推薦使用Anaconda/Miniconda管理環境方法1:使用HuggingFaceTransformers方法2:使用vLLM加速推理方法3:Docker部署DeepSeek本地部署-部署辦法AnythingLLM接入下載安裝?打開官網,根據自己的系統選擇下載對應的版本。?安裝文件,按照安裝向導的提示進行操作,默認路徑安裝或修改默認安裝路徑都可以。安裝完成后,點擊完成自動跳轉到AnythingLLM界面。模型配置?LLMSelection(大語言模型選擇):選擇Ollama,如果本地已通過Ollama部署了DeepSeek等模型,AnythingLLM會自動檢測。這意味著模型和聊天記錄僅在運行Ollama模型的機器上可訪問,保證了數據的安全性和隱私性。?EmbeddingPreference(嵌入偏好):使用AnythingLLMEmbedder嵌入工具,文檔文本會在AnythingLLM的實例上私密嵌入,文本數據的處理和轉換在本地進行,不會泄露給第三方。?VectorDatabase(向量數據庫):使用LanceDB作為向量數據庫,向量和文檔文本都存儲在AnythingLLM實例上,進一步確保數據的私密性和安全性。接入DeepSeek模型?通過Ollama接入:先在本地通過Ollama部署DeepSeek模型,然后在AnythingLLM中選擇Ollama作為語言模型推理后端,AnythingLLM會自動連接到本地Ollama服務中的DeepSeek模型。?通過DeepSeekR1API接入:在AnythingLLM工作區右側點擊設置,選擇聊天設置,更改LLM模型為DeepSeek,輸入APIKey并選擇DeepSeekR1模型,點擊更新工作區即可。搭建本地知識庫?在AnythingLLM左側工作區找到上傳按鈕,選中要上傳的文檔,點擊移動到工作區,再點擊“SaveandEmbed”,對文檔進行切分和詞向量化。?完成后,點擊圖釘按鈕,將文檔設置為當前對話的背景文檔,即可在聊天窗口基于上傳的文檔內容與模型進行對話。本地部署方法Ollama+DeepseekLMStudio+DeepSeekAnythingLM+Ollama+Deepseek+向量模型(EmbessingModel)Dify+Ollama+Deepseek+向量模型(EmbessingModel)OllamaLMStudioDeepSeek模型下載模型OllamaLMStudioDeepSeek模型下載模型AnythingLMDify調用模型Ollama下載Ollama運行Ollama運行Ollamarundeepseek-r1LMStudio本地部署前期準備:確保設備滿足一定硬件要求,顯卡需GTX1060(6GB)及以上,推薦RTX3060及以上;內存8GB及以上,推薦16GB及更高;C盤剩余20GB空間,建議使用NVMe固態硬盤。安裝LMStudio客戶端:在官網lmstudio.ai下載對應操作系統的安裝包,雙擊運行并按提示完成安裝。啟動后,點擊右下角設置圖標將語言改為簡體中文。加載模型:自行下載獲取模型,下載到本地后,點擊左上方文件夾圖標選擇模型目錄導入;若不會找模型,可在LMStudio的設置里,勾選“UseLMStudio'sHuggingFace”,再點擊左上方搜索圖標搜索deepseek選擇模型。注意參數規模不同,性能和硬件需求有差異。例如,1.5B適合體驗嘗鮮,7B適合普通創作及開發測試,8B適合對內容要求更高的場景,14B適合專業及深度內容創作。LMStudio+DeepSeekLMStudio可以通過huggaface下載Deepseek各種蒸餾模型(GGUF)DeepSeek
UI客戶端使用AnythingLM+Ollama+DeepseekRAG數據庫工程LLM首選項向量數據庫Embedder首選項文本分割RAG中的Embedding模型Embedding模型貫穿RAG流程多環節CherryLM+DeepSeekAPI大模型智能體工程五大AIAgent多智能體開發框架微軟AutoGen:Github地址:/microsoft/autogenCrewAIGithub地址:/crewAIInc/crewAILangGraph:Github地址:/langchain-ai/langgraphOpenAISwarm:Github地址:/openai/swarm微軟Magentic-OneGithub地址:/microsoft/autogen/tree/main/python/packages/autogen-magentic-oneDeepSeek業務流應用DeepSeek業務流應用Coze+DeepseekAPI(DeepseepR1)業務流Dify+DeepseekAPI搭建本地知識庫Langchain+DeepseekAPI業務流工程2025七款RAG1.R2R:官網:https://r2r-docs.sciphi.ai/功能:用于開發本地RAG應用程序,支持多模態內容攝取、混合搜索、知識圖譜構建、GraphRAG,具備用戶管理、可觀測性、配置及可視化交互等功能,適用于處理動態數據和復雜實體關系的應用程序。2.Cognita:官網:/功能:模塊化框架,提供定制化管道,用于構建可擴展且生產就緒的RAG應用程序,適合企業大規模AI應用。3.LLMWare:官網:https://llmware.ai/功能:提供統一框架構建基于LLM的應用,如RAG和代理,包含RAGPipeline和50+小型專用模型,適用于定制特定領域解決方案。4.LangChain:官網:/?功能:構建于大語言模型之上,通過鏈式調用組合組件,簡化開發者與語言模型交互,可用于構建問答系統等,支持與多種數據源集成。5.deepset的Haystack官網:https://haystack.deepset.ai/、功能:用于構建基于NLP的搜索和問答系統,提供模塊化架構、多模型支持、高效檢索、問答功能,可擴展性強,適用于問答系統和文檔檢索應用。6.LlamaIndex官網:https://docs.llamaindex.ai/?功能:簡化外部知識庫與LLM的集成,支持動態數據攝取和自定義索引,可與多種預訓練語言模型配合使用。7.txtaiGitHub主頁:/neuml/txtai功能:一體化嵌入數據庫,提供自然語言搜索、可自定義管道,具備輕量級高效的特點,適合快速設置和有強大搜索需求的項目。DeepSeek賦能各行業的應用場景1.DeepSeek賦能酒企場景-市場分析與消費者洞察-智能營銷與個性化推薦-生產優化與質量控制-供應鏈管理與庫存優化-品牌故事與文化傳播-智能客服與消
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國防彈衣和個人防護系統行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國閉環預付卡行業市場發展趨勢與前景展望戰略研究報告
- 主管年度員工環保任務計劃
- 2025-2030中國銀基抗菌劑行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國鋁帶式麥克風行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國鉭電解電容器行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國采耳行業市場發展分析及前景趨勢研究報告
- 2025-2030中國酪酸梭菌行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國邏輯輸出光電耦合器行業市場發展趨勢與前景展望戰略研究報告
- 2025-2030中國透氣性隱形眼鏡行業市場發展趨勢與前景展望戰略研究報告
- 2023版藥品生產質量管理規范 附錄1 無菌藥品
- 2023年新疆鐵道職業技術學院單招面試模擬試題及答案解析
- 天星鄉養羊項目績效評價報告
- GB/T 39489-2020全尾砂膏體充填技術規范
- 《民法》全冊精講課件
- 廠內機動車輛課件
- 四川方言詞典(教你說一口地道的四川話)
- 企業標準編寫模板
- 《新媒體運營》考試參考題庫(含答案)
- 學校食堂餐廚具操作規程
- DB32T 3916-2020 建筑地基基礎檢測規程
評論
0/150
提交評論