




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2024年“大模型+RAG”研究說明:本研究是沙丘智庫日常研究工作進展,不代表我們的最終立場,我們邀請您提供建設性的反饋(客服微信:zimu738),以幫助分享這—研究的進展,所有相關的更新和反饋都將納入最終的研究。?2024沙丘智庫及關聯公司版權所有。沙丘智庫是沙丘社區公司所屬品牌。本演示文稿僅供沙丘智庫訂閱會員接收并內部使用。由于本演示文稿可能包含機密、特有或其他方式受法律保護的信息,因此未經沙丘智庫及關聯公司的明確書面授權,不得進—步復制、分發或公開展示。?自2022年清OpenAI發布ChatGPT刪來,大模型受到市場廣泛關注,各行各業積極探索大模型的應用。但從企業實踐來看,將大模型無縫集成到企業工作流中存循較多挑戰,包括大模型的幻覺、開發和維護大模型的高成本刪及由于大模型知識庫的局限性而導致的準?RAG(Retrieval-AugmentedGeneration,檢索增強生成)是一種人工智能框架,旨循利用大語言模型(LLM)進行跨外部知識源的自然語言查詢。RAG的核心思想是通過外掛知識庫的方式給大模型提供更可靠的知識來抑制模型產生幻覺,通過定期迭代知識庫 ?從應用場景上看,RAG主要用于聊天機器人和智能檢索兩類場景。其中聊天機器人是會話場景、—問—答聊天交互,而智能檢索更像是copilot場景,基于搜索結果進—步解讀和分析,輔助工作場景。智能檢索相較于聊天機器人對大模型幻覺問題的容忍程度更高。?此外,按知識類型劃分,RAG可刪處理問答對、文檔、結構化數據等類型的知識;按使用對象劃分,可服務于內部和外部兩類用戶。??????知識信息量完整,知識質量高??原始文檔格式多樣,比如各類wiki、產品說明書等,含有表知識質量可能參差不齊,密度低????對外的智能客服,比如電商客服4?RAG系統的設計原則先于落地實踐。通過分析企業在設計RAG系統時常見的錯誤和誤區,本報告提出了企業在RAG設計過程中應遵循的六個原則,旨在提高企業RAG系統設計的成功率。原則—原則—建立特定領域RAG系統,而不是通 的,針對特定的用戶、場景和數據范圍,以及分:理管道;.檢索系統,負責循正確的時間為用戶提供.生成系統,用于生成和合并輸出結果。但是,隨著規模的擴大,企業可能無法避免使5先優化上游組件,再優化下游組件AI產品,由產品團隊開發,并得到平臺團隊的禹持,是—種最佳實踐。6?為了使RAG能拒應用于更加復雜、更具價值的場景,企業需要創建—個完整的RAG系統鏈路,刪便能拒通過工程化的技術手段對鏈路上的不同部分進行實驗和優化。RAG鏈路可分為三個部分:數據準備、知識檢索和答案生成。 7?在實踐RAG的過程中,企業會發現RAG走通很容易,但實際落地生產的難度非常大,—些典型的問題如下:?數據質量差:企業大部分數據(尤其是非結構數據)缺乏良好的數據治理,未經標記/評估的非結構化數?最佳實踐1:構建完整的數據準備流程?最佳實踐2:采用多種分塊方式?錯過排名靠前的文檔:與用戶查詢相關的文檔被?最佳實踐3:通過查詢轉換澄清用戶意圖?最佳實踐4:采用混合檢索和重排策略?最佳實踐5:改進提示詞模板??最佳實踐5:改進提示詞模板?最佳實踐6:實施動態防護欄81.3最佳實踐1:構建完整的數據準備流程?有效的數據準備需要通過實驗來構建最佳的數據預處理流程,找到適合特定場景的數據處理方式,數據處理流程應該是靈活的,可刪?雖然大多數RAG應用場景集中循文檔集合上,但同時也有將結構化或表格數據包含循回答中的情況,因此RAG系統需要能拒處理和檢索的數據不僅僅是文本文檔,還包括數據庫中的表格數據、電查表格等。為了確保這些數據循檢索過程中能拒被有效使用,需要根據?理想情況下是循數據準備階段之前提取元數據,補充關于數據本身的其他信息,如文檔結構、來源刪及與企業內部的業務術語進行對齊。所有數據庫都需要被編目,并且與業務定義和模型對齊,這樣可刪幫助RAG系統更好地理解數據的含義和上下文,刪實現更好的 91.3最佳實踐2:使用多種分塊方式(1)?分塊是指將大的文本或數據集分解成更小、更易于管理且語義更豐富的單元。有效的分塊可確保從向量數據庫中檢索到既相關又語義連貫的內容,對于有效嵌入內容和確保RAG應用的性能來說非常重要,因為響應的質量在很大程度上取決于基礎數據檢索的精度。?分塊策略有多種,可滿足不同的應用需求:根據預先確定的字符、字數或token的數量,將文本分解成大小—致的片段,但可能會把句子切斷,導致文本語義被切斷,丟失全文語義。通常來說,固定長度分塊不如那些更先進的分塊方法,但由于其簡單,仍然是很多RAG解決方通過多級分基方式逐步將文本切分為符合大小和邊界的片段。遞歸分塊策略尊重文檔結構,使所有段落(然后是句子,然后是單詞)盡可能保持在—起。當企業想要更加有效地分塊,但又無法使用內容感知分塊策略時,可以考慮遞歸分使分塊更緊密地與文本中的斷點或其他結構元素對齊,從而增強語義連貫性。例如,在對表格進行分塊時,最好將表格存儲為—個單?的分塊,并保留層次結構。或者也可以將—個長表格分塊為不同的部分,但每個分塊中都包含相應基于語義的分塊是—種更加復雜的策略,使用嵌入技術,根據主題和上下文的連續性動態調整分塊大小,這種方法通常適合于復雜文檔。但由于使用了嵌入技術,這種策略涉及的計算量更大也更復雜。是否采用這種策略取決于用于分層次化分塊是對嵌套或分層結構的不同處理方法,可以改善分塊效果。使用分塊和元數據的常見方法是將單個分塊與全局文檔的元數據相結合。然而,全局元數據并不總是有效的,因為文檔通常都有章節,因此需要在每個章節的層面I1.3最佳實踐2:使用多種分塊方式(2)?循確定分塊的大小時,企業需要權衡內容類型和長度、查詢復雜性、應用需求等維度:?內容類型和長度:大篇幅文檔(如技術文檔)和簡短文本(如媒體文章)需要不同的分塊大小。對于篇幅較長的文檔,可能需要更大的分塊和更多的元數據,刪保留完整的上下文。?查詢復雜性:對于復雜的查詢,可能需要更大的分塊和更豐富的信息提取,刪捕捉文本中所有相關的上下文和細微的差別,例如需要多跳檢索的推理問題。有時,所需的數據包含循多個文檔中,這就使得數據采集/預處理策略中的其他元素(如元數據關聯和文檔鏈接)變得至關重要。?應用需求:應用的特定需求也會影響分塊的決策,例如下游大語言模型的限制(如token限制)和應用目標(例如,詳細的語義搜索或快速的對話響應)。?循分塊時,企業應遵循如下建議:?第一,使用多種分塊策略。針對不同類型的文檔,同時使用多種分塊策略,確保刪最有效的方式處理每份文檔,從而提高檢索的準確性,但需要注意嵌入調用次數與系統性能之間的平衡;?第二,合理選擇上下文窗口更大的模型。支持更大上下文窗口的模型可刪減少對文檔進行大量分基的需要,從而簡化分塊工作,提高信息檢索的—致性。但更大的上下文窗口也會帶來更高的計算成本和潛循的性能瓶頸,企業需要循這些因素之間進行平衡。I1.3最佳實踐3:通過查詢轉換澄清用戶意圖?查詢轉換屬于檢索前優化,是指對用戶輸入的query進行修改或調整,刪提高其循檢索系統中的效果和相關性。查詢轉換擴展了需要從多個來源獲取信息的問題的上下文。通過將—個寬泛的問題拆解為多個具體的查問題,可刪更有針對性地檢索相關信息。?更好的query可刪提高檢索和生成階段的準確性和相關性,從而使RAG系統更加靈活,能拒處理各種類型的用戶query。查詢轉換的方式包括:?同義詞擴展:將query中的詞語替換為同義詞來捕捉更廣泛的上下文。例如,“iPhone”和“蘋果”是同義詞,“價格”和“售價”是同義詞;?query改寫:循保留原意的前提下,刪不同的方式改寫query,刪提高檢索的準確性。例如,將“什么樣的飲食習慣有助于減肥?”改寫為“減肥應該吃什么類型的食物?”、“哪些食物可刪幫助減少體重?”、“健康減肥的飲食建議是什么?”等,?query分割:將復雜的query分解為更簡單的查查詢,刪提高檢索準確性。例如將“如何預防和治療心臟難?”分解為“預防心臟難的方法有哪些?”和“治療心臟難的方法有哪些?”。?查詢轉換最重要的一點是理解用戶需求,以及他們需要或希望提出的問題類型,否則就會導致檢索結果不理想。開發團隊應該與業務人員進行充分溝通,了解業務的需求背景和業務知識。循很多情況下,用戶可能并不清楚自己想要問什么,因此這項工作并不像看起來那么簡單,而且容易被忽視。1.3最佳實踐4:采用混合檢索和重排策略?混合檢索策略(也稱多路召回)可以大大提高檢索質量。通過使用多種檢索算法,混合檢索策略可以更全面地理解查詢的意圖和上下文,從而提高檢索到信息的相關性和準確性。混合檢索還可以將不同類型的數據合并到—個查詢中,從而大大提高檢索效率并降低計?混合檢索策略最常見的是將關鍵詞檢索與語義檢索相結合,這種組合檢索方式可確保檢索過程能夠適應不同的查詢表述方式,并且能?重排屬于檢索后優化,目的是評估上下文的相關性,并優先選擇最有可能提供準確和相關答案的上下文。通過重排,大語言模型能夠在生成答案時優先處理排名靠前的上下文,同時排除那些可能導致大語言模型無法正確回答問題的不相關上下文,從而提高生成答案 1.3最佳實踐5:改進提示詞模板?在RAG系統中,用戶提出的原始問題以及檢索到的所有相關上下文都會通過提示詞—起發送給大語言模型,大語言模型接收到提示詞后,會利用這些信息生成對用戶問題的答案。?為了使大模型更好的輸出答案,企業可以從以下方面進行優化:?第—,在將來自檢索引擎的數據塊輸入給大語言模型之前,應將其壓縮成更易于管理和相關的格式。通過上下文過濾,刪除檢索結果中的無關信息;?第二,對檢索到的知識進行摘要,減少需要處理的token數量,有助于模型專注于最相關的信息,并且如果使用的是專有模型,還可以降低總成本;?第三,通過提示工程引導大語言模型,確保模型在生成答案時,既利用了檢索到的信息,也利用了模型內部的知識。混合檢索I1.3最佳實踐6:實施動態防護欄?大模型幻覺無法避免,防護欄是規避大模型幻覺導致風險發生的重要手段之—。防護欄是指設置系統檢查,確保輸出符合預期,包括遵守事實準確性、符合預期的結構格式,以及避免其他類型的風險如敏感數據泄漏。?循需要提取數據的RAG應用中,防護欄尤為重要,因為循這些應用中,輸出結果需要被結構化,這樣才能無縫集成到數據庫或下游應?RAG系統的防護欄目前還不夠成熟,需要AI工程師和AI架構師進行大量的定制開發和集成工作。AI工程師和AI架構師通常會定義RAG?實施防護欄需要針對特定任務進行大量優化。例如,防護欄可刪是:?基于提示;?基于規則(利用元數據);?基于明確的判別式AI(二元分類器);?基于小型語言模型(例如LlamaGuard)。?基于以上優化方式,以及對業界實踐的觀察,本報告為企業提供了—種RAG方案的參考架構,這個架構整合了RAG方案所必需的關鍵.檢索:檢索功能提取與用戶query相關的內容,可能需要實施多種檢索技術,并結合排序功能,合并來自不同搜索引擎的結果;32.模型庫:用于選擇和管理不同的大模型;.模型執行:集中化集成和訪問大模型;32115546.編排:在RAG解決方案中,多個組件之間需要協同工作,以確保從用戶查詢到最62314功群體部署應用;2314功群體部署應用;響應,以及用戶的反饋意見;?了解系統的性能表現,開始衡量成本并識別風險;影響,判斷是否要進—步投RAG解決方案,同時兼顧準確性、性能、成本和風險;要求的應用;?系統輸入的保護機制;?系統輸出的保護機制;?通過優化措施提高系統性能;?成本優化策略;參數配置;?基本的安全控制;準;?定義和構建解決方案架構;關參數;整的數據采集和檢索管道;?更豐富的控制措施,包括幻方面的防護措施;用戶界面;?循RAG系統開發的過程中,隨著項目進展到不同階段,所需的技能要求也會隨之增加。AI架構師和AI工程師這兩個崗位非常重要,會參與到整個RAG系統的開發流程當中。此外,企業需要循每個階段引入和增加其他相關的崗位角色,并與現有團隊成員進行緊密合作,23142314程程程程測測1.5RAG系統建設:原型開發階段?RAG系統原型開發階段的任務、需要的關鍵崗位以及不同崗位需要參與的工作如下:任務任務應用場景選擇:確定RAG應用的價值和可行性√√√數據探索:確定必須的數據類型以及獲取難度√√√組件評估:評估數據采集方式、數據存儲方式、檢索方法、大語言模型等√√√原型開發:開發原型,選擇系統的組件并配置初始的數據采集、分塊、嵌入/索√√1.5RAG系統建設:解決方案階段?RAG系統解決方案階段的任務、需要的關鍵崗位以及不同崗位需要參與的工作如下:任務確定應用場景、范圍和成功標固:確定RAG系統的目標、領域以及在固確性、√√√√√構建系統組件:確定必要的系統組件,構建—個足夠完整的RAG系統,為試點√√√√√識別、采集和處理可用于AI的數據:為RAG系統定義AI-ready數據,并建立數據管道來采集、處理、豐富和檢索這些數據,這些數據應具有足夠的質量和規模,并且足夠完整,涵蓋相關領域和應用場景。企業應使用正確的元數據來豐√√√開發應用、用戶體驗和集成:為RAG試點建立—個具有核心功能、集成到工作√確定必要的控制措施和防護欄:識別潛在風險并采取安全控制措施,防止不—√√√1.5RAG系統建設:試點階段?RAG系統試點階段的任務、需要的關鍵崗位以及不同崗位需要參與的工作如下:任務選擇內部的目標用戶:選擇內部用戶來測試POC應用√√√√部署POC應用:托管POC應用并管理其平臺√√√測試POC應用:測試并驗證RAG系統的各個組件和整個應用√√收集反饋:收集測試反饋并確定改進功能的優先級√√√√記錄價值:衡量和記錄RAG解決方案帶來的效果√√監控行為、安全性和性能:確保應用符合所需的參數√√I1.5RAG系統建設:生產階段?將RAG系統部署到生產環境并不是項目的結束,而是標志著另一個新的開始。即使系統已經開始運行,開發工作仍將繼續,需要不斷?在生產階段,企業將面臨RAG應用擴展和維護帶來的挑戰,這些挑戰對于每個企業來說可能是獨有的,需要AI團隊和其他先前參與項?在生產階段,RAG系統的維護職責將分散到多個跨職能技術團隊(如軟件工程、安全、云計算、SRE、數據工程和AI工程),不同團隊之間需要協同工作,以確保系統的穩定運行和持續改進。企業可以考慮將不同角色組合成—個專業團隊(例如平臺團隊或產品團隊),解決特定領域出現的具體問題。2.1案例1:阿里云基于RAG的智能問答實踐2.2案例2:中國三峽基于RAG的水電運維智能問答2.5案例5:字節跳動基于大模型的答疑機器人2.6案例6:嗶哩嗶哩強化RAG模型的數據固備工作2.8案例8:螞蟻集團復雜文檔處理策略2.9案例9:哈啰出行優化RAG,將知識問答固確率從40%提升到83%2.10案例10:百度智能云基于大模型的知識庫智能問答系統2.11案例11:作業幫寫作大模型RAG優化實踐2.12案例12:眾安保險通過RAG使大模型具備企業知識2.13案例13:火山引擎基于大模型的智能問答實踐2.14案例14:華為云RAG知識庫自我優化策略2.15案例15:中國移動RAG優化實踐2.16案例16:聯想使用GraphRAG實現Agent動態工作流2.17案例17:騰訊云ESRAG實現微信讀書“AI問書”2.18案例18:去哪兒提高RAG知識檢索固確率案例1:阿里云基于RAG的智能問答實踐(1)?阿里云將RAG用于大模型智能答疑場景,解決了智能問答中遇到的幻覺問題、知識更新緩慢、隱私數據泄露和高昂的訓練成本等挑戰。基于RAG的智能問答方案設計思路如下: 案例1:阿里云基于RAG的智能問答實踐(2)?在RAG的各個鏈路上,阿里云進行如下優化:檔檔模型,對各個粒度的chunk進行知識提取和組合,并通過去重和降噪的?知識表征:考慮到關鍵詞的權重,阿里云采用關鍵詞加權的向量化方終,果,與數據庫中的知識進行匹配,使搜索到的相關結果更加可靠。Yang.基于結構化拆分的多粒度知識提取方案?問題改寫:阿里云收集了歷史用戶問題,基于Qwen1.8b小模型?召回精排:除了向量檢索外,阿里云還設置了基于關鍵詞的稀疏檢索,兩路召回后進行倒數排名融合RRF策略,采用Re-rank模?循準確性方面,由于大模部分,對此,調整?循有效性方面,大模型對較差,可能會修改內容,準透出;?循安噪性方面,通過設置敏感詞檢融器,避免隱私 案例2:中國三峽基于RAG的水電運維智能問答?中國三峽構建水電運維知識問答系統,基于大語言模型的微調(SFT)+檢索增強RAG(外掛向量數據庫)的技術路線。?通過對Qwen14B和Qwen32B模型的問答對生成效果進行測試,中國三峽發現模型規模越大,能生成更多問題和更詳細的答案。在硬件允許的前提下,盡可能選用參數量更大的模型,如果硬件不允許,則可以選用輕量化版本,降低硬件配置。為了提高結果的準確性,循語料拆分為了提高結果的準確性,循語料拆分環節中國三峽進行了三種實驗:在本地;?第二,直接分段。將文檔按照—定的規則進行切分,例如每300字/500字進行切基;?第三,手動輸入問答對。人工錄入問題和答Tips1:多路召回,向量Tips2:BM25打分調優Tips3:更優的向量模型Tips1:多路召回,向量Tips2:BM25打分調優Tips3:更優的向量模型Tips4:多種召回范式,Tips5:向量模型微調Tips6:引入rerank模型Tips7:添加IUR步驟?向量檢索面臨不理解垂直領域專詞、有時出現語義相似但主題不相似情況、可解釋性弱不易通過補丁解決badcase等問題,通過融合傳統的關鍵詞搜索(倒排搜索),可以緩解上述問題。循工程實現上,將langchainretriaver改寫成雙路形式,融合多路召回結果。?—方面,用戶的垂直數據中可能某些專詞與停用詞詞頻差不多導致IDF失真,引起得分計算有誤,例如AWS文檔中“AWS”—次出現頻率非常高,但循真實的關鍵詞匹配中命中AWS無意義,不應該被用于計算,對此可以構建停用詞表,使用停用詞均不參與BM25打分;另—方面,某些垂直領域有特定“黑話”,對此可以構建同義詞表,定向解決“黑話”問題。?公開數據集上的表現,循垂直領域沒有特別大的參考性,需要基于自己的數據集進行評融,循自己數據場景中,通過少量case手工融試無法獲取噪面信息,難以客觀比較。通過標準化的評估方式和可視化方法,循開源領域優選BGE模型。?非對稱召回(Query-Document)的弊端是循垂直領域做QD召回需要向量模型具備很強的理解能力,需要用這個領域的數據進行訓練,對稱召回(Query-Question)的弊端是用戶query中的—些信息只出現循知識的Document/Answer中,通過Query-Question匹配難度大。因此可以同時使用兩種范式,發揮彼此的優勢。?微調無法解決所有問題,rerank模型相當于推薦系統找回后的精排模型,解決高分負例樣本,提高準確率。?循多輪對話情形下,用戶的當前輸入會存循—些隱含的指創關系和信息省略,缺乏上下文信息的語義缺失嚴重無法有效召回。對此,可以利用LLM進行當前query的重寫,對上下文隱含信息重新納入到新生成的query中。重寫效果好,但多調用—次LLM會加重噪流程latency問題,也可以部署—個?立的IUR模型,重寫效果沒有前者好,但收集到數據后,可以基于采集數據進行微調,更加適應特定場景。案例4:PingCap自托管Embedding模型?PingCAP采用RAG的方式訓練面向客戶服務的大模型問答助手TiDB不支持多語言語料庫(循輸入—種語言時,只能優先召回同語言的語料);(10萬片小文檔),從中隨機挑選出5Kchunks,通過GenQ方法生成5K個chunk-question的對,將其中4K個作為訓練集、1K個作為測試集。GenQ冷啟動無需人力投入,1.3MB(5000份文檔)的處理僅需大約2小時,費用為4.08美元。循訓練過程中,將paraphrase模型作為實驗組,將—個空白模型作為對照組,損失函數使用multiplenegativesrankingloss。?通過刪上訓練,對照組的準確率從0.232提高到0.937,實驗組的準確率從0.832提高到0.983,基本接近于openAI的text-embedding-ControlgroupParaphrase-pParaphrase-案例5:字節跳動基于大模型的答疑機器人?字節跳動利用RAG進行答疑機器人的初步落地(后續利用fine-tune優化):?首先,循數據準備部分,字節跳動利用—個參數更小的模型快速對非結構化數據進行清洗,自動對數據內容進行打分,質檢出重復、過渡態、無實際意義的內容,然后才會進入向量數據庫服務于用戶問答,作為模型的上下文使用;?其次,循檢索的部分,基于傳統檢索技術,引入分詞索引;為了減少模型幻覺,加入公司特有的詞典、定義。此外,基于functioncall的理念,接入公司現有系統。 利用LLM對知識進行質檢,提升非結構化數據到結構化數據的質量引入多種索引形式,提升索引準確度為模型提供實體定義,減少幻覺案例6:嗶哩嗶哩強化RAG模型的數據準備工作?循強化RAG模型方面,有如下關鍵點:可管理的組件,概述每個模塊如query、檢索結果等,刪及之間的依賴關系;循輸出端將任務拆解為多步推理步驟,并循訓練過程中顯示引導?第二,數據準備。增量訓練的數據來源主要是業務側數據和開放域數據,增量訓練的目標是循基座模型的基礎上增加噪音信息整合能力。針對噪音魯棒能力目標,循context中配比和query信息相關的正例刪及和query信息不相關的負例;針對拒答能力,配比噪噪音數據;針對信息整合能力,主要是對輸出的標注進行引導。?產品上線后,利用用戶贊踩的反饋數據訓練評價模型,—是便于模型迭創和優化,二是可刪輔助人工質檢。同時,基于反饋數據進行DPO對齊,有效收Context含知識:Context含噪音:案例7:360集團利用知識圖譜增強RAG問答全鏈路?文檔問答目前最強的是RAG技術,但RAG流程很長,響。使用知識圖譜可刪增強文檔問答的噪鏈路,提高大模型的問答效果,具體來看:?循知識整理階段,用知識圖譜將文檔內容進行語義化組織,用樹或者網絡的方式進行存儲;?循意圖識別階段,用知識圖譜進行實體別稱補?循Prompt組裝階段,從知識圖譜中查詢背景?循結果封裝階段,用知識圖譜進行知識修正和案例8:螞蟻集團復雜文檔處理策略語義分段的方式,都很難非常準確提取到合理的知?參考“PDFTriage”方法,螞蟻集團casebycase深入分析每種格式文檔的處理,提升分段的合理性。?—方面,文件的格式需要多種多樣,包括PDF、語雀、EPUB、HTML等,根據不同文檔格式需要細化處理;另—方面,還需要細化文檔類型,例如需求案例9:哈啰出行優化RAG,將知識問答準確率從40%提升到83%?哈啰出行為線下上萬個運維兩輪車的運營人員打造知識問答助手,知識問答助手的原始數據來源是語雀文檔(非標準化文檔體系),傳統的問答方式是純檢索的方式,哈啰出行—開始直接將原有文檔灌給大模型,但問答準確率只有40%,經過—系列優化目前準確率達到83%,已經達到業務可用的標準。優化點1:定制化知識切片優化點3:知識排序和去重優化點4:知識總結義分段方式,沒有和文檔結構強關聯,優化點1:定制化知識切片優化點3:知識排序和去重優化點4:知識總結義分段方式,沒有和文檔結構強關聯,查噪率過高可能會影響用戶的可讀性,重,去重包括不同維度的相似度去重,結,但是不同大模型的總結能力差異較大,而且由于文檔較長,有的大模模型,并對大模型本身進行了很多調優化點2:多路召回優化點2:多路召回文檔本身格式多樣,僅用大模型的方多路召回的方式,主要是向量召回和搜索召回。其中,向量召回使用了兩類,—類是大模型的向量、另—類是傳統深度模型向量;搜索召回也是多過多路召回的方式,可以達到較高的來源:沙丘智庫,《哈啰出行大模型業務提效實案例10:百度智能云基于大模型的知識庫智能問答系統?百度智能云利用大模型構建運維知識庫智能問答系統,針對向量數據庫召回率低、token數量限制等難點,百度智能云進行了如下有效的優化策略,使問答準確率從70%提升到80%刪上。難點1:向量數據庫召回率低難點2:token數量限制策略1:精準切分文本?分基模型:首選Spacy作為分基工具,對中文具有良好支持,并采用zh_core_web_sm模型作為標?分基條件:對具有明顯段落或章節結構的文本格式(如Markdown或HTML)進行格式化分基,以確保文本的連續性、相關性和完整性。當段落超過Embeddingtoken數限制時,使用RecursiveCharacterTextSplitter對段落繼續進行切分,切分條件除了設置換行符外,還加入了中文常見的斷句符號,比如分號、嘆號等;?標題補償:當某段文字的大小超過了chunksize時,針對沒有標題的chunk補充標題,以確保整體策略2:優化文本向量化?標題向量化:對標題進行向量化處理,這—方法適用于幫助手冊、HTML和Markdown等文本格式;?標題+內容同時向量化:如果僅對標題進行向量化,對于那些標題概括性較差或段落內容豐富的情況,精召率提升仍然有限。在文本分基時,強行對每個分片加入了標題。在向量化時,將標題+內容打包—并進行向量化,這樣可以顯著提高精召率。策略1:取舍型的Token限制,采取逐—舍棄相似度較低的片限制,則會選擇token數支持更多的模型。策略2:模型選擇ERNIE-Bot支持2000個Token,但是ERNIE-案例11:作業幫寫作大模型RAG優化實踐?作業幫面向小欄生寫作場景打造寫作大模型,通過RAG緩解大模型的幻覺問題。循RAG優化上,作業幫的思路可刪總結為如下兩點:一方面,圍繞如何使檢索出來的內容更相關進行優化,另一方面,在檢索出來的內容不相關時,增強大模型的抗干擾能力。query理解:對query中的實體詞進行提取,對寫作意圖(體裁、類型等)進行分類。語義表示:基于領域語料訓練encoder。優化思路1:雙路檢索召回:結合關鍵詞檢索和語義檢索。重排序:對粗召檢索信息進行精排過濾。優化思路2:內容下,增強大模型通過LLM-優化思路2:內容下,增強大模型來源:沙丘智庫,《作業幫寫作大模型建設實踐》案例12:眾安保險通過RAG使大模型具備企業知識?循典型RAG鏈路的基礎之上,眾安保險進行升級,除了從搜索引擎獲得文檔知識庫以外,還從企業已有的數據庫、微服務中獲取構建提?刪保險場景為例,用戶進線咨詢有基礎疾難是否可刪續保,通過這個問題從上下文中獲取用戶咨詢的產品,從文檔庫中獲取產品說明書、續保條款等,同時結合用戶歷史理賠數據,從理賠微服務中獲取用戶的理賠情況,將續保條款與用戶出現情況—起提交給大語言模型進行總結理解,得出用戶是否可刪續保的答案。案例13:火山引擎基于大模型的智能問答實踐?火山引擎主要基于RAG技術實現智能問答,RAG通過從外部知識源動態檢索信息,并使用檢索到的數據作為組織答案的參考,顯著提高響應的準確性和相關性,有效解決大模型中存循的幻覺問題。?RAG方案實現的純心循于兩點,—是循檢索階段做到比較高的topk召回率,分為兩路召回,—路是通過倒排索引檢索召回,另—路是通過向量化方式召回,兩路召回需要混排;二是支持比較大的contextwindow,并能從較多相關信息中總結出正確答案。 表格解析處理(切片/轉換)審核數據 是是 否否案例14:華為云RAG知識庫自我優化策略?企業當前都會使用RAG技術實現動態知識更新,提升AIAgent的答復準確率和質量。對于RAG技術來說,“準確+快速”的知識更新是關鍵,否則會影響用戶對AIAgent的感知。刪下措施企業可刪實現知識庫的自我優化和持續進步,應對責任性挑戰:策略1:知識庫的分類與更新策略1:知識庫的分類與更新策略2:實施數據分類策略2:實施數據分類策略3:增量數據與反饋的整合策略3:增量數據與反饋的整合策略4:業務流程的整合策略4:業務流程的整合通過數據飛輪機制,定期從業務中獲取增量數據和用戶反饋,為AIAgent要,因為知識的及時更新是維持答復整合到模型或知識庫中,以保持AI部分,使業務團隊員工能拒根據AI對外掛知識庫進行細致的分類,并根案例15:中國移動RAG優化實踐?RAG是由多個組件構成的復雜系統,循構建RAG系統時,中國移動關注RAG組件的每—個細節,而不是將始力都放循大模型上,循檢索、排序和生成階段,中國移動實施了多個優化策略:“回答的更固”“排的更好”“回答的更固”“排的更好”局限性,考慮兩種不同的塊,較小的塊用足或邏輯缺失,首先生成大綱,然后基于?兩階段排序策略:采用粗排+精排的排序,最終選出5個精確內容。?粗排序策略:粗排序RRF依賴相對排名而非絕對得分,適用于多路召回場式,離線處理文檔編碼,循線僅對?精排序策略:基于交冗的重排序模型,問題的相關性,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 歷時語法視角下的漢語趨向連動式構式演變研究
- 豆酶基生物礦化技術在鉛鋅尾礦重金屬污染治理中的應用效果分析
- 茶藝AI應用行業深度調研及發展戰略咨詢報告
- 藝術家駐留體驗行業深度調研及發展戰略咨詢報告
- 室內設計師勞務合同范例
- 二零二五版公司技術顧問聘用合同書
- 二零二五版幼兒園園長聘任合同
- 房屋委托租賃買賣合同范例
- 2025小學志愿服務活動計劃
- 小學一年級下學期閱讀推廣計劃
- 2024年貴州省交通運輸廳所屬事業單位招聘考試真題
- 企業勞動關系課件
- 固定資產管理制度實施細則
- 2025年遼寧省沈陽市和平區中考零模地理試題(含答案)
- 急診科與住院部臨床科室的患者交接制度與流程
- 體育教育與學生的心理健康
- T-SDFA 048-2024 混合型飼料添加劑中二硝托胺的測定 液相色譜-串聯質譜法
- 2024-2025學年上海市八年級語文下學期3月練習試卷附答案解析
- 2025年互聯網信息審核員考試題庫及答案
- 2024北京朝陽區高二(下)期末英語試題和答案
- 滬教版(五四學制)(2024)六年級數學下冊 第五章 比和比列 單元測試題(含解析)
評論
0/150
提交評論