




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
中國?商銀?軟件開發中?產業變?,智能引領。習近平總書記指出,世界百年未有之?變局加速發展?臨新的戰略機遇。??智能是引領這?輪科技?命和產業變?的戰略性技術,具有溢出帶動性很強的‘頭雁’效應。促進??智能同經濟社會發展深度融合,推動我國新?代??智能健康發展,是科技界和產業界的時代因勢利導,乘時?上。黨和國家推出?系列??智能發展的政策和規劃,為??智能產業提供了強有?的?撐和引導,推動科研和應?躋?世界先進?列。近期頒布的《?成式??智能服務管理暫?辦法》明確了對新興的?成式??智能?模型產業的?持和?勵,完備了科學監管框架,為產業健康發展提供了有?政策導向和法規保障。商業銀?作為數字化和智能化的先?者,具備?成式?模型應?豐富的場景舞臺和技術實施基礎,勢必成為?模型技術和?業應?深度融合的最佳?范。?融強國,創新求變。中央?融?作會議指出,?融要為經濟社會發展提供?質量服務,要做好科技?融、綠??融、普惠?融、養??融、數字?融五篇??章,為商業銀?的?融強國建設指明了?向。落實在經營中,商業銀?同時必須?對客?需求多樣化、?險防控復雜化、競爭環境激烈化等多??的挑戰和機遇,需要充分利???智能等新技術提升服務質量和效率,增強?險管理和創新能?,提?企業在數字經濟中的競爭?和影響?。?成式?模型作為近年來??智能領域的最新技術成果,以其強?的表達取得了令?矚?的成果,為?融服務和產品的創新提供了新的機遇。數字銀?,砥礪奮進。商業銀?的數字化、智能化轉型不是個?帆?順的過程,當中涉及組織、技術、數據、?才等各??的挑戰。如何結合銀企??的優勢和業務場景的特點,充分挖掘??智能?模型的潛?,有效防控?模型潛在的技術和科技倫理?險等,都是急需解答和實踐的現實問題。本?從商業銀?視?,對?成式?模型的技術?撐、應?場景和評測?法等各??進?調研和全景式展?,為商業銀?的數字化發展提供理論和實踐參第一章概述 第二章人工智能大模型發展現狀 第三章人工智能大模型應用案例 49 第四章總結與展望 ??智能技術在過去??年?取得了巨?的發展,形成了完備的產業?的背后是70-80%的碎?化應?場景,當前的主流AI技術框架下,仍然需要?量的?事?議的建模和模型訓練,應?開發成本和實施周期始終是規模化應?的??制約。從使?者視?,?多數??智能應?局限于特定場景下機械化重復性的任務,缺乏類?的開放式溝通、邏輯推理、創意創作的能?,智能化?平不?。實現具備?泛領域知識和問題解決能?的通???智能(AGI)?直是科技前沿不懈努?的?向。2018年以來,?模型技術逐漸發展成為通往通???智能的關鍵演進路徑。?模型的深度神經元?絡參數規模達到百億級以上,通過?模型算法的基礎預訓練模型。在?向具體場景應?時,型尚需通過少量的場景專屬任務的標注數據來進?微調,以便能夠理解需要解決的任務類型,最終形成為場景專屬模型真正落地。?模型的出現在?定程度上解決了??標注成本?的問題。通過對海2量數據進??監督學習,可以有效地從?量標記和未標記的數據中捕獲知識,讓模型學習到更多的通?特征。借助“預訓練+微調”可對特定任務進?優化,將通?特征遷移到不同的任務中,提升模型的精度和泛化能?。模型參數規模越?使得?樣本的學習也能達到?以前更好的能?,極?的降2017年,?然語?處理領域的新型神經?絡架構轉換器(transformer)優秀的?然語??成式?模型(?圖1)。2020年OpenAI推出的GPT-3參數規模達到1750億,訓練數據量?達45TB,在通??本?成能???達到成對抗?絡(GAN)等?成式模型的成熟和深度?絡規模的提升,推動著圖像?成質量穩步爬升。不過初期的圖像?成只能?持特定場景(如?臉)圖像的隨機?成,或者將?張圖?在兩種特定的?格之間轉換(如卡通?格和實物?格),實?性相對有限。2021年開始,跨模態?成式?模型取得突破性進相關質量已能達到商業應?的要求。尤其特別的是跨模態?模型使圖像和?視頻的?成能夠通過?然語?的輸?進?控制和調節,為多媒體內容?成應?打下了必備的基礎。32022年11???智能領域科創公司OpenAI以云端服務的形式發布?成式對話?模型ChatGPT,能夠通過單輪或多輪的互動問答不斷深?理解??述求,完成知識問詢、代碼寫作和診斷、?案創作、聊天、算數等?系列傳統的NLP任務。這種以?度擬?化的通?交互模式向普羅?眾提供開放域AI服務的能?,被認為是通???智能發展的?程碑事件,獲得了市場的?泛關注,僅?2個?就創造了??數過億的新記錄,引爆了新?輪研發和應?熱潮。2023年以來,國內外頭部科技公司競相發布?模型,形成了“百模?語??模型、視頻?模型等垂直領域?模型不斷迭代,?爭百尺竿頭更進?步,例如Sora憑借在視頻質量和?致性??的出?表現,掀開新篇章;能在基礎?模型之上,?向特定領域進?步衍?出程序開發(Code)、商業智能(BI)、調度規劃(Agent)等任務?模型(?表??向垂類?業則發展出醫療、法律、?融、通信等?業?模型(?表三?模型能?呈現向4任務和?業縱深的快速拓展的態勢。旨在理解和?成?類語?,通過學習到通過學習視覺特征和語義信息的關系,通過學習語?信號中的聲學特征和語義信息,從?能夠進?語?識別和合成等通過?量代碼樣本的訓練,學習代碼的結構和特征,從??動?成符合要求的獲取實時數據的圖表展?,也可?動總旨在解決復雜的調度問題,其通過?動5其旨在利??然語?技術來處理通通過醫療書籍、病例等數據訓練?利?深度學習的?法了解各種?象作為??智能運?的先??業,銀?業?度重視?模型合實際需求先?先試,積極挖掘新技術在?融業務中的應?場景,加速推動企業數字化轉型和提升市場競爭能?。在另???,以代??智能技術對于當前??智能全技術棧帶來?新式的影響,在基礎設6施、數據準備、算法調優、安全可信等??均提出?持續探索和優化建設路徑,形成?融?模型的最佳實踐。基礎設施、?質量訓練數據、模型架構和訓練算法等變引發質變:專?AI訓練集群為研發百億級參數規模以上的?模型提供了硬件基礎;預訓練語料庫的不斷擴充為?模型提供了豐富的知識來源;轉換器(Transformer)注意?機制的應?改進了模型對?程依賴關系的建模能?;指令微調技術強化了模型對??提問意圖理解和反饋偏好的適配程度等等。鑒于?模型技術棧的復雜性,?模型?程化平臺成為?模型企業級應?的持續集成等?動化功能,極?簡化了模型和應?開發流程。商業銀?實施?模型企業能?建設,應當結合業務需求特點選擇合適的路徑構建完備的基礎和?程技術體系,降低使??檻,加速?模型從研發到產品和解決?案的價值化過程,充分賦能業務。7(1)算?設施當代以深度神經元?絡為代表的??智能模型涉及?數據吞吐量的矩陣和張量運算,對算?先天具有較?的要求(?圖2)。相?于早先在單卡或者單機上可以訓練的深度?絡模型,?成式?模型的參數規模??數千億,對計算設備的內存開銷巨?,動輒需要上百張算?卡的?撐。基于海量數據的訓練過程同時意味著可觀的計算時間開銷,為了縮短訓練周期,在實際的?模型研發中往往會進?步提?模型訓練的并發度,推升算?集群達到萬以上的規模。這樣的算?設施必須通過芯?、?絡、調度框架等系統級的協同優化來實現對?模型的?性能?持。同時,通過終端和云端的混合協同,有效降低推理成本并提升速度,云邊端三級算?緊密結合將是解決?模型?規模落地應?問題的主流?案。8?前通?的??智能芯?以英偉達的GPU產品為主流。其中英偉達的BlackwellGB200計算平臺是?款基于最新Blackwell架構的超級芯?,旨在?幅提升AI計算性能和能效。由兩個B200BlackwellGPU和?個GraceCPU組成。B200GPU包含2080億個晶體管,采?臺積電4納??藝制造,具有?達20petaflopsFP4計算能?。GraceCPU則配備了72核?的ArmNeoverseV2內核,可配置TDP?達2700W。GB200在推理?語?模型性能上?前代H100提升了30倍,同時成本和能耗降?原來的1/25。GB200配備了384GB內存,并通過900GB/s的超低功耗NVLink技術連接兩個GPU和CPU。內存帶寬提?了1.4倍,內存容量提?了1.8倍,從?增強了處理?成式AI任務為?模型訓練提供堅實的算?底座。國產AI算?產業近年來取得了??的發展。華為昇騰910對標業界先進AI產品,單精度浮點(FP32)計算速度最?可達每秒99萬億次,遠超業界計算速度最?可達每秒752萬億次。在算?集群??,Atlas900A2PoDc最?可擴展?包含8000昇騰芯?的AI算?集群,提供3EFLOPS超強算?,計算節點間通過200GRoCE?絡互聯,保障集群訓練時的?線性度。(2)模型并?框架在集群化AI算?設施的基礎上,?模型的訓練可以通過以下?種并?9模型并?(?圖3由于當前的?模型規模往往遠超單個計算設備的內存容量,將?模型切分到多個設備上成為?種?然的選擇。?模型從輸?到輸出由結構相似的算?層級連接堆疊?成,形成模型的深度;在每個層級模型可以在寬度和深度兩個?向上進?切割。張量并?是寬度?向的切分,它基于矩陣運算分解的數學原理在模型的層內進?分割,形成的單個?模型跨越完整?模型的所有層級,但只包含每個層級的部分運算。流?線并?采取基于深度的切分,將?模型的不同層級拆解到各個計算設備并通過流?操作的?式形成各個層級運算的并發執?。相對于流?線并?中分布式數據交換主要發?在承載相鄰層級的計算設備之間,張量并?中各個計算設備之間均產??量的數據交換,對數據交換的帶寬要求更?,所以主要應?在?機多卡的服務器節點內部的并發實現。數據并?(?圖4這種模式下,數據被拆散分配到位于不同計算設備上的模型實例來參加訓練過程,設備相互之間定期地就訓練所得的模型參數或者參數優化的梯度值進?同步,保證所有設備上的模型狀態保持?致。數據并??般要求每個設備上的訓練實例儲存和維護完整的模型參數和狀態,所以并不能節省AI算?設備的內存開銷。零冗余優化器(ZeRO-ZeroRedundancyOptimizer)?持將模型的參數、梯度值和優化器狀態劃分到不同的進程,允許每個設備的訓練實例只儲存模型的?部分,在訓練過程中每個訓練實例動態地從其他設備通訊獲取需要的模型參數和梯度值來完成本地的訓練計算,從?極?提升數據并發模式下的內存使?效率。混合并?(?圖5在實際應?中往往綜合模型并?和數據并?等多種策略的組合,以充分利?多個維度的并?能?,實現取?補短。例如采取數據并?+流?線并?+張量并?的模式可以充分利?算?資源和通信帶寬達到兼顧模型的內存擴展性和訓練加速的?的。?前主流的AI計算框架?態均已?持以上全部或者?多數的并?訓練模式。全球來看,典型的如PyTorch+DeepSpeed?態和TensorFlow+Mesh-TensorFlow?態。國內來看,近兩年國內?商推出的AI框架市場占有率也正穩步提升。百度?槳在2023年針對于?模型開發新發布了PaddleFleetX開發套件,其核?技術包括全場景分布式并?策略、分布式訓練優化技術和?效的?模型分布式推理與部署?案,已經具備可觀的開發者認知度。華為的昇思MindSpore框架充分考慮?模型開發時可能會遇到的問題,通過軟?模型開發并?代碼量降低80%、系統調優時間下降60%,成為國內最活躍的?模型開源框架之?,在科研領域?受認可。(3)訓練數據?泛認為是AI?模型競爭的重要因素。在所有的?模型訓練數據集中,語料數據的規模遙遙領先,有?地?撐了語??模型的快速發展。語料數據可來??絡?本、書籍、?學作品、新聞、媒體數據、社交媒體數據和公共數據集等多樣性的渠道。這些渠道提供的數據涵蓋眾多不同語?樣式和主題,?常有助于?模型通?能?的學習。?絡?本:互聯?上的?量?本是?語?模型的主要數據來源。其內容包括但不限于??信息、博客?章以及維基百科等,這些數據可以幫助模型學習到豐富的語?樣式和?泛的主題。書籍和?學作品:書籍和?學作品是另?個重要的數據來源。這些?本提供了?量的語?表達和?化背景,有助于模型學習到更多的語?規律和新聞和媒體數據:新聞報道和媒體?章數據可以涵蓋各種主題和領域,有助于模型學習到與時俱進的語?表達和話題。以作為?語?模型的數據來源。這些數據通常包含了?量的實時?本,了當前的社會和?化動態。此外,還有?些收集整理好的公共?本數據集可供使?,例如以英料為主的CommonCrawl、GutenbergProject等。中?語料??,智源研究院發布了?規模、?質量數據集WuDaoCorpora,悟道?本數據集采?20多種規則從100TB原始??數據清洗?得,開源數量約200G。上海??智能實驗室也聯合?模型語料數據聯盟構建了“書?·萬卷”數據集,其包含?本、圖?、視頻三部分數據,數據總量超過2TB。當前,?業普遍認為數據規模與?模型的性能?度相關。數據規模的增加可以提?模型的性能,幫助模型覆蓋更多的知識和規律,從?學習到更豐模的數據亦有利于提升模型的泛化能?,加強模型對于不同主題和領域表達的適應性,提?模型在新數據上的泛化性能。但是能導致訓練時間和計算資源的增加,因此在考慮數據量時,也要權衡其與訓練時間及計算資源之間的關系,在給定的計算?下,精確匹配語料規模和模型的參數規模。在數據驅動的模型訓練中,數據質量同樣需要給予?夠的關注,以避免模型在學習過程中受到誤導,獲得偏?信息,降低模型的整體表現。尤其是在處理?規模數據時,這種情況更加明顯。?規模數據往往包含各種噪?和訓練數據集重復內容、相似??,或是特定主題和特定地域的偏好數低下的語料加?模型訓練,得出的結果可能?的重復數據甚?在訓練過程中可能導致模型陷??意義的局部最優。為了解決這些問題,需要采取?系列的數據處理步驟,以降低這些因素對模型訓練的負?影響。具體步驟?圖6。訓練數據集人工評估數據去重隱私過濾數據分詞增加/修改清數據去重隱私過濾數據分詞洗規則擴充敏感詞表數據清洗增加增加/修改清洗規則擴充敏感詞表數據處理平臺基于模型的數據評估數據清洗:通過使?正則表達式或其他?本處理?具,來去除數據特殊字符、空格、標點符號等?關信息,從?確保數據的數據去重:采?哈希算法或者其他去重技術,對數據進?去重處理的過程。這?過程中,通常通過?較數據的哈希值或者特征向量來判斷數據是否為重復數據,然后刪除那些重復的數據。以采?數據脫敏、加密或匿名化等?法來保護隱私。例如,對姓處理,將真實姓名替換為虛擬的名稱。數據分詞:對于?本數據,可以使?現有的分詞?具或?然語?處理庫,將?本分割成有意義的詞語。常?的分詞?法包括基于規則的分詞和基于通過上述步驟,可以消除重復數據,還能清洗和過濾隱私信息,并進?分詞處理。此外,構建?質量的訓練數據集還需注意均衡調節各種形式語料的混合?例以保證模型的通?和泛化能?。(4)模型架構當前主流的?成式?模型架構以轉換器(transformer)結構為核?單元組件(?圖7)。轉換器能夠并發地接收?序列數據輸?(?如??本),基于對當前數據序列的分析??判斷每個數據元素與其他任意元素的相關性,并根據這些相關性權重(也即注意?)進?步加權計算和提煉出數據特征表?,因此也被稱為?注意?機制。轉換器的?注意?機制使能神經元?絡并?處理?數據序列,????幅提升了計算效率,另???通過對任意相對距離間的元素進??視同仁的相關性建模,能夠有效的捕捉到?序列中數據元素間的?程依賴關系,從?極?的提升模型的理解和識別能?。轉換器機制在2017發布后在各種?然語?處理(NLP)任務上都取得了令?矚?的成績,并逐漸推?到計算機視覺等領域,成為?前?模型的基礎結構。?模型按照模型架構劃分,?可以分為單體模型和混合模型。單體模型采?單個深度神經元?絡,通常使?稠密性?絡結構,對于任意任務輸?每個?絡節點都參與模型的計算,所有?絡區域都被激活,計算量和通信量?較?。?前業界?多數?模型采?單體結構。例如OpenAI推出的GPT-3擁有1750億參數的超?規模?絡,包含有96層轉換器結構,利?了多頭注ChatGPT的模型結構據稱和GPT-3類似。混合模型采?多個相對獨?的神經元?絡,相當于將多個相對較?的模型組合為?個?模型,避免模型越來越?,訓練樣本越來越多,每個樣本都需要經過模型的全部計算所導致的訓練成本的平?級增?問題,因此也稱為混合專家模型(MoE-MixtureofExperts)。對于單個任務輸?來說,?般只需激活?部分?模型進?計算,這樣就節省了計算資源。為了確定?個任務輸?需要激活的?模型,混合模型機制引?了?個決策?的機制以?成要激活的?模型索引,因此在控制??增加了復雜度。?歌的SwitchTransformer是混合模型的典型代表。?前?成式模型的佼佼者GPT-4據悉也采?了混合模型的MoE架構,對后續超?模型的進?步發展可能起到相當的導向效應。(5)訓練算法?成式?模型在通?和領域專屬知識上強?的建模和表達能?、對于使?者指令要求良好的理解和跟隨能?、對?成內容的合法合規及倫理價值觀對?的保障,需要歷經預訓練、再訓練、監督學習微調、獎勵模型訓練以及強化學習等?系列的訓練過程來予以實現,?圖8。理想輔助反應10-100K(提示詞、回復)數量低,質量高語言建模預測下一token微調模型原始網頁萬億字文本數量大,質量低語言建模預測下一token強化學習生成最大獎勵的token預測獎勵一致性提示詞10K-100K提示詞數量低,質量高100K-10M對比數量低,質量高基礎模型強化學習模型獎勵學習模型監督微調獎勵學習強化學習預訓練模型數據算法~~預訓練和再訓練:預訓練是?模型成功的基礎。它通過?規模的數據來多模態等?泛的領域均取得了顯著的成效。預訓練主要采取?監督學習的[2]引自微軟AndrejKarpathy的演講PDFStateofGPT:https://karpathy進???標注,從?具備?常好的數據擴展性。預訓練隨機地隱去輸??本中的部分字詞,要求模型預測?本中缺失的部分,再將預測結果同隱去的內容做?較,?給??地形成監督信號指導模型學習上下?語義知識。?再訓練是在通?預訓練模型的基礎上,加?領域數據對模型做進?步的預訓練。這?步驟對于商業銀?的?模型應??常重要,因為它將通?的預訓練模型轉化為?融領域專屬?具,使得?模型對于?融領域的問題和任務更加精確和可靠。監督學習微調:經過預訓練的?模型具備豐富的知識,但除了?監督學習中的補全任務外沒有其他解決問題的能?,需要使?有標簽的數據集進?步調教。?成式?模型接受?然語?的指令來理解任務要求,必須保持良好的指令跟隨能?,使得指令微調成為其重要的訓練步驟。指令微調采?監督學習的?式,訓練數據集包含眾多的輸?、輸出對。輸?由任務指令和具體任務的場景信息組成,輸出則是期望的答案樣例。微調?法可以根據不同的?標和資源進?選擇,例如對?模型的全量原始模型的主要參數只對部分參數進?訓練。低秩適配(LoRA-LowRankAdaption)是?種新型的輕量化微調訓練?法。它將訓練過程中模型每?層級中的參數變化值建模為?對約簡的矩陣,通過訓練簡化后的矩陣參數的?式實現對模型的增量訓練,?不改變原模型的參數,可以極?地降低訓練的資源開銷,在?模型的微調訓練中獲得越來越多的應?。獎勵模型訓練:獎勵模型?于評判?模型的輸出是否符合?類偏好和價值觀,是訓練?模型?成內容保持價值對?的輔助模型,主要采?監督學習的?式基于?量的?類偏好數據擬合?成。偏好數據集的構建可以利?已有的監督學習微調后的?模型,對相同問題?成多個不同的答案,再由標注員按照預定義的指導原則對回答進???偏好排序。訓練過程往往使?配對損失函數,最?化偏序在前的回答和偏序在后的回答之間的分數差異,最終促使獎勵模型成功地模仿??評判來對?模型的輸出內容進?標量化斷地與環境交互的過程中,通過觀察環境的狀態、選擇合適的?動、接收環境的獎懲反饋和更新??的策略,來逐漸提???的?為性能以達成優化?標。基于?類反饋的強化學習已成為?種主流的?模型價值對??法。它在訓練過程中利?融合了?類專家知識的獎勵模型對?模型的輸出內容進??動評分,針對評分不佳的回答采取?強化學習中的近端策略優化技術對?模型的內容?成策略進?迭代優化,最終實現?模型內容?成和?類價值觀的對?。在經過以上所有訓練步驟后,?模型成為兼具常識和相關領域專業知識、溝通表達流暢并能堅守倫理價值底線的得?助?,能夠切實幫助相關領域的從業者全?提升?作效率。(6)模型輕量化技術任何技術的繁榮都離不開社會化創新。?模型要?向千?百業的普及應?,勢必要降低使?成本,在實踐中主要有以下?種輕量化、?型化技術剪枝后僅有少部分的權值參與有效的計算對推理結果產?主要影響。剪枝?法(?圖9)通過把?絡結構中冗余的權值、節點或層去掉,減少?絡的規模,降低計算復雜度,讓模型在推理效果和速度上達到平衡。剪枝完成后往往需要基于原訓練集上做?定的微調,以避免由于?絡結構變化?出現的性能下剪枝后剪枝前剪枝量化:其基本思想是將神經元?絡的權值、激活值等從?精度數值類型轉化成低精度類型,例如將32位浮點數轉化成8位整型數,以同時降低模型的內存和計算開銷。其中,整數量化將浮點數值截斷或四舍五?到離它最近的整數,再統?縮放到?個值域范圍內,簡單直接但可能造成較?誤差。對?量化在整數量化的基礎上,進?步將?數部分單獨量化,可得到更?精布密集的值域區間采取較精細的刻度以提?表達的精確性。混合精度?案綜合考慮模型精度和效率,只對部分參數層進?量化,重要層保持浮點運算。量化技術已?泛?于各種深度神經?絡的部署優化。知識蒸餾:通過訓練?個?模型去模擬?個?模型的?為,使?模型也獲得類似?模型的知識和泛化能?,從?實現模型壓縮和輕量化部署(?圖10)。主要?法是利??模型的最終輸出作為軟標簽,以此為?標來監督?模型的學習過程;或者逐層提取?模型的中間層輸出作為?模型對應層的監督信號來分層次進?知識遷移。知識蒸餾可以在保證?定精度的前提下獲得較?的模型壓縮率,但需注意可能導致的模型過擬合等問題。實踐中可以綜合使?以上?法,充分發揮各項技術的優點,同時控制各項壓縮對模型精度的影響,達到實?的部署效果。2.提?引導巧?模型,沉淀提煉應?(1)提??程?成式?模型依據輸?的?結構化?然語?指令來執?任務,在極?地降低使??檻的同時,也為?模型提供了?限的問題描述空間,使其具備了萬能解答器的潛質。但也因為模型輸?形式極?的靈活度,使得?模型輸?的設計和組織富有技巧性。對于同樣的問題,有經驗的?模型使?者可以?效地引導模型按照預想?式執?任務,從?保障?模型應?的可控性、連貫性和?致性;?不熟練的使?者則可能因為指令表述不當,導致模型產??效或錯誤的輸出。為了幫助??更好地使?此類?模型,提??程應運??。提??程在輸?指令前添加提?語句,以等信息,引導模型準確理解指令意圖和問題解決途徑,從??幅提升模型的輸入輸入 輸入輸入輸入輸入 輸入輸入▲.........▲.........v▲v▲...輸出 輸出輸出 輸出(b)思維鏈提示 輸出輸出(C)自洽式思維鏈(d)(C)自洽式思維鏈(d)思維樹提示[3]ShunyuYao,etal.TreeofThoughts:De針對?模型的提?語設計模式可以分為四類:輸?輸出提?、思維鏈提?種最基本的、也是?前使?最?泛的提??法,它只需要給出?個描述任務的?然語?指令,以及零個(Zero-ShotPrompting,即沒有?例)或多個?例(Few-ShotPrompting),來讓?模型理解任務的?標,并?成合適的輸出,?圖12。思維鏈提?(Chain-of-ThoughtPrompting)在輸?輸出提?的基礎上,提供了多步推理的邏輯鏈,?以指導?模型按照提?的思路解決問題并展?每個步驟的過程性輸出,特別有助于解決依賴深層次邏輯思維的任務。?洽式思維鏈(Chain-of-ThoughtPromptingSelf-Consistency)是思維鏈的擴展,其基本思想是:?個復雜的問題可以有維鏈通過多次采樣?成不同的思維鏈,并選擇最?致的答案作為最終結果。這種?法可以降低?模型單次采樣時可能出現的隨機性和錯誤性,提?在復雜推理任務上的準確性和可解釋性。思維樹提?(Tree-of-ThoughtPrompting)通過提供思維的樹形邏輯結構來引導模型的解答?成過程。它以主題核?觀點為根節點,逐層展開?觀點和論證,形成前后遞進、多??拓展的樹形結構。在交互使?中,??可以按照思維樹的形式逐步給出提?語句,引導模型的?成更加全?、深?。相?線性的其?度和深度可以更充分地引導模型進?多?度、多層次的思考,尤其適合需要綜合考量各?因素的決策、規劃、論證等?成式任務。(2)?模型應?模式應用API用戶相對于傳統深度?絡模型需要通過微調訓練來適配任務,?模型通過提?詞?程可以在不改變模型本?的情況下完成?向場景的對?,極?地解放了應?層?創新和開發的活?,催?了??批基于?模型的App。應用API用戶大語言模型直接API調?是?前最普遍的?模型應?模式,?圖13。App接受??請求,經過?定的處理之后調??模型服務接?取得答案后反饋??。由下常?的聊天對話窗?式的App基本是這種模式。?向特定領域和任務的應?,還會通過提?詞?程預制好提?詞模板,對??的輸?根據模板加?為提?語后再調??模型服務,以取得最佳的?模式?成結果。在許多實際的任務場景中,尤其是?向銀?等?業、企業專屬領域的應?,往往需要結合私域的知識和數據?撐來尋求專業和保鮮的答案,或者需要和環境進?互動來構建綜合解決?案,從?推動了檢索增強?成(Retrieval-AugmentedGeneration)和AI智能體(Agent)兩種?模型應?檢索增強?成是?種知識密集型任務的應?模式,通過語義檢索機制賦予?模型動態獲取外部知識的能?。該模式下的系統通常由三個組成部分構成:?模型、知識源和語義檢索模塊(?圖14)。對于輸?的問題,系統?先調?檢索模塊,從知識源(如百科?站、企業知識圖譜、?檔庫等)中找到相關的?持性內容,然后將這些內容與原輸?聯合在?起提交給?模型?成答案,作為最終的系統輸出。檢索增強?成可以利?最新知識和信息進?內容?成,?需重新訓練?模型,在外接數據??具有極佳的可擴展?要求的企業場景。隨著知識源和語義檢索配套技術(如:向量數據庫、?本嵌?模型等)的跟進發展,這?應?模式具有?闊的前景。?前公有云上最具代表性的產品為微軟NewBing的聊天式問答。基于私域知識的檢索增強?成應?也已開始在商業銀?落地和推?。AI智能體是?類能夠?主完成任務的系統,可以由?成式?模型和?套可以調?的外部?具集構成。?具賦予智能體實施?動并取得反饋的能?。例如在軟件系統中,?具集可以是?系列服務API接?領域,?具可以是感知儀器和運動執?器。?模型依托前述的提??程技術,對輸?問題進?理解和任務規劃、確定使??具的順序和實施?案(例如:具執?完成全過程。智能體是?模型應?的?級演化?向,也是實現通???智能的重要?法之?,智能體為當前最被看好的?模型應??向,多家頭部企業產品均朝智能體?向演進,智能體依賴于多步拆解執?,需要?模型在智能體應?中的錯誤率降?個位數才能夠獨?完成?作,當前整體受限于當前模型能?,智能體仍未出現規模化應?。(3)應?開發?具在?成式?模型熱潮的推動下,應?開發?具?態成了功能全?的系統化開發框架,如LangChain、LamaIndex、Dust等。這些?具不僅?持?然語?處理能?,也逐漸開始?持多模態能?。在易?性和集成度??的進步也很明顯,普遍采?了模塊化和流?設計,?幅降低了?具的上?難度,提?了使?靈活性,配合?代碼?具使?技術?員也可以參以開源社區最為流?的LangChain為例,應?開發框架主要從以下?個?持接?多種流?的?模型產品,便于開發者開展模型選型和調?。?是在提??程??,提供了多種類型的提?模板(PromptTemplate)類庫,極?地簡化了提?語的構造和處理。三是集成了會話記憶模塊,?于回溯和管理之前的問答等任務記錄,?便開發者為?成式?模型提供?關重要的上下?背景信息。四是為智能體應?準備了全?的?具包,智能體應?可以根據??輸??主選擇使?哪些?具。五是提供了?本索引功能,極?提?語義檢索的運?性能。六是提供了提??作流和模塊組裝的標準接?,助?復雜應?的快速構建。3.全棧開發集?成者,綜合平臺化繁為簡?模型及其應?的開發涉及數據?程、模型選擇、提?詞?程、服務編排和應?部署等復雜的流程和技術棧,對開發者的知識和技能?平要求很?,同時也需要?量的時間和資源投?,良好的開發框架和綜合化平臺的?持已經成為必不可少的基礎設施。傳統??智能開發平臺,如AWSSageMaker,AzureML,ModelArt等基于MLOPS理念提供了數據管理、模型訓練、版本管理、超參數調優、可視化分析、應?部署等?系列的功能和服務,幫助開發者簡化和加速??智能開發過程。?模型應?快速發展的背景下,這些平臺也在積極推動技術升級,如SageMaker對前沿?模型的集成和AzureML的?模型優化?具包等。此外,?模型技術浪潮也催?了?批新型的綜合化平臺,?如HuggingFace,Fast.AI等。相對于傳統平臺,這些平臺更加迅速地集成和提供豐富的預訓練?模型和領先的?模型應?開發?具,也形成了更開放協作的社區?化。以下對代表性的新型?模型開發平臺逐?簡單介紹。(1)HuggingFaceHuggingFace是?個開源?規模機器學習平臺,提供了從數據準備、模社區活躍等特點,是?前最成熟的開源?模型開發平臺。平臺已收錄超過30持開發?員便捷地在模型庫中搜索和調?需要的?模型。平臺還提供?規模的標注數據集,?持?鍵加載使?。在此基礎上,Hug型訓練、評價、部署?具。平臺內置了Transformer模型的應?編程接?,?持主流深度學習框架,讓研究?員輕松地將模型應?到下游的NLP、CV等具體任務中。Evaluate庫可根據不同?標、數據集和模型?持不同類型的評估。算?資源??,開發者可以在平臺租?GPU的集群資源進??模型的訓練,并通過平臺發布模型應?或API服務。(2)百度千帆百度千帆是?向中?的開源?模型平臺。它為??提供豐富的中?NLP模型和數據集,以及全套的模型訓練、評估、部署?具。百度千帆擁有?規都經過了中?corpus的預訓練,可以直接應?于?本理解、對話、翻譯等通?任務。??也可以基于平臺提供的數據集,使?PaddlePaddle框架對模型進?進?步的微調優化。在?持模型訓練的同時,千帆平臺還提供在線的模型評測功能,??上傳訓練好的模型,選?合適的測試集即可?動?成評測報告。利?PaddleHub?具,??可以便捷地使?模型,實現模型部署,并提供預測服務。(3)ModelZoo華為推出的?模型開發平臺ModelZoo2,為?模型開發者提供了全?位的?持與服務。它?持多種深度學習框架,如PyTorch、TensorFlow、MindSpore等,以及多種硬件加速器,包括昇騰系列處理器、GPU等,使得模型的訓練和部署更加靈活和?效。平臺的模型庫?前已經接?了主流的?模型,如盤古系列、Baichuan、Llama、GLM等,覆蓋視覺、語?、多模態等?泛的任務類型。??可以在模型庫中搜索、下載和上傳各種?模型,查看模型的詳細信息和性能指標,通過統?的API便捷地調?華為云或者了豐富的提?語模板,以?便??快速構建??的?模型應?。4.模型適配?融領域,能?建設多管?下以?模型為代表的新?代??智能技術正在成為數字經濟發展的新動能。各?商業銀?紛紛布局??智能技術能?的迭代升級,積極探索和推動?模型在各業務領域和場景的應?。按照能?的專業度?平劃分,?模型在商業銀?的使?有基礎?模型、?業?模型、企業?模型、任務?模型四種形態,?圖15。基礎?模型是基于海量數據進?訓練的通?模型,具有很強的通識能?,可以直接?撐多種下游任務,但由于缺乏?融專業知識,在銀?業場景下發揮作?有限。?業?模型基于基礎?模型和銀?業領域數據進?再訓練,可以解決具備?業屬性的?般性問題。對于有較多定制化問題需求的銀企,可以在?業?模型的基礎上進?步結合企業私域數據訓練具備個性化特點的企業?模型,或者?向特定的專屬問題結合任務數據微調訓練任務?模型,定向攻克?價值重點業務場景。在落地策略上,?型商業銀?業務覆蓋??,應?場景豐富,定制化需?融?業和/或企業?模型。對于急缺的場景?持能?,也可采?模型微調滿?賦能訴求,或者基于產品配套的模型微調?具結合場景數據敏捷開發任務級模型。從?模型全技術棧能?建設的著眼點,相較于國際領先?平,各?商業銀?在算法、算?、訓練數據、開發運營??的?模型?撐能?尚有不?,應當在原有??智能技術棧的基礎上,結合企業針對以下四個??研判設?平向通???智能演化,促進??智能與?融業務深度融合。(1)加強算?基礎設施建設?模型參數量的增加導致訓練過程的計算需求呈現指數級增?。為了快速訓練和規模化應?模型,需要強?的計算能?來?持?效的分布式訓練和推理,算?成本投?巨?,必須對投?產出做綜合考量。?是短期的算?建設?標應當以業務需求為導向,明確應??模型邊際效?突出的業務場景,合理規劃算?規模,避免盲?求?。?是基于?模型技術發展趨勢研能耗、制冷、?絡架構等基礎設施??預留好擴展空間。三是針對?性能AI市場機制保障設備供給。四是完善和加強算?云化技術,實現算?的靈活彈性供給來?效滿??模型算?需求。五是以綠?低碳為責任,采?節能環保的技術和設備,優化能源使?效率,減少碳排放基礎設施的可持續發展。(2)構建?質量數據集數據是?模型的重要?產要素,數據的規模和質量對?模型性能提升?關重要,也將是企業數字化能?的關鍵??點。商業銀?應當在現有的數據治理體系的基礎上,進?步打通企業部?墻,在保障數據安全的前提下推動企業內部的數據融合,確保?模型數據集的規模和全?性,能夠覆蓋企業的各個關鍵領域,兼顧不同地區、客?群體的代表性。在數據處理??,?是設計合理的數據使?機制,如合理數據配?等,結合訓練框架設計從?減少模型訓練成本、提升知識應?效率。?是要強化數據保護技術,采取匿名化等技術?段在數據共享時去除敏感信息;三是構數據集構建和維護的效率;四是完善?向?模型開發的數據質量評估?法,建?例?化評估機制,定期進?數據質量檢測和監控。(3)引?領先模型技術?模型技術仍然在快速發展和演化過程中,商業銀?應當以動態發展的眼光持續關注國內外?模型的最新進展和趨勢,根據新技術特點和企業實和升級?模型技術能?。在技術管理層?,要建成完備的?模型評價體系造?素質的?模型研究和應?孵化團隊,以強化新技術研判能?和加快業務賦能進程。(4)打造研發運營流?線緊跟?模型研發運營?體化的發展趨勢,商業銀?應當引?和借鑒業集?業適配、微調優化、強化學習、提?詞構建、?模型運營于?體的研發運營流?線,實現不同?模型訓練應?的流程統?,?圖16。?向業務、業務應?研發?員,可以通過提?詞?程敏捷打造通?解決?案,通過?模型服務市場?持業務快速復?。?向AI科技研發?員,基于底層?模型基礎能?,融合其他技術能?,沉淀知識檢索、代碼?成、數據分析等標準化算法和基礎服務研發提供全鏈路?具?撐。界明晰(?如?分類問題的“是”和“不是”,軟件表?即為1和0兩個確定的數值已有較為明確的評價指標。?成式語??模型以?由對話的通?交互模式來?持?泛的任務類型,輸出結果為?度不定的?然語??本,往往不具備唯?的標準答案,對模型的評測帶來新的挑戰。?模型?成的內容可能會存在事實性錯誤、侮辱、反倫理道德乃?違反法律法規的情況導??或者造成輿情和法律責任。另外,?成內容還有潛在的泄露隱私的?險,使得數據安全也成為?模型應?的關注點。商業銀?在深?研究并探索?模型潛?的同時,需認真對待其潛在的模型應?安全合規健康地發展。(1)模型能?評估?規模語?模型(LargeLanguageModel,LLM)基于提??程(PromptEngineering)、上下?學習(In-contextLearning)、思維鏈推理(ChainofThoughts)等?系列新的?成范式,通過?然語?指令交互的形式實現了多領域多任務的統?,?幅提升了?然語?處理任務的能?,也使得LLM逐漸演化成為?向不同任務的基座模型。LLM在不斷刷新傳統評估任務榜單成績的同時,也引起了如何有效、體系化的衡量作為基座模型的LLM在多領域多任務能?的思考與實踐。對于?模型能?的測評,不僅需要考量模型的綜合能?,還需要設計細分任務,深度考察模型解決復雜任務的能?。通常?模型需要衡量的能?包括:理解能?、?成能?、推理能?、知識??度、情感分析和推斷、問題的考察范圍也在拓展。例如在問答任務上,不僅考察模型對選項或者數字結果是否回答準確,也考察其?成結構化解釋的能?;在翻譯任務上,同時考察?然語?翻譯和代碼語?轉化的能?;在聊天任務上,細分問題回答、創從正確、簡潔、流暢、有效、探索能?、共情能?、建議能?、信息量等維模型能?的體系化量化評估能夠直觀反映不同模型之間的差距,也能更準確地定位模型的弱點,例如普遍被討論的幻覺、未能探求更多信息、給出重復內容等,為模型的改進提供更精確的指導。現有的評估集正在探索如何全?評估模型的綜合能?,讓模型在測試評估中的得分能更真實的反映實際??體驗。(2)模型安全評估??智能模型因為其性能??泛應?,?因為其決策難以理解的?盒證其可信安全是?關重要的。近年來圍繞著魯棒性、可解釋性與可控性??的?模型可信安全評估持續升溫。在魯棒性??,評估類別有模型對于任務的魯棒性和對指令的魯棒性。研究通常針對模型?對噪聲輸?、攻擊性擾動或不確定環境時的表現進?評估,例如通過添加輕微錯誤或改變語義等?式來評估擾動對模型產?的影響。近期,針對普遍采?指令微調的?模型,??,?模型評估關注模型解釋的合理性、?致性。模型的可解釋性可以從兩個??體現,?是模型是否可以對輸出做出?我解釋,?是以對模型的輸出做出解釋,例如通過注意?解析或者模型輸出概率。可解釋性可以通過?個??進?衡量,分別是:模型的決策過程是否可以被理解,模型在處理某個任務時是否有合理的依據,以及模型對于輸出結果的不確可以根據特定需求調整模型的輸出。?如在內容?成的任務中,是否可以控制模型?成特定?格或者含有特定元素的內容。這個評測標準主要是為了確保模型在實際使?中的靈活性和適?性。(3)模型倫理評估?模型訓練的數據是從?絡、語料庫等來源收集的,在?定程度了真實世界的錯誤與?擾,?具備更多參數的?模型往往更善于模擬訓練數據的分布,記住更多細節,也更容易發?倫理?險。現在的量化評測系統已經開始考慮模型是否公平地處理各種群體(性別/種族/宗教)的輸?,以研究?多從性別、種族以及宗教三個維度評估模型是否存在偏?,檢查模型是否公平對待所有群體。通常評估?法是檢查模型是否更傾向于對某種群體進?負?或錯誤的標記,或者在處理涉及不同種群體的任務時是否存在明顯的傾向性或歧視。這類評估通常需要提前設計好詞庫,并對模型的結果創建含有有毒性內容的攻擊輸?,檢查模型的回應;以及檢查模型在接收正常輸?時,是否產?有毒的輸出,此種評估?法通常需要構建?個判別器模型?于?動檢查模型的輸出是否與?類倫理道德價值觀對?。2.評測體系:系統化指導評測(1)?模型評測?法在5-shot設置下的MMLU表現?乎是所有?類評分者平均值(34.5)的兩倍,?GPT-4(86.4)在5-shot設置下已經?分接近?類專家(89.8)的?平,需要提出更多更具挑戰性的任務以滿?模型評估的場景需要設計新的評估?法。例如,在代碼?成任務中,常?的評測指標pass@k需要多次采樣?成結果,然后使?編譯器或解釋器執?檢查。系統的??評估,以及使?GPT-4作為評測者的?動評估。基于數據集指標的?動評估主要依賴于標準化的度量和基準測試集,我們也看到了近期更多針對?模型的基準測試集出現。基于打分系統的??評估可以提?模型評價的豐富性和準確性,因為相較于針對特定NLP任務構建的學術基準測試集,?類主觀構建的話題以及對于模型回答的判斷可能更適?于評判通?聊天機器?的好壞。例如UC伯克利提出的聊天機器?競技場(ChatbotArena),利?Elo等級分制度引??類評價對?語?模型進?排名。使?GPT-4作為評測者的?動評估近?由Vicuna團隊提出,GPT-4可以根據有?性、相關性、準確性和細節等對這些模型的致的分數和評分依據。但這項?法仍有其局限性,GPT-4在編程或數學問題上還不能給出良好的評估。(2)?模型評測指標?模型評測最通?的指標是精度,在不同場景下有不同的定義,體現了模型在該任務上的平均正確率。對于可以直接?較模型回復和標準答案的精確度(Precision)和F1等指標;對于有參考答案的其他條件?本?成任務,會采取基于詞重疊度的指標作為精度標準,如機器翻譯??的BLEU和TER,?本摘要中的ROUGE和METEOR等;在信息檢索等專注于結果排序的領域,有RR、NDCG等指標;此外,對于語?建模和代碼?成等任務,還有困惑度(PPL)、Pass、BPB等指標,從語句的流暢程度、代碼通過率等??衡量?成結果的精度。除了模型精度,還需要知道模型對于預測結對于系統在??險環境下的部署尤為關鍵。例如在使?模型輔助決策時,如果模型的預測不夠確定,可以及時進????預?不是放任潛在的錯誤。不確定性通常使?預期校準誤差(ECE)來衡量,較低的預期校準誤差表?模型的預測結果能較好地反映真實概率,例如,如果?個ECE低的模型預測1000個句?有毒,每個句?的概率為0.7,那么可以認為其中?約有700個模型的穩健性和公平性評估?式較為類似,通常通過?較模型在不同輸?下的精度差別來衡量:對模型輸?施加錯別字或語義等擾動模擬真實噪?以評估模型的穩健性,改變輸??本中某些?或社會群體的性別、種族等屬性,?較模型預測結果是否有性能上或事實上的差距。(3)?模型評測數據集?模型評估??已經出現了?些有代表性且?泛使?的綜合基準數據集,例如:MMLU是多任務知識理解領域的通?測試集,涵蓋從數學和計算機科學到??和社會科學的?泛知識領域。BIG-Bench是?個各領域專家合作構建的?型數據集,?的是從各??探索?語?模型的性能,并提出了?系列對當下模型有挑戰性的任務。HELM是?個綜合測試集,測試數據建?在許多先前研究的基礎上,擁有包括問答、摘要、信息檢索等16組核?場景和準確性、校準、魯棒性、公平性、偏?、毒性和效率7類評估指標。近期發布的中?數據集有MMCU數據集,覆蓋教育、醫學、?理學、法律4個領域的專業知識;C-Eval數據集,專注世界知識和推理等領域;SuperCLUE數據集考察語?理解能?,并提出了許多有中?特點的任務,包括中?成語、詩歌、?學、字形等。除了以上綜合測試集外,還有專注于評估?語?模型特定能?的測試基準,如?于多語?知識利?的TyDiQA、?于多語?數學推理的MGSM、?于復雜推理的HellaSwag、?于閱讀理解的SQUAD、?于代碼?成的集不夠充分,能?評估仍有不?,在多模態和模型與外界交互等新興任務領域缺乏測試數據和標準,?度依賴??評估,在模型安全評估和倫理評估??雖然有CivilComments負?評論數據集和SAE公平性數據集等,但總體上測試數據較少;?是測試集迭代速度快,如SuperGLUE數據集僅發布18個?,模型表現就已超過?類結果,測試集對模型的挑時間和成本,許多測試集在噪?、正確性和難度分布上試結果的可解釋性。對于?模型在安全可信??的問題,我國?度重視?模型技術?險的管理。2023年7?,?信辦會同六部委共同發布《?成式??智能服務管理暫?辦法》(以下簡稱“辦法”為?成式??智能的發展和應?推?成式??智能技術創新和?險防范等??積極展開合作和研究。以下從性能缺陷、脆弱性、倫理三??對?模型技術?險管理展開討論。(1)性能缺陷?險管理?前?模型對于其?成內容的可信性缺乏保障,容易?成?然流暢但包含誤導性、虛假內容以及事實錯誤的?本,可能誤導投資者做出錯誤的決策,導致財務損失;同時?模型技術可能被?來?成?度逼真的偽造內容,如合成的圖?、視頻和?頻資料,也為不法分?操縱?融市場、者其他?融?具的價格等提供了新?具,給?融安全造成威脅,同時也將嚴重破壞市場參與者之間的信任。因此,我們亟需針對?模型性能缺陷給?融?業帶來的?險采取針對性回應舉措:l?業層?,建??向?融?業的?模型標準技術體系,在?融?業法律法規??建?系列規章制度,對主管部?的?融政策指導實施監管和規范,同時加強?融?模型的技術創新和防御研究;l企業層?,建議?融企業設?相關部?負責?模型技術?險管理,整體考慮和設計符合?融業務場景的?模型安全制度體系,擴??模型安全專業?才隊伍,提升相關?融技術?員的專業技能。(2)脆弱性?險管理?前?模型在?對攻擊?為時具有脆弱性,例如在?臨特定形式的輸?內容時,模型可能被誘導違反??的編程限制,?成超出?內容或者泄露??的隱私信息;或者在訓練數據遭受投毒攻擊后,模型可能攻擊者不當獲利,進?導致消費者對?融服務的信任度下降。這種脆弱性為?模型技術在?融服務中的使?帶來了極?的安全?險,需要采取措施防范潛在的惡意攻擊:l?業層?,建??向?融?業的?模型脆弱性?險管理標準規范,健全技術體系以?持落實國家監管政策,針對?模型的對抗和投毒攻擊?險設置體系化評價標準和測評機制,為模型加固增強提供技術?持,指導企業防范攻擊?險;l企業層?,針對?融?模型脆弱性采取相應的技術?段進?防范,同時制定相應的審查機制,嚴格控制訓練數據質量,確保數據中不包含隱私或有害內容;強化模型抗攻擊能?,同時對攻擊?為實施監測,對于異常使??為應當及時停?服務并視情況采取懲罰。(3)倫理?險管理?模型由于其?質量內容?成的能?,導致其在使?的同時可能引發倫理問題,包括:?成內容的版權歸屬存在爭議,例如?融研究報告的版權等;?成的內容可能被?于惡意?途,例如刻意?成誤導投資者的投資建議;容可能誘導使?者進?不合理甚??法的?融?為;?成內容中可能存在偏?與歧視信息,誤導??形成錯誤認知。這些倫理問題可能導致?模型的使?帶來?定的社會危害性,造成社會秩序混亂甚?威脅??和財產安全,需要采取針對性的防范措施:l?業層?,建?健全?融?模型倫理審查相關標準和技術體系,對于模型?成內容的有害程度和偏?與歧視問題形成度量標準,同時構建相關問題的測評技術體系,指導企業對?模型?成內容進??動化檢驗;l企業層?,針對采??模型技術的?融服務制定管理措施并嚴格遵循,明確?成內容的版權歸屬以避免爭議,檢測并規避有害?成內容,提供防依賴、防沉迷措施并引導??恰當使?;優化和提升內容?成技術以避免?成誘導性或偏?與歧視性內容。4.技術探索:提供安全可信技術?撐(1)信息追溯技術盡管當前以ChatGPT為代表的?成式AI技術已經表現出了?常驚艷的語?理解以及知識推理能?。然?,這類技術依賴的基礎模型本質是?個神經?絡?模型,存在性能缺陷?險,即?成的內容雖然語句通順貌似合理,但可能與事實?相徑庭。但是模型的訓練和推斷都是?盒的,導致不能提供合理的證據進?可信性的溯源與驗證。因此,?融業務場景中,如何式AI技術實際部署出現問題時,對特定結果的產?原因、關鍵環節等要素進?因果溯源分析,保障?成結果與事實的?致性是實現?融?模型可信?成的基礎之?。為了降低?模型的性能缺陷?險,實現?成式AI技術在?融業務場景的信息可追溯,主要研究檢索增強的可溯源信息整編?法,在?模型中加?訪問外部存儲庫,解耦?模型的記憶模塊和推斷模塊,以更加模塊化和可溯源的?式特定?融結果的產?原因、關鍵環節等要素進?快速的因果溯源分析。該?法主要由檢索器和?模型兩個模塊實現結果的整編和溯源:l?向?融數據的檢索器:檢索器?來輔助模型從外部?融數據存儲庫中,搜索有關于當前查詢中的精確?融相關信息條規、實時動態新聞報道、?融知識圖譜等特定?融數據;l融合檢索技術的?成式?模型:在?規模語?模型的預訓練、微調和推理,通過結合查詢與檢索到的相關信息進?模型推斷,其回的信息可以作為?成答案的依據,從?提升?模型的準確性、實效性和可l檢索器和?模型的聯合優化:由于?成器和檢索器是兩個獨?的模塊,優化往往是相對獨?的。為了進?步提?溯源分析效學習的聯合優化技術,將?成器和檢索器進?聯合優化,以達到相互增強的(2)攻擊防御技術現有的基于?模型的內容?成技術屬于深度學習技術范疇,其運作?乎完全由數據驅動??由?為規則確定,因?容易存在難以察覺到的脆弱性問題;再加上訓練及應?環境直接?向數據提供商及??產?的?然語??本及圖像等復雜?結構化數據,模型?臨極?的不確定性和被攻擊可?融?模型的缺陷、探測和防御攻擊性?為,是降低模型脆弱模型安全使?的核?挑戰。為降低?模型脆弱性?險,防范可能存在的惡意攻擊?為,主要需要研究基于內容安全檢測的攻擊防御技術,針對?融?模型開發和應?階段涉及的各類內容數據進?安全?險監測,使攻擊?為?所遁形,進?通過預先處理和拒絕服務等?式回避惡意攻擊。其中涉及的關鍵技術點包括:其中有毒有害、質量低下的內容,防?數數據,進?脫敏預處理,防?泄露隱私;l??查詢安全檢測技術:針對??查詢輸?的內容,分析識別其意注?等對模型的對抗攻擊;l?成內容安全檢測技術:針對模型最終?成的內容,對潛在的泄露隱私、功能?法、偏?歧視等問題進?檢測,過濾不符容,避免將有害內容呈現給??。(3)可解釋技術們只能看到數據的輸?和輸出,其內部判斷的運?規律和因果邏輯尚不清晰,這?特性使得?模型的?成機理不易被?類理解和解釋。?旦模型出現錯誤,透明度不?將阻礙外部應?者的糾偏和除誤,尤其對于?模型應?于?融這類?險厭惡以及對可解釋性要求?的領域等。因此,如何增強?模型機理和輸出的可解釋性、建?合適的可視化機制來評估和解釋模型的中間狀態,在模型部署出現問題時進?準確調控,是保障?模型在?融場景中安全、可信運?的關鍵。為了降低?融業務場景的?模型倫理?險監管難度,幫助?融機構識別潛在的模型?險并可以及時調整和改進推理結果,主要研究融?因果理論的?成式?融?模型:模?融數據的?成過程,對因果機制和?盒模型進?協同優化來消除模型訓練過程中的不確定性,以增強對推理結果的透明度和可解釋性,使?融決策者能夠更好地評估和驗證推理結果的可靠性;l基于先驗因果圖的可解釋性技術:通過構建?融特定領域的先驗因果圖,研究?融領域?模型可解釋所需滿?的基本性質,這些性質可以設計并利?可視化等技術?段實現?成過程的可解釋分析,幫助??更好地理解?融概念和決策;l基于因果?預的可控?成技術:借助因果?預和反事實推測?段,研究?向?融領域的?模型可控?成?法,結合梯度的低秩分解對模型的特定模塊注?更新的知識或糾正不良?為,實現對?模型學習、推斷等過程的?效編輯與控制,從?確保推理結果在可控范圍之內,同時可以提供個性化的?融分析和投資建議。以?成式?模型為代表的新?代??智能技術將極?地加速?融業數化的溝通,基于上下?不斷深?理解??的任務訴求,為??提供個?助理式的信息和任務處理范式,將極?地提升??體驗和服務效率。?是?模型?專多能的通?能?,助?低成本地適配具體場景的任務,極?地提???智能技術的規模化應?能?,釋放數據要素的乘數效應和倍增效應。三是?模型(對商業銀???尤其是?語?模型)的?成式能?已成為數據處理的發展注?全新動能。部商業銀?積極開展技術驗證和試點,已經積累相當的經驗點應??圖17。以下結合中國?商銀?的典型實踐案例來介紹?模型的銀?業應?場景和業務價值。合語境智能判斷?成?質量易于客?理解的話術,給出準確的專業解答,提?解決率與客?滿意度。不過鑒于?前?模型在?成內容可控性??的問題,存在科技倫理等?險,因此短期內不建議直接對客使?,?是以服?員助?的形式,?機協同提升服務質量和效率。案例?:坐席助?提升客?服務體驗?前,商業銀?主要通過??客服和智能客服兩種?式為客?提供咨服尚不能直接解答客?所有問題。為全?提升對客服務能?,?商銀?在遠程銀?業務中將知識搜索與?模型技術結合,實現基于實時通話向坐席?員主動推送答復話術或知識的能?。同時,利??模型也可快速分析客?致電咨詢?的,以及時掌握業務咨詢熱點,提升服務質效。?模型技術的崛起,為辦公空間帶來了變?的契機。“智慧辦公”也將逐步改變傳統的辦公習慣。利?NLP?模型的?本?成、問答能?,全?加強安全保障精細化管理,?效提升內部管理效率。案例?:智能辦公助?辦公模式?效化??模型?本?成能?,提升材料編寫效率,實現提綱?成、?檔?成、中?句話即可辦理建會議、定會議室、記錄?程等事務,對接?內不域知識,查知識、查訊息、查指標,隨時為??答疑解惑等。案例?:智能助?賦能?試流程智能化?商銀?每年會對收到的數?萬封?員簡歷,通過HR??篩選招聘員型來?成更專業、更深?的?試題。同時,模型還能根據形成綜合評價報告,為HR??分析應聘者的情況及能?提供了便利。案例三:?融市場咨詢分析、?成?動化針對?融市場業務,?商銀?全?應??模型的核?信息提取、智能?本?成、上下?聯想等能?,塑造?融市場投資商銀?利??模型的?本?成能?,實現投研晨報等?融市場各類報告的成時效從?時級縮短?分鐘級,資訊覆蓋?從?余篇擴展?全市場數百篇,報告?成采納率達88.68%。在運營管理??,商業銀?可基于?模型對知識答、智能查詢等能?。通過前沿技術將有限的??資源從重復性?作流程中解放出來,推動智慧??、信息管理、科技管理等內部業務處理管理條線的智能化提升,持續優化?融業務?持效率。例如,?等存在效率低、??成本?等問題。運??模型的語義理解、語義分析等技術可實現?單分析、信貸?本分類、客?信息?站式錄?、關鍵信息抽取等多個業務場景運作的?動化,?幅度降低?員?作量和運營成本。案例?:?點助?賦能業務流程?動化在客?辦理跨境匯款業務時,傳統??對業務信息采集、錄?等存在效率低、??成本?等問題。為解決復雜業務?點員?辦理難、專業術語難以向客?解釋、新業務流程?點員?不熟悉等痛點問題,?商銀?建設?點員全?數?萬?點員?輔助業務辦理,提升?線?員?作效率和?作合規性。中英翻譯服務可對憑證中的英?內容翻譯,翻譯準確率達85%以上,服務客服經理萬余?。制度查詢服務可智能化?成便于員?理解的操作流程和術成體驗評測,問答準確率超83%。案例?:?單分析、?成?動化?商銀?每?需處理數?萬件客?意??單,傳統??智能技術已可滿?簡單、流轉和辦結等環節的需求。對于答復環答復環節對原有模式進?創新,利??模型可根據員?與客?電話核實情條理清晰,整體?字采納率約80%,據初步測算,每年可節省數百?年?作相較于傳統純??開發的?技術?檻和???需求,基于?模型技術可以輔助??在智能代碼?成、代碼識別與檢測、代碼轉?然語?和交互式研發等領域實現全?位能?突破,構建基于?模型的智能研發體系,覆蓋從需求、設計、編碼、測試、發布的研發全?命周期發?平,???融領域助?國內智能研發技術逐步?向成熟。案例?:智能研發助?研發數智化智能研發屬于特定細分領域的專業化應?,存在?融屬性弱且?研難度?等特性。為全?提升數智化研發?平,?商銀?通過引?垂直領域的商??模型產品,構建基于?模型的智能研發體系,實現代碼?成、代碼識別與檢測、代碼轉?然語?和交互式研發等全?位能?助編碼近百萬?,協助開發?員?動糾正輸?性錯誤數萬次。在?險防控??,商業銀?可基于?模型實現?業研究、盡調、授信審批、內審等流程的?險識別、制度查詢及輔助審核等功能的信??險、操作?險、合規?險、內部審計的全??管控的更?需求,顯著提升智能?融?險管理能?,有效滿??險防控創新案例?:信貸全流程審批智能化傳統信貸業務模式主要依靠業務?員累積的經驗,??審核和評估信貸材料,此類?式效率低下且極易存在?為誤差。為提升現有信貸系統智能化服務?平,?商銀?利??模型,建?貸前、中、后全知識答疑功能利??模型,通過知識問答形式,為信貸系統??提供信貸制度咨詢服務,將信貸制度咨詢從分鐘級提升?秒級,每年?少可降本數百?將基于客?資料、調查審查報告、征信報告、互聯別潛在?險信息,提?信貸?員對業務資料的分析效率。案例?:可疑報告?成?動化?商銀?依托?數據及傳統??智能技術建成客?盡職調查、?額報送等七?功能模塊的反洗錢系統,從機構、產品和客?等不同維度統計分析的案件信息,將案件關聯?員關鍵要素信息與客?信息進??對,提供相關涉案信息供甄別?員參考。在可疑報告撰寫環節,?商銀?通過?模型總結?成能?,輔助?成可疑報告中的客?信息等相關章節初稿,供甄別?員參考,提升全??線反洗錢甄別?員的案頭?作效率。案例三:智能員?助?內控合規智能化商銀?基于?模型上線內控數字員?“?毅控”,為全?員?提供內控合規各項?作的問答指南,包括規章制度、合規信息、員?違規處理規定等內容的在線問答,以及合規?化傳導等常?功能服務,為內控合規相關知識答疑解惑和?作開展提供?撐,為基層減負賦能。此外,為貫徹落實“數字??”建設的總體部署,?商銀?打造了?銀融安e控溝通交流平臺,為基層員?提供內控合規?作智能問答和服務?持。平臺?上線以來,賦能全?境內數?家分?機構??,?動解答率達92.8%。中國?商銀?圍繞?模型核?能?,借鑒業界先進經驗,基于?融業務實際需求和應?實踐,創新打造適配?融?業的“1+X”?模型應?范式,建成集感知、記憶、決策、執?、反饋五項功能于?體的低?檻智能體運?框架,沉淀“X”可共享復?的范式能?,包含多模態知識檢索、對話式數據分析、智能化?檔編寫、交互式智能搜索、陪伴式智能研發等多項?融即插即?的零代碼?程化解決?案,?幅提升?模型在全?規模化應?的效分析研判。摘要提煉旨在利?模型對冗?的通話錄?、會議錄?、?篇?章等去除各類?擾信息提煉形成信息摘要,加速信息流轉和處理。內容擴寫旨在通過?模型將簡單的事實陳述擴寫成?篇資料。分析研判旨在對照專家編寫研判報告過程,基于?模型的閱讀理解能?對多種參考資料等進?閱讀、素材抽取,并形成研判分析報告。搜集實時信息,并進?有效的組織和提煉答案,以答案和引?的形式為??提供快速、可靠、全?的信息,解決?內信息搜索時等問題,重塑搜索模式,提升搜索效率。該范式主要包括??信息采集、問題解析規劃及信息搜索、答案匯總?成三個環節。科技?員將獲取的數據?成問題答案及來源,最終業務?員反饋問題答案。量?檔的專業知識搜索和問答能?,實現?檔內容檢索問答,提升專業知識獲取效率。知識檢索主要包括知識準備、知識搜索、答案?成三個環節。業務?員將原始?檔、FAQ問答對等知識向量化后存儲?庫,科技?員利?搜索?模型和?成式?模型分別完成知識搜索和答案?成,最終業務?員反識問答、遠程銀?知識推薦等。持??通過?然語??式實現跨系統、系統內部各功能的調度控制能?,改變?機交互模式,解決各功能、數據服務分散在不同的系統發現難、調?難該范式體現的是?模型在邏輯推理、聯想創作、分析規劃等??使?場景?泛,涵蓋從客?輔助到員?助?等多個領域,典型場景如數字員?、調度場景等。為降低?數賦智?檻,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 征信分析考試試題及答案
- 機械設備可行性研究報告
- 申論聯考考試試題及答案
- 沖床操作測試題及答案
- 病毒檢驗考試題及答案
- 場地測量考試題及答案
- 車間安全試題及答案
- 包包雙十一活動策劃方案
- 促銷技巧試題及答案
- 2025年建筑法規必考內容及試題
- 2024年小區地下車位租賃合同
- 2022-2023學年上海市閔行區八年級(下)期末數學試卷
- 諾如病毒校園防控知識
- 常見神經系統疾病康復15節
- MOOC 營銷管理-電子科技大學 中國大學慕課答案
- 關于梳理、修訂、完善公司規章制度的通知
- 會計信息考試系統復習題(試題及答案)
- 高中物理學習中的數字化教學資源
- (高清版)TDT 1067-2021 不動產登記數據整合建庫技術規范
- 安措費清單完整版本
- 人教版五年級數學下冊全冊分層作業設計含答案
評論
0/150
提交評論