




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
DeepSeek與AI幻覺清華大學新聞與傳播學院新媒體研究中心人工智能學院雙聘教授@新媒沈陽團隊博士后張家鋮2025年2月一
、什么是AI幻覺二
、DeepSeek為什么會產(chǎn)生幻覺
三
、AI幻覺評測四
、如何減緩AI幻覺五
、AI幻覺的創(chuàng)造力價值DeepSeek:?某頭部銀行利用DeepSeek構(gòu)建因果歸因網(wǎng)絡,識別小微企業(yè)違約的隱性因素(如上下游賬期錯配),針對性設計“供應鏈票據(jù)貼現(xiàn)+賬期保險”組合產(chǎn)品,不良率下降4.2個百分點。?國信證券在“金太陽APP”中部署DeepSeek-R1-Distill-32B端側(cè)模型,客戶本地輸入風險測評數(shù)據(jù)后,模型生成個性化投資組合建議,僅將匿名化策略權(quán)重同步至云端風控系統(tǒng),數(shù)據(jù)泄露風險降低90%。Prompt:給我一些DeepSeek在金融行業(yè)的應用案例案例1案例2案例3Whisper:OpenAI的自動語音識別
(
ASR)
系統(tǒng)行業(yè)應用:
醫(yī)療系統(tǒng)中,將患者與醫(yī)生的對話問診過程音頻,轉(zhuǎn)寫為文字病例,有超過
30000名臨床醫(yī)生和40個醫(yī)療系統(tǒng)使用發(fā)現(xiàn):
100多個小時的Whisper轉(zhuǎn)錄樣本,其中約有一半內(nèi)容存在幻覺原音頻:“嗯,她的父親再婚后不久就去世了”轉(zhuǎn)錄文本:“沒關(guān)系。只是太敏感了,不方便透露。她確實在65歲時去世了”結(jié)果:2.6W多份自動轉(zhuǎn)錄病例中,幾乎每本都存在瞎編和幻覺問題,對患者健康和醫(yī)療系
統(tǒng)產(chǎn)生嚴重負面影響案例4案例5什么是AI幻覺?學術(shù):指模型生成與事實不符、邏輯斷裂或脫離上下文的內(nèi)容,本質(zhì)是統(tǒng)計概率驅(qū)動的“合理猜測”說人話:一本正經(jīng)地胡說八道事實性幻覺:指模型生成的內(nèi)容與可驗證的現(xiàn)實世界事實不一致忠實性幻覺:指模型生成的內(nèi)容與用戶的指令或上下文不一致提問:
糖尿病患者可以通過吃蜂蜜代替糖嗎?分析錯誤:蜂蜜雖然是天然食品,但仍然含有大量果糖和葡萄糖,會升高血糖水平,不適合糖尿病患者代替糖使用。偏題:回答內(nèi)容雖無事實錯誤,但與提問“糖尿病患者是否可以用蜂蜜代替糖”無關(guān),未忠實于用戶意圖。回答是的,蜂蜜是天然的,可以幫助糖
尿病患者穩(wěn)定血糖水平
。蜂蜜富含維生素和礦物質(zhì),對提高免疫力很有幫助,因此是一種健康的食品。忠實性幻覺事實性幻覺
數(shù)據(jù)偏差:訓練數(shù)據(jù)中的錯誤或片面性被模型放大(如醫(yī)學領(lǐng)域過時論文導致錯誤結(jié)論)
泛化困境:模型難以處理訓練集外的復雜場景(如南極冰層融化對非洲農(nóng)業(yè)的影響預測)
知識固化:模型過度依賴參數(shù)化記憶,缺乏動態(tài)更新能力(如2023年后的事件完全虛構(gòu))
意圖誤解:用戶提問模糊時,模型易“自由發(fā)揮”(如“介紹深度學習”可能偏離實際需求)AI為什么會產(chǎn)生幻覺?
音樂的主觀性和多樣性:音樂是一種高度主觀的藝術(shù)形式,人們對音樂的審美和理解有很大的差異。一段音樂是否“合理”或“正確”,往往取決于文化背景、個人偏好和上下文
音樂的抽象性:音樂本質(zhì)上是抽象的,不像文本或圖像那樣直接對應現(xiàn)實世界的具體事物。文本中的“幻覺”通常是因為模型生成的內(nèi)容與事實不符,而音樂本身往往缺少明確的事實基礎
音樂的可感知性差異:音樂是時間性的藝術(shù)形式,即使某些部分聽起來不協(xié)調(diào)或不符合預期,它們也可能在整個作品的上下文中變得合理。相比之下,文本或圖像中的問題往往是瞬間可見的,容易引起注意
音樂“幻覺”的潛在表現(xiàn):邏輯斷裂的歌詞、結(jié)構(gòu)混亂的旋律、風格混雜的編曲音樂為什么沒有幻覺?AI幻覺的潛在風險
信息污染風險:由于DeepSeek的低門檻和普及度高,大量AI生成內(nèi)容涌入中文互聯(lián)網(wǎng),加劇了虛假信息傳播的“雪球效應”,甚至污染下一代模型訓練數(shù)據(jù)
信任危機:普通用戶難以辨別AI內(nèi)容的真實性,可能對醫(yī)療建議、法律咨詢等專業(yè)場景的可靠性產(chǎn)生長期懷疑
控制欠缺:DeepSeek的對齊工作較其他閉源大模型有所欠缺,其開源特性也允許使用者隨意使用,可能會成為惡意行為的工具
安全漏洞:若錯誤信息被用于自動化系統(tǒng)(如金融分析、工業(yè)控制),可能引發(fā)連鎖反應
……大模型幻覺率DeepSeekV32%DeepSeekR13%Qianwen2.5-Max2%豆包0
測試1:隨機生成100條通用提示語,模仿普通用戶的真實使用場景,獲取大模型回答后進行人工判斷與標注,并進行交叉驗證AI幻覺評測大模型幻覺率DeepSeekV329.67%DeepSeekR122.33%Qianwen2.5-Max27.67%豆包19%
測試2:隨機抽取300道事實性幻覺測試題,涵蓋健康、科學、歷史、文化、音樂等等多個領(lǐng)域,獲取大模型回答后與正確答案比對,人工標注幻覺類型,并進行交叉驗證
幻覺率初步測試結(jié)果:DeepSeekV3>Qianwen2.5-Max>DeepSeekR1>豆包事實性幻覺評測提問正確回答DeepSeekV3DeepSeekR1Qianwen2.5-
Max豆包“天上百鳥朝鳳凰,朝鳳凰,地
上葵花向太陽
,
向太陽,哎,北
京城里的毛主席
,我們永遠跟您走
,幸福萬年長羅!”這段歌詞出自哪
首歌曲這段歌詞出
自藏族民歌
《北京有個
金太陽》。這段歌詞出自
歌曲《北京的
金山上》
。歌曲**《阿佤
人民唱新歌》**(1972年)
,表達少數(shù)民族對領(lǐng)袖的擁護。這段歌詞出自
歌曲《東方
紅》。“天上百鳥朝
鳳凰,朝鳳凰,
地上葵花向太
陽,向太陽,
哎,北京城里
的毛主席,我
們永遠跟您走,
幸福萬年長羅”
出自《北京的
金山上》
。事實性幻覺評測
常識錯誤事實性幻覺評測
邏輯陷阱?提問:為什么一向見錢眼開的小明仍然會被金錢蒙住雙眼提問正確回答DeepSeekV3DeepSeekR1Qianwen2.5-
Max豆包水滸傳中李逵為
什么要大鬧五臺
山?李逵并沒有
大鬧五臺山,
事實上
,《水滸傳》
中大鬧五臺
山的是花和
尚魯智深。水滸傳中李逵
大鬧五臺山是
因為他喝醉了
酒,誤闖了寺
廟。誤以為宋江強
搶民女(實為
他人冒充),
怒闖五臺山討
說法。李逵大鬧五臺
山是因為他誤
以為魯智深在
寺廟中受欺負,
于是出手相助,
引發(fā)混亂。水滸傳中大鬧
五臺山的是魯
智深,不是李
逵。魯智深大鬧五臺山是因
為他出家后難
以忍受寺里的
清規(guī)戒律,又
喝酒吃肉,還
打傷了寺里的
僧人等。事實性幻覺評測
虛構(gòu)事件推理與幻覺的關(guān)系ADeepSeek
V3:提問個
個
回答;
DeepSeek
R1:提問個思維鏈個回答A
推理增強個
個
個幻覺率降低?邏輯準確性與錯誤減少:推理能力強的模型能減少因邏輯錯誤導致的幻覺。例如,在數(shù)學問題中,模型若具備多步推理能力,更可能得出正確結(jié)論而非臆測答案?上下文理解與信息關(guān)聯(lián):強大的推理能力使模型更精準地捕捉上下文關(guān)聯(lián),避免因斷章取義而生成虛構(gòu)內(nèi)容。例如,在問答任務中,模型能通過推理排除干擾選項,
降低錯誤率
Vectara:
摘要任務,DeepSeek
V3幻覺率3.9%
,DeepSeek
R1幻覺率14.3%推理與幻覺的關(guān)系A
推理增強個
個
個幻覺率增加?邏輯過度外推:當模型具備強大的邏輯關(guān)聯(lián)能力時,會傾向于在已知事實間建立「超合理」的虛構(gòu)連接。例如,時間線延展:已知某科學家發(fā)明A技術(shù)(1990年),自動補全其在1995年獲得諾貝爾獎(實際未發(fā)生)
。?認知置信度錯位:低推理能力模型更易回答“不知道”,高推理模型會生成符合概率分布的“自信錯誤”答案。?錯誤前提下的正確推理:初始假設錯誤,但模型基于此展開正確推理。推理能力與幻覺率存在雙向作用機制大模型通用性測試幻覺率事實性測試幻覺率DeepSeekV32%個0%(下降2%)29.67%個24.67%(下降5%)DeepSeekR13%個0%(下降3%)22.33%個19%(下降3%)普通用戶應對AI幻覺的三種方式A
聯(lián)網(wǎng)搜索”請使用聯(lián)網(wǎng)功能“、聯(lián)網(wǎng)功能選項注:黑色為未開啟聯(lián)網(wǎng)搜索,紅色為開啟聯(lián)網(wǎng)樓普通用戶應對AI幻覺的三種方式
雙AI驗證/大模型協(xié)作例如,利用DeepSeek生成答案后,再應用其他大模型進行審查,相互監(jiān)督,交叉驗證普通用戶應對AI幻覺的三種方式
提示詞工程?知識邊界限定:通過時空維度約束降低虛構(gòu)可能性
(本質(zhì):
約束大模型)1.
時間錨定法:
“基于2023年之前的公開學術(shù)文獻,分步驟解釋量子糾纏現(xiàn)象"→規(guī)避未來時態(tài)虛構(gòu)2.
知識錨定法:
”基于《中國藥典》回答,若信息不明確請注明“暫無可靠數(shù)據(jù)支持”→限定權(quán)威來源3.
領(lǐng)域限定符:
“作為臨床醫(yī)學專家,請列舉FDA批準的5種糖尿病藥物”→添加專業(yè)身份限定4.
置信度聲明:
“如果存在不確定性,請用[推測]標簽標注相關(guān)陳述“→減少絕對化錯誤斷言5.
上下文提示:
“根據(jù)《2024全球能源轉(zhuǎn)型報告》(國際能源署,2024年1月發(fā)布)顯示:”2030年光伏發(fā)電成本預計降至0.02美元/千瓦時,但儲能技術(shù)突破仍是普及瓶頸。“請基于此數(shù)據(jù),分析中國西部光伏基地發(fā)展的三個關(guān)鍵挑戰(zhàn),并標注每個挑戰(zhàn)與原文結(jié)論的邏輯關(guān)聯(lián)。→嵌入權(quán)威數(shù)據(jù)片段6.
生成參數(shù)協(xié)同控制:
“請以temperature=0.3的嚴謹模式,列舉2024年《柳葉刀》發(fā)表的傳染病研究”普通用戶應對AI幻覺的三種方式
提示詞工程?對抗性提示:
強制暴露推理脆弱點,用戶可見潛在錯誤路徑
(本質(zhì):
大模型自我審查)1.
植入反幻覺檢測機制:
"請用以下格式回答:-主要答案(嚴格基于公開可驗證信息)-[反事實檢查]部分(列出可能導致此答案錯誤的3種假設)“2.
預設驗證條件,迫使模型交叉檢查信息:“請先回答“量子糾纏能否證明靈魂存在?”,然后從以下角度驗證答案的可靠性:1.物理學界主流觀點;2.近五年相關(guān)論文數(shù)量;3.是否存在可重復實驗證據(jù)。
”3.
鏈式驗證:
請完成以下驗證鏈:1.陳述觀點:______2.列出支撐該觀點的三個權(quán)威數(shù)據(jù)源3.檢查每個數(shù)據(jù)源是否存在矛盾信息4.最終結(jié)論(標注可信度等級)場景類別具體場景示例風險等級防護建議知識邊界模糊開放域生成續(xù)寫未完結(jié)的經(jīng)典文學作品高添加創(chuàng)作范圍限制+事實性標注未來事件預測預測2030年科技突破細節(jié)極高聲明預測性質(zhì)+概率分布呈現(xiàn)復雜推理多跳推理任務追溯企業(yè)高管早期職業(yè)軌跡高分步驗證+外部知識庫檢索數(shù)學證明延伸要求證明未解決的數(shù)學猜想極高中斷機制+當前研究進展說明技術(shù)性誘發(fā)長文本生成小說連續(xù)章節(jié)生成中階段一致性檢查+人物屬性維護多輪對話復雜業(yè)務流程咨詢高對話歷史摘要+關(guān)鍵事實復核數(shù)據(jù)引用矛盾數(shù)據(jù)源不同版本的實驗數(shù)據(jù)引用中矛盾點對比+最新研究成果優(yōu)先情感驅(qū)動安慰性回應重癥患者尋求治療方案建議極高情感剝離響應+理論應用提示特殊領(lǐng)域醫(yī)療診斷根據(jù)癥狀描述提供診斷建議極高明確非專業(yè)建議+醫(yī)療數(shù)據(jù)庫法律咨詢解釋特定法條適用范圍高司法轄區(qū)限定+法律條文引用金融預測給出具體股票買賣建議極高風險提示+歷史回報率說明幻覺高發(fā)場景?RAG框架:利用檢索增強生成(如先搜索權(quán)威數(shù)據(jù)庫,再生成答案)?外部知識庫:結(jié)合外部知識庫,砍通用知識,強化垂直領(lǐng)域?精細訓練:針對不同任務類型進行具體的微調(diào)或強化?評估工具:開發(fā)高效的自動化AI幻覺識別工具,對生成內(nèi)容進行及時驗證應對AI幻覺的技術(shù)方案如何應對AI幻覺?
總結(jié)?三角驗證法:交叉比對多個AI回答或權(quán)威來源。?警惕“過度合理”:越細節(jié)豐富的回答越需謹慎(如AI虛構(gòu)論文標題與作者)。?理解幻覺
,享受幻覺:理解幻覺的特點和應對方法,享受幻覺帶來的創(chuàng)意靈感AI幻覺的創(chuàng)造力價值
科學發(fā)現(xiàn):從“錯誤”到突破的范式躍遷?蛋白質(zhì)設計:大衛(wèi)·貝克團隊利用AI“錯誤折疊”啟發(fā)新型蛋白質(zhì)結(jié)構(gòu),獲2024諾貝爾化學獎。?認為AI幻覺是“從零開始設計蛋白質(zhì)”的關(guān)鍵?發(fā)表的多篇論文都將“幻覺”納入標題當中AI幻覺的創(chuàng)造力價值
文藝與設計:
突破人類思維定式的“超現(xiàn)實引擎”
娛樂與游戲:創(chuàng)造新的視覺和聽覺體驗?AI生成的虛擬環(huán)境和角色設計為游戲開發(fā)人員提供了無限的可能性,增強了玩家的沉浸感和探索欲?AI幻覺還被用于生成故事、對話和詩歌
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 西安文理學院《Access數(shù)據(jù)庫應用》2023-2024學年第二學期期末試卷
- 廣元中核職業(yè)技術(shù)學院《基礎工程》2023-2024學年第二學期期末試卷
- 青島黃海學院《熱工基礎實驗》2023-2024學年第二學期期末試卷
- 江陰職業(yè)技術(shù)學院《非營利組織管理》2023-2024學年第二學期期末試卷
- 山東理工職業(yè)學院《電氣控制及可編程控制器》2023-2024學年第二學期期末試卷
- 陜西工商職業(yè)學院《Python金融大數(shù)據(jù)分析》2023-2024學年第二學期期末試卷
- 天津師范大學《機械制圖基礎》2023-2024學年第二學期期末試卷
- 北京化工大學《溝通技巧》2023-2024學年第二學期期末試卷
- 阿克蘇工業(yè)職業(yè)技術(shù)學院《短視頻制作》2023-2024學年第二學期期末試卷
- 四川工商職業(yè)技術(shù)學院《柔性可穿戴技術(shù)》2023-2024學年第二學期期末試卷
- 2025年上海市靜安區(qū)初三二模語文試卷(含答案)
- 水泥預制構(gòu)件及建材項目可行性研究報告參考范文
- 建設工程質(zhì)量檢測標準化指南?技術(shù)示范文本 檢測專項檢測報告和原始記錄模板 -(九)橋梁及地下工程大類
- 林下經(jīng)濟產(chǎn)業(yè)項目可行性研究報告
- 2025年青島市局屬公辦高中自主招生化學試卷試題(含答案解析)
- AI在醫(yī)療機器人領(lǐng)域的應用前景與挑戰(zhàn)
- 2025年全民營養(yǎng)周科學實現(xiàn)吃動平衡健康中國營養(yǎng)先行課件
- 鍵盤采購合同協(xié)議
- 賣車合同協(xié)議書模板下載
- 非標自動化設備設計培訓
- 行政檢查業(yè)務培訓課件
評論
0/150
提交評論