[小學教育]重復博弈ppt課件_第1頁
[小學教育]重復博弈ppt課件_第2頁
[小學教育]重復博弈ppt課件_第3頁
[小學教育]重復博弈ppt課件_第4頁
[小學教育]重復博弈ppt課件_第5頁
已閱讀5頁,還剩28頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2022-1-131 1、重復博弈的定義及特征、重復博弈的定義及特征1 1 定義:定義: 重復博弈指同樣構造的博弈重復屢次,其中每次博弈稱為階段博弈。2 特征: A、階段博弈之間沒有“物質上的聯絡,即前一階段的博弈不改變后一階段博弈的構造; B、所有參與人都觀測到博弈過去的歷史; C、參與人的總支付是所有階段博弈支付的貼現值之和或加權平均值。2022-1-132 2、有限次重復博弈、有限次重復博弈 1 1定義定義2022-1-132 2相關概念相關概念2022-1-132022-1-132022-1-132022-1-132022-1-13重復博弈的得益的平均得益為相同的現在值,則稱得益序列階

2、段的得益,能產生與無限次重復博弈)各個重復博弈或作為重復博弈(有限次平均得益:如果一常數,,212111)1 (ttt慮貼現問題無限次重復博弈必須考考慮貼現因素有限次重復博弈不一定2022-1-133 3定理定理1 1在在G G中得益的中得益的T T倍,平均每階段得益等于原博弈倍,平均每階段得益等于原博弈G G中的得益。中的得益。例:例:有限次重復囚徒困境博弈有限次重復囚徒困境博弈2022-1-13 假如我們以該博弈作為原博弈G進展重復博弈,結果是否會與一次性博弈有所不同,還是仍然是一次性博弈的簡單重復呢? 假如重復的次數是兩次,那么該重復博棄的現實意義可以理解為官方給這兩個囚徒兩次時機,他們

3、最后的得益被關年數的負值表示的負效用是兩個階段博弈中各自得益之和當然在第二階段開場之前是讓每個囚徒知道上一階段另一囚徒選擇的。2022-1-132022-1-13分析:分析:因為重復博弈的全過程是一種動態博弈過程,因此我們用逆推歸納法來分析雙方在各階段的選擇。先看第二階段,即后一次博弈。第二階段博弈本身仍然是兩囚徒之間的一個囚徒的困境博弈,此時,前一階段的結果已成為既成事實而在此階段之后又不再有任何的后續階段,因此實現自身在本階段中的最大利益是兩博弈方在該階段決策的唯一原那么,所以,不管前一階段博弈的結果如何,第二階段博弈的唯一結果就是原博弈的一次性博弈的唯一的納什平衡坦白,坦白,雙方的得益為

4、一5,一5。2022-1-13 如今我們再回到前一階段,即第一個階段。在第一階段,兩博弈方對后一階段將會出現的結果是一清二楚的,都知道雙方在第二階段將得到一5的得益,因此此時雙方都知道整個兩次重復博弈的結果,雙方的最終得益肯定就是在本階段的雙方得益上各加一個一5。因此,該重復博弈實際上與一次性博弈是等價的。2022-1-132022-1-134 多個純策略納什平衡博弈的有限次重復博多個純策略納什平衡博弈的有限次重復博弈弈5,53,32,00,22,06,00,20,61,1HMH廠商廠商2ML廠廠商商1L三種可選戰略博弈2,23,13,11,34,47,11,31,78,8廠廠商商1廠商廠商2

5、LMHHML兩次重復三種可選戰略博弈的等價模型觸發策略:兩博弈方先試探合作,一旦發現對方不合作那么也用不合作報復博弈方1:第一次選h;如第一次結果為H,H,那么第二次選M,否那么選L博弈方2:同博伊方1例例12022-1-13 兩市場博弈的重復博弈重復兩次A,B+A,B OR B,A+B,A1,44,1連續兩次采用混合策略2,2A,B+B,A OR B,A+A,B2.2,2.5輪換策略一次純策略+一次混合策略1.5,33,1.50,04,11,33,3廠廠商商1廠商廠商2BAAB兩市場博弈廠商2得益廠商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)(1.5,3)

6、例例22022-1-13 進一步,我們可把二次重復兩市場博弈推廣到任意有限次重復,就說l 01次。這時,廠商1的策略是在前99次中都選A,但一旦發現哪次出現結果A,B,那么改選并堅持B到底,最后二次與二次重復的后兩次一樣;廠商2的策略也是前99次都選A,但一旦發現哪次出現結果B,A,那么以后每次都選B,最后二次與二次重復的后兩次一樣。同樣的道理,這也是子博弈完美納什平衡途徑。雙方平均得益都等于 993十l十4101299,非常接近于最優結果3,3。2022-1-135 有限次重復博弈的民間定理有限次重復博弈的民間定理 個體理性得益:個體理性得益:不管其它博弈方的行為如何,一博弈方在某個博弈中只

7、要自己采取某種特定的策略,最低限度保證能獲得的得益。 可實現得益:可實現得益:博弈中所有純策略組合得益的加權平均數組 定理:設原博弈的一次性博弈有平衡得益數組優于w,那么在該博弈的屢次重復中所有不小于個體理性得益的可實現得益,都至少有一個子博弈完美納什平衡的極限的平均得益來實現它們。 注:注:w表示最差平衡得益數組表示最差平衡得益數組.2022-1-13例例2022-1-133 3、無限次重復博弈、無限次重復博弈 1 1特征特征 無限次重復博弈的特征是不存在可作為最后一無限次重復博弈的特征是不存在可作為最后一階段的最后一次重復。階段的最后一次重復。 2 2分析無限次重復博弈的難點分析無限次重復

8、博弈的難點 一是普通的逆推歸納法無法直接運用;一是普通的逆推歸納法無法直接運用; 二是在無限次重復中,各博弈方的各階段得益的二是在無限次重復中,各博弈方的各階段得益的總和常常是趨向無窮大的,在分析無限次重復博弈總和常常是趨向無窮大的,在分析無限次重復博弈時該用什么作判斷根據。時該用什么作判斷根據。2022-1-133 3無限次重復博弈及得益的定義無限次重復博弈及得益的定義2022-1-13可實現得益:可實現得益:可實現得益實際上就是階段博弈各種純戰略組合得益的加權平均所構成的得益組合,其中權數非負且總和為1。我們用x1, x2, xn來記一個可實現得益。不同的權數構造就可構成不同的可實現得益,

9、一博弈的全體可實現得益組合對應的坐標平面兩個以上博弈方時就是空間的區域上的點構成一定的面積。2022-1-13例:例:2022-1-13可實現得益可實現得益2022-1-13平均得益:平均得益:2022-1-132022-1-134 4無名氏定理無名氏定理 設G是一個完全信息的靜態博棄。用e1,, en記G的一個納什平衡獲得的得益,用x1, xn表示的任意可實現得益假如xiei,對任意博弈方i都成立,而足夠接近1,那么無限重復博弈G, 中一定存在一個子博弈完美的納什平衡途徑能實現各博弈方的平均得益為x1, xn 。2022-1-13上例的無名氏定理上例的無名氏定理2022-1-13 兩人零和博弈的無限次重復博弈 兩人零和博弈無限次重復的所有階段都不可能發生合作,博弈方會一直重復原博弈的混合策略納什平衡2022-1-13觸發策略觸發策略冷酷戰略冷酷戰略grim strategygrim strategy博弈各方首先試探合作,一旦覺察對方不合作那么也用不合作相報復,利用有后續階段博弈的制約作用達成平衡的策略稱為“觸發策略。因此博弈方的這種觸發策略是一個完好的方案,博棄方一旦設定了這樣的策略,就會堅持到底,因此其中的報復威脅是可以相信的會信守的,因此所構成的平衡都是子博弈精煉的。 下例中就包含這一戰略下例中就包含這一戰略。2022-1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論