




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、博弈的基本概念(2) 支付(payoffs):每個人在不同戰略組合下得到些什么?依賴于所有參與人的選擇; 均衡(equilibrium):所有參與人最優戰略的組合; 結果(outcomes):我們所感興趣的東西。第1頁/共37頁靜態博弈 最簡單的博弈:所有參與人同時選擇行動,并且只選擇一次; “同時”是一個信息概念,而不一定與日歷上的時間一致;第2頁/共37頁囚徒困境(prisoners dilemma) 囚徒困境坦白不坦白坦白不坦白8,8 0,1010,01,1無論對方如何選擇,每個人的最優選擇:坦白。所以,我們可以預測,結果將是(坦白,坦白)第3頁/共37頁占優均衡(dominant-st
2、rategy equilibrium) 一般來說,由于每個參與人的效用依賴于所有人的選擇,因此每個人的最優選擇(戰略)也依賴于所有其他人的選擇(戰略)。但在上述例子中,一個人的最優選擇并不依賴于他人的選擇。這樣的最優戰略,被稱為“占優戰略”(dominant strategy)。由所有參與人的占優戰略構成的戰略組合被稱為“占優均衡”。 占優戰略均衡的出現只要求所有人都是理性的,但不要求每個參與人知道其他參與人是否理性。 囚徒困境博弈有占優均衡,所以其結果很容易預測。第4頁/共37頁個人理性與集體理性的沖突 “囚徒困境”表明個人理性與集體理性的沖突。 這樣的例子很多:寡頭競爭,軍備競賽,團隊生產
3、中的勞動供給,公共產品的供給,等等; 許多的制度就是為解決“囚徒困境”而存在的;第5頁/共37頁公共產品(public goods)提供不提供提供不提供4,4-1,55,-10,0無論對方如何選擇,每個人的最優選擇:不提供。所以,我們可以預測,結果將是(不提供,不提供)第6頁/共37頁公共產品與稅收制度 比較私人產品與公共產品的不同:使用上排他性; 私人產品是志愿購買的,但公共產品可能需要強制購買; 稅收制度就是保證公共產品的生產,解決公共產品生產上的“囚徒困境”第7頁/共37頁“囚徒困境”的一般表示合作不合作合作不合作T,TS,RR,SP,P滿足:RTPS; (S+R)R-T第9頁/共37頁
4、“智豬博弈”(boxed pigs) 有些博弈沒有占優均衡,但通過剔除“壞”戰略,我們可以預測博弈的結果。如“智豬博弈”按等待按等待3,12,47,10,0這個博弈中,大豬的最優選擇依賴于小豬的選擇,但小豬的最優選擇與大豬的選擇無關。如果大豬知道小豬的理性的,大豬將選擇“按”。均衡是“大豬按,小豬等待”?!傲印睉鹇裕簾o論對方選擇什么,如果自己選擇A得到的總是收益小于選擇B得到的收益,A就是相對于B的劣戰略。第10頁/共37頁重復剔除占優均衡 “重復剔除嚴格劣戰略”(iterated elimination of strictly dominated strategy)的思路:首先找出博弈參與人
5、的劣戰略(dominated strategy)(假定存在的話),把這個劣戰略剔除后,剩下的是一個不包含已剔除劣戰略的新的博弈;然后在剔除這個新的博弈中的劣戰略;繼續這個過程,直到沒有劣戰略存在。如果剩下的戰略組合是唯一的,這個唯一的戰略組合就是“重復剔除占優均衡”(iterated dominance equilibrium)。 如果這樣的解存在,我們說該博弈是“重復剔除占優可解的”(iterated dominance solvable).第11頁/共37頁理性共識(common knowledge of rationality) (1)Zero-order CKR: 每個人都是理性的,但
6、不知道其他人是否是理性的; (2)first-order CKR: 每個人是理性的,并且知道其他每個人也都是理性的,但并不知道其他人是否知道自己是理性的; (3)second-order CKR: (1)+(2)+每個人知道(2) nth-order CKR: R(b)C(b)R(b)C(b)R is rational, 第12頁/共37頁重復剔除與理性共識 重復剔除不僅要求每個人是理性的,而且要求每個人知道其他人是理性的,每個人知道每個人知道每個人是理性的,如此等等,即理性是“共同知識”(共識)C1C2C3R1R2R310,41, 598,4 9, 90, 399,81,980,100100
7、,98這個博弈只要求一階理性共識就可以預測均衡結果。如果把(下左)的第一個數字改為11呢?第13頁/共37頁最優選擇 這個博弈只要求一階理性共識就可以預測均衡結果: 如果R相信C是理性的,R就知道C不會選擇C3,所以R的最優選擇是R1; 如果C相信R是理性的,C就知道R不會選擇R2,所以C的最優選擇是C2。 但要C預期R不會選擇R3,需要二階理性共識;要R不預期C會選擇C1,需要三階理性共識。第14頁/共37頁R排除C選擇C1R believes C believes R believes C is rational(C1,C2)R1C2第15頁/共37頁好事變壞事? 在單人決策中,個人給定選
8、擇在所有情況下的收益都增加,一個人的狀況不會變得更壞,但博弈中則不同。上下左右上下左右-1, 32, 10, 23, 41, 34, 10, 23, 4第16頁/共37頁選擇越多,對理性共識的要求越高R1R2R3R4C1C2C3C45,100,111,2010,104,01,12,020,03,20,44,350,12,930,920,91 100,90第17頁/共37頁(1)Zero-order CKR: C not choose C4 for C is rational(2)1st-order CKR: R not choose R4 for R (b) C(3)2nd-order CKR
9、: C not choose C1 for C(b)R(b)C(4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C(5)4th-order CKR: C not choose C3 for C(b) R(b)C(b)R(b)C(6)5th-order CKR: R not choose R3 for R(b) C(b) R(b)C(b)R(b)Cso, (R2,C2) is an equilibrium第18頁/共37頁不能用重復剔除解的博弈 許多博弈沒有占優均衡,也沒有重復剔除的占優均衡。考慮如下博弈:C1C2C3R1R2R30,44,05,
10、34,00,45,33,53,56,6第19頁/共37頁可理性化的選擇 Rationalizable strategy: 不能被重復剔除的戰略;或者說,可以被合理的信念(belief)所支持的行為; 例如:R理性化選擇R1: 如果R(b)C 選擇C2, 如果R(b)C(b)R會選擇R2; 如果R(b)C(b)R(b)C會選擇C1; 如果R(b)C(b)R(b)C(b)R會選擇R1第20頁/共37頁Consistently aligned beliefs (CAB) 考慮(R3,C3):對方不會犯預期錯誤:R選擇R3,如果他認為C會選擇C3;C會選擇C3,如果他認為R會選擇R3。 CAB:每個人
11、對別人行為的預期(信念)是正確的; Harsanyi doctrine: 如果兩個理性的人具有相同的信息,他們一定會得出相同的推斷和相同的結論; Robert Aumann: rational agents cannot agree to disagree.第21頁/共37頁納什均衡與一致預期 納什均衡:所有參與人的最優戰略的組合:給定該戰略中別人的選擇,沒有人有積極性改變自己的選擇。 一致預期:基于信念的選擇是合理的;支持選擇的信念是正確的; 預期的自我實現:如何所有人認為這個結果會出現,這個結果就會出現。預期是自我實現的,預期不會錯誤。如果你認為我預期你將選擇X,你就真的會選擇X。第22頁
12、/共37頁哲學思考 如果參與人事前達成一個協議,在不存在外部強制的情況下,每個人都有積極性遵守這個協議,這個協議就是納什均衡。第23頁/共37頁尋找納什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,200第24頁/共37頁納什均衡:舉例 廣告博弈 納什均衡:(做廣告,做廣告)戰略做廣告不做廣告做廣告4,415,1不做廣告1,1510,10企業1企業2第25頁/共37頁利用納什均衡尋租 考慮股票市場融資的例子:設想企業價值是100,現在發行的流通股為100股,每股價值1元?,F在假定經理想籌集100元,投資價值只有50元。有人買新股嗎?
13、假定每一股配4股,價格為0.25元。如果股東不接受配股:原來一股1元的價值就變成0.3元(=150/500);如果接受配股,他持有的股票的價值是1.5元;因為配股的成本是1元,所以他的最優選擇是接受配股。第26頁/共37頁所有權配置與等級結構 考慮團隊生產:讓其中的一個人變成所有者工作偷懶工作偷懶6,62,20,88,0第27頁/共37頁納什均衡與學習過程R2R1NEq1q2第28頁/共37頁雙寡頭競爭:Cournot博弈 兩個企業同時選擇產量,價格由市場決定; 假定需求函數為其中 為企業1的產量, 為企業2的產量 假定成本函數為: 那么,利潤函數為:)()(21qqaQP1q2qiiiqcq
14、C)()()()()(212222211111cqqaqcqQPqcqqaqcqQPq第29頁/共37頁雙寡頭競爭(續) 企業最大化利潤的一階條件為: 納什均衡產量: 納什均衡利潤為22)(22)(12222211qcaqRqqcaqRq321caqqNENE9)(221caNENE第30頁/共37頁壟斷產量和壟斷利潤 壟斷企業的目標函數: 壟斷產量: 壟斷利潤:)()(cQaQQcQQPM2caQM4)(2caM第31頁/共37頁劃拳博弈老虎雞蟲杠子老虎雞蟲杠子0,01,-10,0-1,1-1,10,01,-10,00,0-1,10,01,-11,-10,0-1,10,0第32頁/共37頁混合戰略納什均衡 有些博弈沒有“純戰略”納什均衡,但有混合戰略納什均衡,如監督博弈。監督不監督偷懶不偷懶1,11,22,32,2給定工人偷懶,老板的最優選擇是監督;給定老板監督,工人的最優選擇是不偷懶;給定工人不偷懶,老板的最優選擇是不監督;給定老板不監督,工人的最優選擇是偷懶;如此循環。第33頁/共37頁納什均衡的存在性問題 每一個有限博弈至少存在一個納什均衡(純戰略或混合戰略); 如果一個博弈存在兩個純戰略納什均衡,那么,一定存在第三個混合戰略納什均衡。第34頁/共37頁風險與均衡 由
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園家園課題申報書
- 課題申報書項目學習
- 科技類科研課題申報書
- 山東省臨沂市沂水縣2024-2025學年中考語文學業水平考試模擬試卷(含答案)
- 六年級語文上冊 第一單元 3 古詩詞三首教學設計新人教版
- 財務報表合并的注意事項試題及答案
- 教學研究課題申報書
- 2025年銀行從業資格證考試情況分析試題及答案
- 2025至2031年中國小棗制品行業投資前景及策略咨詢研究報告
- 多樣學習2025年銀行從業資格證試題答案
- 《有色金屬材料制備與應用》課件 5-鋁合金的凈化處理
- 教學勇氣:漫步教師心靈
- 社團語言學習法課件
- 當前社會思潮與國家意識形態安全
- JGJT296-2013 高拋免振搗混凝土應用技術規程
- DB6110-T 039-2023 桔梗栽培技術規范
- 部編版初中語文文言文主題分類梳理1
- 第8課 用制度體系保證人民當家做主
- 砂子檢驗報告-焦化
- 當代學前兒童家庭教育的問題與對策研究 論文
- 六年級合作取得更大的成功辯論
評論
0/150
提交評論