Lecture 3 完全信息動態博弈_第1頁
Lecture 3 完全信息動態博弈_第2頁
Lecture 3 完全信息動態博弈_第3頁
Lecture 3 完全信息動態博弈_第4頁
Lecture 3 完全信息動態博弈_第5頁
已閱讀5頁,還剩51頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三講完全信息動態博弈動態博弈不同于靜態博弈,動態博弈中的參與人行動有先后順序,后行動者在先行動者做出決策之后,再視情況決定自己的行動。下棋、求婚、討價還價(談判)、價格戰動態博弈中的參與人行動有先后順序,后行動者在先行動者做出決策之后,再視情況決定自己的行動。因此先行動者需要考慮到自己的策略對后行動者的影響。動態博弈若舊公司威脅新公司,若進入一定采用價格戰,該威脅是否可信?例:嚇阻進入動態博弈例:嚇阻進入兩個博弈已經完全不同了!現實中,往往是新公司進入后,舊公司再做決定3.1博弈擴展式表述3.1.1博弈樹開發商B開發不開發

開發商B開發不開發

開發開發商A

不開發4,48,00,80,0-3,-31,00,10,0(a)高需求情況(b)低需求情況開發開發商A

不開發n人有限戰略博弈的擴展式表述一般可以用博弈樹來表示。3.1博弈擴展式表述A開發不開發NNBBBB開發開發開發開發開發不開發不開發不開發大大小小(1/2)(1/2)(1/2)(0,0)(0,1)(0,0)(4,4)(8,0)(-3,-3)(1,0)(0,8)

若博弈行動順序如下開發商A首先行動,選擇開發或者不開發A決策后,自然選擇市場需求大小開發商B觀察到A的決策和市場需求后,決定開發或不開發不開發房地產開發博弈Ⅰ:3.1博弈擴展式表述博弈樹(gametree)是包含多個結(node)與枝(branches)的集合,從單一的起始環節,不經回轉,不經交錯,直到終結環節。1.結(node):包括決策結和終點結兩類。2.枝(branches):枝是一個決策結到它的直接后續結的連線,每一個枝代表參與人的一個行動選擇。3.信息集(informationsets):博弈樹上的所有決策結分割成不同的信息集。每一個信息集是決策結集合的一個子集,該子集包括所有滿足下列的決策結:(1)每一個決策結都是同一參與人的決策結(2)該參與人知道博弈進入該集合的某個決策結,但不知道自己究竟處在哪一個決策結。博弈樹的基本結構3.1博弈擴展式表述信息集A開發不開發NNBBBB開發開發開發開發開發不開發不開發不開發大大小小(1/2)(1/2)(1/2)(0,0)(0,1)(0,0)(4,4)(8,0)(-3,-3)(1,0)(0,8)

房地產開發博弈Ⅱ不開發這里B能看到A是否開發,但看不到市場的大小3.1博弈擴展式表述信息集房地產開發博弈Ⅲ這里B能看到市場的大小,但不能看到A是否開發A開發不開發NNBBBB開發開發開發開發開發不開發不開發不開發大大小小(1/2)(1/2)(1/2)(0,0)(0,1)(0,0)(4,4)(8,0)(-3,-3)(1,0)(0,8)

不開發3.1博弈擴展式表述不同的博弈樹可能表達同一個博弈N大不開發AABBBB開發開發開發開發開發不開發不開發不開發開發開發不開發小(1/2)不開發(0,0)(0,1)(0,0)(4,4)(8,0)(-3,-3)(1,0)(0,8)

房地產開發博弈Ⅲ:第二種表述(1/2)3.1博弈擴展式表述不同的博弈樹可能表達同一個博弈N大不開發BBAAAA開發開發開發開發開發不開發不開發不開發開發開發不開發不開發(0,0)(0,1)(0,0)(4,4)(8,0)(-3,-3)(1,0)(0,8)

房地產開發博弈Ⅲ:第三種表述(1/2)(1/2)小3.1博弈擴展式表述擴展式表述也可以用于表述表示靜態博弈(-8,-8)(0,-10)(-10,0)(-1,-1)

坦白抵賴

坦白抵賴

坦白抵賴

A

B

(-8,-8)(0,-10)(-10,0)(-1,-1)

坦白抵賴

坦白抵賴

坦白抵賴

BA

囚徒困境擴展式表述3.1博弈擴展式表述

3.1博弈擴展式表述假定在博弈開始前自然就選擇了“低需求”,并且已為參與人的共同信息;若開發商A先決策,那么博弈的擴展式如圖。在博弈的開始,B的策略是什么?動態博弈中的策略ABB開發開發開發不開發不開發不開發(0,1)(0,0)(-3,-3)(1,0)3.1博弈擴展式表述“策略”的涵義:表示參與人(如開發商B)在各個信息集合(開發,不開發)觀察到其他參與人(A)的行動之下的相應行動。開發商A有兩個策略開發商B有四個策略動態博弈中的策略-3,-3-3,-31,01,00,10,00,10,0開發商B{開發,開發}{開發,不開發}{不開發,開發}{不開發,不開發}

開發開發商A

不開發3.1博弈擴展式表述

3.1.3完美信息博弈3.1博弈擴展式表述一般假定博弈滿足“完美回憶”(perfectrecall)的要求。完美回憶是與信息集有關的概念,指的是沒有參與人會忘記自己以前知道的事情,所有參與人都知道自己以前的選擇。3.1.4完美回憶12UUUDDLLLLRRR1112(a)(b)N1兩個不是完美回憶的例子3.2子博弈精煉納什均衡并非所有納什均衡都是合理的;只有其策略不包含不可置信行動的納什均衡才是合理的。不包含不可置信的行動的策略所組成的納什均衡被稱為“精煉納什均衡”;即不論過去發生了什么,構成精煉納什均衡的戰略,其所規定的行動在每一個決策點上都是最優的。所以,又稱為“序貫均衡”(sequentialequilibrium)。澤爾騰(Selten)的“子博弈精煉納什均衡”是納什均衡概念的第一個最重要的改進。子博弈精煉納什均衡是完全信息動態博弈解的基本概念。子博弈(Subgame)是原博弈的一部分(小樹subtree),從單一元素的信息集合精煉納什均衡(PerfectNashEquilirium)3.2子博弈精煉納什均衡子博弈(Subgame)一個子博弈必須從一個單結信息集開始。ABB開發開發開發不開發不開發不開發(0,1)(0,0)(-3,-3)(1,0)房地產開發博弈(-3,-3)(1,0)開發不開發開發不開發(0,1)(0,0)(b)子博弈Ⅰ(b)子博弈Ⅱ(a)原博弈3.2子博弈精煉納什均衡子博弈(Subgame)子博弈的信息集和支付向量都直接繼承自原博弈。122LLURRDZ4Z1Z2Z3122LLURRD3lrlllrrr3囚徒困境的擴展式表述3.2子博弈精煉納什均衡子博弈精煉均衡(SubgamePerfectNashEquilibrium,SPNE)是一策略組合,在原博弈中是納什均衡,而且它相關的策略在每個子博弈中也都是該子博弈的納什均衡。逆推法基于序貫理性原理,參與人在每一步驟上均追求效用極大子博弈精煉納什均衡存在性定理I(Kuhn,1953):每個完美信息擴展式的有限博弈都有一個逆推法找出的純策略納什均衡(也是純策略子博弈精煉納什均衡(SPNE))。3.2子博弈精煉納什均衡用逆向歸納法求解子博弈精煉納什均衡的過程,實質是重復剔除嚴格劣策略的過程在擴展式博弈上的擴展。子博弈精煉納什均衡在博弈樹上所經過的決策點和最優選擇構成一個路徑,稱為均衡路徑(EquilibriumPath)。子博弈精煉納什均衡3.2子博弈精煉納什均衡子博弈精煉納什均衡有些非完美信息博弈也可以運用逆向歸納法求解。21U’LUD’RD(2,2)(3,1)(2,-2)(-2,2)(-2,2)(2,-2)R’L’R’L’12存在性定理II(Selton):有限的擴展式博弈一定有子博弈精煉納什均衡(SPNE)。3.2子博弈精煉納什均衡逆向歸納法理論上要求“所有參與人是理性的”是所有參與人的共同知識。盡管在簡單的兩階段模型中,逆向歸納法及子博弈精煉納什均衡給出的解是非常直觀的,但是如果有許多個參與人或每個參與人有多次行動機會,情況可能并非如此。逆向歸納法的問題3.2子博弈精煉納什均衡逆向歸納法的問題我們預測所有參與人都將選擇A。如果n很小,這個預測大概是正確的;但是,如果n很大,這個預測就很值得懷疑。iAAAA12(2,…2)(1/n,…,1/n)(1/2,…,1/2)(1,…,1)(1/i,…,1/i)DDDDn與此相關的另一個問題是逆向歸納法要求支付向量是所有參與人的共同知識。參與人越多,共同知識的要求就越難滿足3.2子博弈精煉納什均衡逆向歸納法的問題這里,只有兩參與人,但每個參與人有100個決策結…………1AAAA12(100,100)(98,101)(0,3)(1,1)(98,98)DDDD1蜈蚣博弈2A2A(99,99)(97,100)3.2子博弈精煉納什均衡精煉納什均衡策略不僅在均衡路徑上是最優的,而且在非均衡路徑上也是最優的。即參與人在不可能事件發生時,也應該按照理性原則進行最優行動。悖論:最優策略是基于理性假設做出的,但滿足理性假設意味著不可能事件不會發生,如果不可能事件發生了,說明理性假設不成立,那么在采取下一步行動時為何還要假定對方為理性呢?反事實悖論3.3子博弈精煉納什均衡應用舉例

3.3.1動態產量競爭:斯塔克爾伯格(Stackelberg)模型3.3子博弈精煉納什均衡應用舉例

3.3.1動態產量競爭:斯塔克爾伯格(Stackelberg)模型古諾均衡點斯塔克爾伯格均衡點R1R2q2q1(a-c)/43(a-c)/8(a-c)/23.3子博弈精煉納什均衡應用舉例引擎廠希望生產大引擎,但汽車廠希望生產小車。若引擎廠事先宣布,只生產大引擎,這個承諾可信嗎?3.3.2使不可置信的承諾成為可信:上下游關聯博弈引擎廠

大車大引擎小引擎(8,3)大引擎(3,0)引擎廠汽車廠小車小引擎(3,6)

(1,1)3.3子博弈精煉納什均衡應用舉例引擎廠采取行動,使其生產小引擎的利潤大幅降低$3(賣掉或毀損部分生產小引擎的產能)。毀損部份產能表面上似乎不利其營運,但能促使汽車廠相信它的承諾只會生產大引擎,增強此宣言可信度。3.3.2使不可置信的承諾成為可信:上下游關聯博弈引擎廠

大車大引擎小引擎(8,3)大引擎(0,0)引擎廠汽車廠小車小引擎(0,6)

(1,1)3.3子博弈精煉納什均衡應用舉例3.3.2使不可置信的承諾成為可信:嚇阻進入博弈I可立即投資擴廠,擁有過剩生產能力,以便未來進行價格戰,投資花費30。宣言會進行價格戰還不如做一些像擴廠等可見的、不可逆轉的決策。3.3子博弈精煉納什均衡應用舉例

3.3.3關稅政策3.3子博弈精煉納什均衡應用舉例逆推法第二階段是一個同時行動博弈,公司1的最優化問題3.3.3關稅政策3.3子博弈精煉納什均衡應用舉例逆推法第一階段是政府決策的同時行動博弈:3.3.3關稅政策3.3子博弈精煉納什均衡應用舉例下列“囚徒困境”報酬(社會福利):FTA(FreeTradeAgreement)“自由貿易協議”:雙方同時降稅成可使雙方獲利。但若無強制功能,則任一方均有誘因自FTA偏離!3.3.3關稅政策3.4討價還價與耐心討價還價在現實生活中非常常見:勞資合同、公司利益分配、中央和地方、中美貿易、財產分配、家務等。討價還價的特點在于,雙方既有共同利益(不同于零和博弈),又有利益沖突。在一個博弈中,納什均衡太多,使得反而有可能阻止任何一個均衡的出現。談判基本特征:兩人(A和B),分一塊錢;A先出價,B決定接受還是拒絕;如果接受,按照A提出的方案分配,談判結束;如果B拒絕,B提出方案,A決定接受還是拒絕;如果接受,按B的方案分配,談判結束;如果不接受,再由A提出方案;如此等等。討價還價3.4討價還價與耐心假定x:A得到的份額;y:B得到的份額;約束條件:x+y=1s:A的貼現率;a=1/(1+s):A的貼現因子;r:B的貼現率;b=1/(1+r):B的貼現因子;貼現因子越大,越有耐心3.4.1魯賓斯坦(Rubinstein)討價還價模型3.4討價還價與耐心若只有一次談判,即A出價,B決定是否接受逆向歸納意味著子博弈精煉納什均衡是:x=1,y=0若接受和不接受支付相等,假設參與人會接受若有兩次談判,A出價,B可以不接受再出價,A再決定是否接受在第二次談判時,若B拒絕,那B的最優方案是提出x=0,y=1。根據假設,A會接受。考慮到這一點,在第一次談判時,A會選擇x=1-b,y=b,此時B會接受。若A選擇x<1-b,顯然不是最優;若A選擇x>1-b,則B不會接受,也不是最優3.4.1魯賓斯坦(Rubinstein)討價還價模型:有限期3.4討價還價與耐心若有三次談判,A出價,B可以不接受再出價,A可以不接受再出價,最后B決定是否接受第三次談判:x=1,y=0第二次談判:x=a,y=1-a第一次談判:x=1-b(1-a),y=b(1-a)若有四次談判第四次談判:x=0,y=1第三次談判:x=1-b,y=b第二次談判:x=a(1-b),y=1-a(1-b)第一次談判:x=1-b(1-a(1-b)),y=b(1-a(1-b))3.4.1魯賓斯坦(Rubinstein)討價還價模型:有限期3.4討價還價與耐心當有T次談判時:T=2N+1,N=0,1,2…T=2N+2,N=0,1,2…兩個結論:后動優勢:當兩人的耐心足夠高時,誰在最后一輪出價,誰就具有優勢。但這個優勢隨允許談判次數的增加而遞減。(注意:當談判次數為T次時,A既是先動方,又是后動方)越有耐心的人,談判中優勢越大3.4.1魯賓斯坦(Rubinstein)討價還價模型:有限期3.4討價還價與耐心

3.4.2無限期討價還價模型與耐心3.4討價還價與耐心如果B先出價:兩個結論:無限次談判具有“先動優勢”一個人的耐心越大,談判中的優勢就越大談判當中能夠影響到最終分配結果的因素有兩個:出價順序談判者的耐心,以及與耐心類似的談判成本(包括機會成本)3.4.2無限期討價還價模型與耐心3.4討價還價與耐心在前面的討論中,盡管談判允許多次,但均衡情況下,雙方一開始就達成協議,之后的談判路徑都是非均衡路徑;現實中情況并不如此。通常,談判總要進行多個回合,例如中國加入WTO是談判,進行了10幾年。為什么?3.4.3談判與信息3.4討價還價與耐心原因是:我們前面假定當事人具有完全信息:知道價值V和每個人的機會成本或談判砝碼,每個人的耐心,談判的時限等等。并且,每個人知道每個人知道;每個人知道每個人知道每個人知道,等等。但在現實中,談判面臨的最大問題是信息不完全。價值V,耐心,機會成本等均有可能不是公開信息。談判的過程實際上是信息揭示和窺探的過程。3.4.3談判與信息3.4討價還價與耐心兩人之間分配一筆錢,其中一個人提出方案,另一個人可以接受,也可以拒絕;如果接受,每人得到方案規定的份額;如果拒絕,沒有人得到任何東西。什么是這個博弈的精練納什均衡?3.4.4最后通牒博弈3.4討價還價與耐心兩人之間分配一筆錢,其中一個人提出方案,另一個人可以接受,也可以拒絕;如果接受,每人得到方案規定的份額;如果拒絕,沒有人得到任何東西。什么是這個博弈的精練納什均衡?在大規模試驗中,結果傾向于55:45,接近1:1!當然,還發現其他有趣結果:如男生給女生提方案時平均給予較多;而分專業進行的試驗中,發現經濟專業(尤其是博士生)提出方案接近70:30,而接受比例也較大。其它非均衡行為:小費、“事成之后,必有重謝”3.4.4最后通牒博弈3.5重復博弈與無名氏定理動態博弈中一種特殊但是非常重要的類型是“重復博弈”重復博弈是指同樣結構的博弈重復多次,其中的每次博弈稱為“階段博弈”(1)階段博弈之間沒有“物質上”的聯系(2)所有參與人都觀測到博弈過去的歷史。(3)參與人的總支付是所有階段博弈支付的貼現值之和或加權平均值。重復博弈3.5重復博弈與無名氏定理連鎖店悖論在位者有20個連鎖店,進入者每次進入其中一個市場,就變成了重復博弈。這里在位者會選擇斗爭的唯一原因是希望斗爭能起到一種威懾作用。但根據逆推法,在有限次博弈中,威懾作用并不是一個可以置信的威脅。這個博弈的唯一的子博弈精煉均衡是在位者在每一個市場上選擇默許,進入都在每一個市場上選擇進入。這就是所謂的“連鎖店悖論”(chain-storeparadox;Selten,1978)3.5.1有限次重復博弈40,50-10,00,3000,300在位者默許斗爭

進入進入者不進入3.5重復博弈與無名氏定理囚徒困境的情況與連鎖店悖論類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論