經濟博弈論基礎_第1頁
經濟博弈論基礎_第2頁
經濟博弈論基礎_第3頁
經濟博弈論基礎_第4頁
經濟博弈論基礎_第5頁
已閱讀5頁,還剩271頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

首都經濟貿易大學經濟學院經濟博弈論基礎

EconomicGameTheory主要內容第一部分緒論(第一章)第二部分非合作博弈理論(第二——五章)第三部分合作博弈理論(第六章)第四部分非對稱信息博弈理論(第七章)第一部分緒論第一章緒論第一節博弈論與經濟學第二節經濟博弈論的產生與發展第三節經濟博弈論內容體系第二章策略型博弈第三章擴展型博弈第四章貝葉斯博弈第五章動態貝葉斯博弈

第二部分非合作博弈理論第六章合作博弈第一節合作博弈的基本問題第二節合作博弈解第三節談判理論

第三部分合作博弈理論第四部分非對稱信息博弈理論第七章非對稱信息博弈01020304第一節非對稱信息博弈第二節非對稱信息下的激勵理論第三節非對稱信息下的市場交易理論第四節搜尋理論一、教材:

1、王文舉.《經濟博弈論基礎》

高等教育出版社,2010

2、RobertGibbons.APrimerinGameTheory(GameTheoryforAppliedEconomists)London:HarvesterWheatsheaf

,1992《博弈論基礎》,中國社會科學出版社,1999

教材與參考書二、參考書:1、

張維迎.《博弈論與信息經濟學》

上海三聯書店、上海人民出版社,19992、王文舉.《博弈論應用與經濟學發展》

首都經濟貿易大學出版社,2003

教材與參考書二、參考書:3、王文舉.《博弈論應用與經濟動態模擬》

中國社會科學出版社,2010

4、王文舉.《諾貝爾經濟學獎獲得者學術思想舉要》,首都經濟貿易出版社,2011

教材與參考書經濟博弈論基礎

Economic

GameTheory第一章緒論

主要內容第二節經濟博弈論的產生與發展第一節博弈論與經濟學第三節經濟博弈論內容體系一、博弈論的研究對象博弈論是研究在利益相互影響的局勢中,局中人如何選擇自己的策略才能使自身的收益最大化的均衡問題,是研究聰明而又理智的決策者在沖突或合作中的策略選擇理論。

第一節、博弈論與經濟學

1.從經濟學的研究對象來看

傳統觀點:經濟學是研究有限資源的最優配置的一門學科。物盡其用現代觀點:經濟學是研究理性人行為的一門學科。人盡其才

理性人合作與沖突博弈論從“物盡其用”到“人盡其才”

二、博弈論與經濟學的關系2.從新古典經濟學的兩個假設來看假設一:市場是完全競爭的;假設二:市場是完全信息的。

結論:市場可以達到一般均衡,資源配置達到

Pareto最優。兩個假設與現實的背離,引出博弈論。從“一般均衡”到“博弈均衡”

二、博弈論與經濟學的關系3.從傳統的消費理論來看

傳統消費理論:

缺陷:沒有考慮消費者之間的相互影響問題

經濟學離不開博弈論

二、博弈論與經濟學的關系

在經濟系統中,各經濟實體都有自己的利益(主要是經濟利益)。利益決定著經濟實體的經濟行為。而現代經濟博弈論在承認各經濟實體利益的基礎上,更加側重研究經濟主體行為特征,能夠協調它們的利益,更加側重研究經濟主體(局中人)的行為方案(策略)與其利益得失(支付函數)的關系,從而推動經濟發展和社會進步。

三、博弈論的作用

博弈論思想源遠流長,而能作為現代博弈論研究對象和內容的起源的博弈思想和實踐活動而言,則可追溯到2000多年前齊王與田忌賽馬以及《孫子兵法》中的軍事博弈。

第二節、經濟博弈論的產生與發展1838年,Cournot

兩寡頭產量競爭模型AntoineAugustin

Cournot,Recherches

surlesPrincipes

MathematiquesdelaTheoriedesRichesses,1838.EnglishEdition:ResearchesintotheMathematicalPrinciplesoftheTheoryofWealth,editedbyN.Bacon,NewYork:Macmillan,1897.古諾.《財富理論的數學原理的研究》,商務印書館,1994

一、經濟博弈論的產生1883年,Bertrand兩寡頭價格競爭模型Bertrand,J.,TheorieMathematiquedelaRichesseSociale,JournaldesSavants,1883,499-508.

一、經濟博弈論的產生作為博弈論誕生的標志VonNeumann,J.&O.Morgenstern,TheTheoryofGamesandEconomicBehavior,PrincetonUniversityPress,1944.馮·諾依曼和摩根斯頓:《博弈論與經濟行為》三聯書店,2004.JohnvonNeumann(1903-1957)OskarMorgenstern(1902-1977)非合作博弈均衡理論JohnF.Nash:美國普林斯頓大學Reinhard

Selten:德國波恩大學JohnC.Harsanyi:美國加州大學泊克萊分校

1994年Nobel經濟學獎1、Thebargainingproblem,Econometrica,

1950,18:155-162.2、Equilibriumpointsinn-persongames,ProceedingsoftheNationalAcademyofSciences,

1950,36:48-49.

JohnF.Nash的代表作

3、Noncooperativegames,Doctoraldissertation,1950.4、Noncooperativegames,Ann.ofMath.,1951,54:286-295.5、Two-personcooperativegames,Econometrica,1953,21:128-140.

JohnF.Nash的代表作

1、SpieltheoretischeBehandlungeinesOligopol-modellsmitNachfragetrgheit,ZeitschriftfurdiegesamteStaatswissenschaft,1965,12:301-324.2、Re-examinationoftheperfectnessconceptforequilibriumpointsinextensivegames,InternationalJournalofGameTheory,1975,4:25-55.

3、TheChain-StoreParadox,TheoryandDecision,April1978,9:127-129.

Reinhard

Selten

的代表作1、GameswithincompleteinformationplayedbyBayesianplayersIII&III,ManagementScience,1967-68,14:159-182,320-334,486-502.2、RationalPlayersandBargainingEquilibriuminGamesandSocialSituations,CambridgeUniversityPress,1977.3、Harsanyi,J.AndR.Selten,AGeneralTheoryofEquilibriumSelectioninGames,Cambridge:MITPress,1988.

JohnC.Harsanyi

的代表作非對稱信息下的激勵機制設計理論JamesA.Mirrlees:英國劍橋大學WilliamVickrey:美國哥倫比亞大學

1996年Nobel經濟學獎逆向選擇:非對稱信息下的市場交易理論GeorgeAkerlof

美國加州大學泊克萊分校MichaelSpence

美國斯坦福大學JosephE.Stiglitz

美國哥倫比亞大學

2001年Nobel經濟學獎通過博弈論分析而增進我們對沖突和合作的理解RobertJ.Aumann

以色列耶路撒冷希伯來大學理性研究中心ThomasC.Schelling美國哈佛大學肯尼迪政府學院和馬里蘭大學經濟學系暨公共政策學院

2005年Nobel經濟學獎機制設計理論

LeonidHurwicz

美國明尼蘇達大學經濟學教授

EricS.

Maskin

普林斯頓大學社會科學院高等研究院

RogerB.

Myerson芝加哥大學經濟系教授

2007年Nobel經濟學獎

LeonidHurwicz

生于1917年8月21日美國明尼蘇達大學經濟學名譽教授,其主要研究領域包括機制和機構設計以及數理經濟學。

2007年Nobel經濟學獎

EricS.Maskin

普林斯頓大學社會科學院高等研究院教授,其經濟學理論已經在經濟、政治科學及法律的領域產生了深遠影響。目前的研究課題為機制設計理論,重復博弈,收入不均衡問題以及投票理論。

2007年Nobel經濟學獎RogerB.Myerson

芝加哥大學經濟系教授,1976年獲得哈佛大學應用數學系哲學博士學位,其博士論文題為:一種合作博弈理論(ATheoryofCooperativeGames)

2007年Nobel經濟學獎博弈論成為主流經濟學的一部分1.重視微觀基礎2.重視人與人之間關系的研究3.重視信息在經濟中的作用

二、博弈論對經濟學發展的影響1、VonNeumann體系

標準型擴展型合作型

第三節、經濟博弈論內容體系

2、合作博弈與非合作博弈局中人之間是否有具有約束力的協議,博弈可分為:

合作博弈:有。強調團體理性,效率、公平和公正

非合作博弈:沒有。強調個人理性、個人最優選擇,其結果可能是有效率的,也可能是無效率的。

第三節、經濟博弈論內容體系

(1)從局中人行動的時間順序上,分為:靜態博弈:局中人同時行動,或雖然局中人的行動有先有后,但后行動者不能夠觀察到先行動者的行動;動態博弈:局中人的行動有先有后,且后行動者能夠觀察到先行動者的行動。

非合作博弈可以從兩個角度進行分類(2)從局中人掌握信息的角度,分為:完全信息博弈:是指局中人對自己與其他局中人的所有與博弈有關的事前信息(策略空間、支付函數等)有充分的了解。(局中人的支付函數是共同知識)不完全信息博弈

非合作博弈可以從兩個角度進行分類.

四種不同類型的博弈

信息行動順序完全信息不完全信息靜態完全信息靜態博弈納什均衡Nash(1950,1951)不完全信息靜態博弈貝葉斯納什均衡Harsanyi(1967-1968)動態完全信息動態博弈子博弈完美納什均衡Selten(1965)不完全信息動態博弈完美貝葉斯納什均衡Selten(1975);Kreps&Wilson(1982)經濟博弈論基礎

Economic

GameTheory第二部分非合作博弈理論

第二章策略型博弈第三章擴展型博弈第四章貝葉斯博弈第五章動態貝葉斯博弈

主要內容第一節策略型博弈的表示第二節重復剔除嚴格劣策略均衡第三節

納什均衡第四節

混合策略納什均衡第五節納什均衡的存在性

第二章策略型博弈

——同時行動,如何決策

策略型(標準型)表述

——適合表示靜態博弈擴展型表述

——適合表示動態博弈

博弈有兩種表述方法一、策略型博弈的含義

完全信息靜態博弈又稱為策略型博弈。完全信息是指局中人對自己與其他局中人的所有與博弈有關的事前信息(策略空間、支付函數等)有充分的了解(局中人的支付函數是共同知識)。靜態博弈是指在博弈中,局中人同時采取行動,或者局中人的行動有先有后,但后行動者不能知道先行動者的行動選擇。

第一節策略型博弈的表示

二、策略型博弈的三個要素:

1、局中人(Players):1,2,…,n;2、策略(Strategies):

;3、支付函數(Payoff

functions)表示為:

第一節策略型博弈的表示

1、有限博弈:

(1)博弈中局中人人數有限;

(2)每個局中人只有有限個策略。

2、零和博弈:博弈中局中人所獲支付之和為零,即一方所得為另一方所失。

三、兩種特殊博弈類型1、局中人:甲,乙2、策略:{坦白,不坦白}3、支付函數——支付矩陣(雙人有限博弈)每個位置上第一個數字表示局中人1在對應的策略組合中得到的支付,第二個數字表示局中人2的相應所獲支付。例2.1囚徒困境及其策略型表示

(Tucker,1950)

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2囚徒困境的支付矩陣

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1例2.2石頭、剪刀、布的支付矩陣

田忌齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3例2.3田忌賽馬的支付矩陣

局中人:男,女

策略:男:看足球,看芭蕾女:看足球,看芭蕾

支付矩陣:見下一頁

例2.4性別大戰(battleofthesexes)

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

性別大戰的支付矩陣一、基本思想:

如果一個局中人在任何情況下從某種策略中得到的支付均小于從另一種策略中得到的支付,那么顯然對他而言,前一種策略劣于后一種策略。從個人利益出發,被剔除的策略不會被局中人采用。從而可以利用剔除嚴格劣策略的概念來簡化博弈局勢,可能會得到博弈的解。第二節

重復剔除嚴格劣策略均衡

,如果存在,對于所有的都有且其中至少有一個為嚴格不等式,則稱是第i個局中人的一個嚴格劣策略。

二、嚴格劣策略的定義1、根據理性的局中人不會選擇嚴格劣策略這一原則,可以通過重復剔除嚴格劣策略的方法對博弈進行求解。

2、其方法是:對每個局中人尋找嚴格劣策略,由于它不會被局中人選擇實施,所以找到一種后就可以將其從博弈局勢中剔除,從而得到一種新的縮減后的博弈局勢,對這種新局勢重復上述過程,直到無法找到新的嚴格劣策略為止。

三、重復剔除嚴格劣策略

對局中人甲而言,無論局中人乙采取何種策略,采用“不坦白”策略得到的支付都小于采用“坦白”策略。局中人甲的“不坦白”策略嚴格劣于“坦白”策略.“不坦白”策略都是一種嚴格劣策略,從而可以剔除。博弈中局中人各自從自身利益出發的理性選擇(博弈均衡解)就是(坦白,坦白)。

四、囚徒困境的解

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2例2.1囚徒困境的支付矩陣

甲:“不坦白”相對于“坦白”是嚴格劣策略

乙甲坦白不坦白坦白-6,-6-1,-8乙:“不坦白”相對于“坦白”是嚴格劣策略

乙甲坦白坦白-6,-6·例2.5

利用重復剔除嚴格劣策略求解

乙甲左中右上1,01,20,1下0,30,12,0·乙:“右”相對于“中”是嚴格劣策略

乙甲左中右上1,01,20,1下0,30,12,0·甲:“下”相對于“上”是嚴格劣策略

乙甲左中上1,01,2下0,30,1·乙:“左”相對于“中”是嚴格劣策略

乙甲左中上1,01,2·重復剔除嚴格劣策略均衡是(上,中)

乙甲中上1,21、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把這一過程應用到任意多步,需要假定“局中人是理性的”是共同知識。2、這一方法對博弈結果的預測經常是不準確的.

五、重復剔除嚴格劣策略有兩個缺陷

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1例2.2石頭、剪刀、布的支付矩陣

利用重復剔除嚴格劣策略無法求解

例2.6

利用重復剔除嚴格劣策略無法求解

乙甲左中右上0,44,05,3中4,00,45,3下3,53,56,6大多數的博弈局勢中使用剔除嚴格劣策略的方法能夠對博弈局勢進行簡化,但可能得不到博弈的均衡解。需要引入非合作博弈理論中的核心概念

——納什均衡(NashEquilibrium)。

六、注意一、納什均衡的思想

“雙贏”或“多贏”

第三節納什均衡它是關于博弈結局的一致性預測如果所有局中人預測一個特定的納什均衡會出現,那么這種均衡就會出現。只有納什均衡才能使每個局中人均認可這種結局,而且他們均知道其他局中人也認可這種結局。二、納什均衡的意義

1、博弈的納什均衡是這樣一種最優策略組合,是一種你好、我好大家都好的理性結局,其中每一個局中人均不能也不想單方面改變自己的策略而增加收益,每個局中人選擇的策略是對其他局中人所選策略的最佳反應。

三、納什均衡的定義

2、數學定義:在策略型博弈中,如果對于每個局中人i,存在,都有

則稱策略組合是此博弈G的一個納什均衡。三、納什均衡的定義1、雙人有限博弈:雙劃線法

首先對局中人2的每一個策略,局中人1尋找支付最大的策略,在其對應支付下劃線;然后對局中人1進行相應的步驟;最后,凡是兩個局中人支付下均被劃線的結局就是納什均衡。四、納什均衡的求法用雙劃線法可以求出納什均衡:(坦白,坦白),(-6,-6)意義:揭示個人理性與集體理性之間的矛盾。

例2.1

囚徒困境的納什均衡

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2

局中人:大豬,小豬策略:大豬:按,等待小豬:按,等待支付矩陣:見下一頁納什均衡:(按,等待)

例2.7智豬博弈(boxedpigs)

小豬大豬按等待按5,14,4等待9,-10,0

例2.7智豬博弈的支付矩陣

小豬大豬按等待按5,14,4等待9,-10,0

小豬大豬按等待按5,14,4等待9,-10,0

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

例2.4性別大戰博弈的支付矩陣

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

局中人:甲,乙

策略:甲:放左手,放右手乙:猜左手,猜右手

支付矩陣:見下一頁沒有納什均衡

例2.8猜左右手游戲

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,12、連續性博弈納什均衡的求法首先求出每個局中人對其他局中人策略組合的反應函數——即在其他局中人策略組合給定時極大化自己的支付,得到的最佳反應策略表現為其他局中人策略組合的函數;然后將這些反應函數聯立求解即得到博弈的納什均衡解。四、納什均衡的求法

局中人:廠商1,廠商2

策略:廠商1:選擇產量

廠商2:選擇產量

假設:價格

支付函數(利潤函數):

例2.9兩寡頭產量競爭Cournot(1838)模型

Cournot模型求解

反應函數:

納什均衡:

Cournot模型求解

假設兩寡頭可以串謀,共同確定產量Q使總利潤最大化,利潤函數為:(Q)=Q(a-Q-c)

總利潤最大的產量為:——稱為契約曲線總利潤為:

比較及含義:

兩寡頭產量串謀模型

Q1

廠商2的反應曲線

納什均衡

契約曲線廠商1的反應曲線

OQ2

圖1反應曲線、納什均衡與契約曲線局中人:廠商1,廠商2策略:廠商1選擇價格;廠商2選擇價格假設:兩寡頭固定成本都為0,邊際成本為常數c,

消費者對廠商1和2生產產品的需求量分別為:;例2.10兩寡頭價格競爭Bertrand(1883)模型支付(利潤)函數:

最優化的一階條件是:

Bertrand(1883)模型及求解

反應函數:

納什均衡價格:

Bertrand(1883)模型及求解在n個局中人的策略型博弈中,

1、如果重復剔除嚴格劣策略剔除掉除策略組合s以外的所有策略,則這一策略組合s為該博弈的唯一的納什均衡。

2、如果策略組合s是一個納什均衡,那么它就不會被重復剔除嚴格劣策略所剔除。納什均衡是比重復剔除嚴格劣策略更強的解概念。五、納什均衡與重復剔除嚴格劣策略均衡

一、舉例說明混合策略納什均衡

例2.8猜左右手游戲

第四節混合策略納什均衡

乙甲(q)猜左手(1-q)猜右手(p)放左手-1,

11,

-1(1-p)放右手1,

-1-1,

1

在甲選,乙選這種策略時,他們的期望效用分別為:

混合策略與期望效用甲和乙的目標是:最優化的一階條件是:

混合策略納什均衡

混合策略納什均衡為:

混合策略納什均衡1、混合策略(mixedStrategy)

局中人i的一個混合策略是在其純策略空間上的一個概率分布,其中是i選擇策略

的概率。局中人i的混合策略空間是他的所有混合策略構成的集合。

純策略可以理解為混合策略的特例。如等價于

二、混合策略納什均衡

在混合策略組合下,局中人i的期望效用函數為:

其中

2、期望效用函數

在策略型博弈中,如果對于每個局中人i,存在,都有

則稱是博弈G的一個混合策略納什均衡。3、混合策略納什均衡

奇數定理(Wilson1971):幾乎所有的有限博弈都有奇數個納什均衡。

4、奇數定理例2.11社會保障博弈

局中人:政府和下崗工人

策略:政府:救濟,不救濟下崗工人:找工作,不找工作

支付矩陣為:

三、應用舉例

工人政府找工作不找救濟3,2-1,3不救濟-1,10,0

女男足球芭蕾足球3,21,1芭蕾-1,-1

求出性別大戰博弈的混合策略納什均衡

定理1:(Nash,

1950)每個有限策略型博弈至少存在一個納什均衡(純策略的或混合策略的)。

第五節納什均衡的存在性

Brouwer不動點定理:如果X是非空的有界閉凸集,f(x)是X到自身的連續映射,那么至少存在一個xX,使得f(x)=x,x稱為不動點。

Kakutani不動點定理:設f(X)是點集X上的一個集值映射,如果X是非空的有界閉凸集,并且對于所有的xX,f(x)是非空的、凸的且上半連續的,那么至少存在一個xX,使得xf(x),x稱為不動點。

納什均衡的存在性證明

1、集值映射:對于集合X上的任何一個點x,如果f(x)給出唯一的一個點yY,則f(x)稱為從X到Y的映射;如果f(x)給出一個集合f(x)Y,則f(x)稱為從X到Y的集值映射。映射是集值映射的特例。

2、上半連續:設f(x)是X到自身的一個集值映射,如果對于所有的xX和包含f(x)的開集V,都存在x的一個鄰域U,使得對于所有的xU,有f(x)V,則稱f(x)是上半連續的。

注:集值映射和上半連續

定理2:(Debreu,

1952

;Glicksberg,1952

;Fan,

1952)在n人策略型博弈中,如果每個局中人的純策略空間Si是歐氏空間中的一個非空的有界閉凸集,支付函數ui(s)是連續的且對si是擬凹的,那么該博弈存在一個純策略納什均衡。

定理3:(Glicksberg,1952)在n人策略型博弈中,如果每個局中人的純策略空間Si是歐氏空間中的一個非空的有界閉凸集,支付函數ui(s)是連續的,那么該博弈存在一個混合策略納什均衡。

定理1的推廣:從有限到無限經濟博弈論基礎

Economic

GameTheory第二部分非合作博弈理論

第二章策略型博弈第三章擴展型博弈第四章貝葉斯博弈第五章動態貝葉斯博弈

主要內容第一節擴展型博弈的表述第二節擴展型博弈的納什均衡第三節子博弈完美納什均衡第四節

重復博弈

第三章擴展型博弈

——行動有先有后,如何制勝1、一局博弈可能有不止一個納什均衡,事實上,有些博弈可能有無數個納什均衡,究竟哪個納什均衡實際上會發生?不知道。2、納什均衡并不一定導致帕累托最優。例如“囚徒困境”意味納什均衡并不導致帕累托最優,導致了個人理性與集體理性的矛盾。對于這樣的問題,納什均衡沒有給出解決的辦法。

一、納什均衡存在的問題3、納什均衡假定:每個人將別人的策略視為給定,選擇對自己最有利的策略,即如果其他局中人不改變策略,任何單個局中人不能通過單方面改變策略來提高他的效用或收益。這種完全信息的假定不符合實際情況。

一、納什均衡存在的問題4、在納什均衡中,局中人在選擇自己的策略時,把其他局中人的策略當作給定的,不考慮自己的選擇如何影響對手的策略。這個假設在研究靜態博弈時是成立的,因為在靜態博弈下,所有局中人同時行動,無暇反應。但對動態博弈而言,這個假設就有問題了。當一個人行動在先,另一個人行動在后時,后者自然會根據前者的選擇而調整自己的選擇,前者自然會理性地預期到這一點,所以不可能不考慮自己的選擇對其對手的選擇的影響。

一、納什均衡存在的問題5、與第4個問題相聯系,由于不考慮自己選擇對別人選擇的影響,納什均衡允許了不可置信威脅的存在。這就引出了澤爾騰(Selten)的貢獻。

一、納什均衡存在的問題

對“納什均衡”加以修正——提出了“子博弈完美納什均衡”和“顫抖手完美納什均衡”,去剔除那些不合理的納什均衡,提出了“均衡選擇”問題。二、Selten的貢獻一、擴展型博弈的含義

完全信息動態博弈又稱為擴展型博弈。擴展型博弈是指在完全信息博弈中,局中人的行動有先有后,后行動者可以觀察到先行動者的行動。

第一節擴展型博弈的表述二、擴展型博弈的表述擴展型擴展的是策略型中的策略,有六個要素:

1、局中人集合;

2、局中人的行動順序;

3、局中人的行動空間;

4、局中人的信息集;

5、支付函數;

6、外生事件的概率分布。

第一節擴展型博弈的表述1、結點(nodes)2、枝(branches):行動3、信息集(informationset):(1)同一個局中人的一些結點構成的集合;(2)表示博弈到了這個集合,但不知到了這個集合的哪一個結點上。

三、博弈樹兩家房地產開發商A、B,考慮是否在同一地段開發寫字樓,各自面臨的選擇是開發還是不開發。房地產市場充滿了風險,風險來自市場需求的不確定性:需求可能大,也可能小。該博弈的行動順序為:(1)開發商A首先行動,選擇開發或者不開發;(2)在A決策后,自然選擇市場需求的大小;(3)開發商B在觀測到A的選擇和市場需求后,決定開發或不開發。

例3.1房地產開發博弈

開發°不開發NN

大小大小BBBB開發不開發開發不開發開發不開發開發不開發

房地產開發博弈的博弈樹

開發

°不開發

N

N

大小大小

B

B

B

B開發不開發開發不開發開發不開發開發不開發

房地產開發博弈的博弈樹

開發

°不開發

N

N

大小大小

B

B

B

B開發不開發開發不開發開發不開發開發不開發

房地產開發博弈的博弈樹1、完美信息(perfect

information)博弈是指博弈中所有信息集都是單點集。在完美信息博弈中,一次只有一個局中人在行動,而且他在行動時知道博弈所有以往行動的歷史。2、完美回憶(perfect

recall)博弈是指沒有局中人會忘記自己所知道的信息,所有局中人都記得自己以往的行動選擇。

四、完美信息博弈與完美回憶博弈一、以房地產開發博弈為例說明從擴展型表述構造出策略型表述,從而求出納什均衡。擴展型擴展型博弈納什均衡博弈策略型策略型博弈納什均衡二、局中人的策略是關于行動的一個完整的計劃,它明確了在局中人可能會遇到的各種情況下對可行行動的選擇。

第二節擴展型博弈的納什均衡例題:房地產開發博弈

A

開發不開發

BB

開發不開發開發不開發(-3,-3)(1,0)(0,1)(0,0)

第二節擴展型博弈的納什均衡

三、擴展型博弈的納什均衡B

A(開,開)(開,不)(不,開)(不,不)開發不開

三、擴展型博弈的納什均衡B

A(開,開)(開,不)(不,開)(不,不)開發-3,-3-3,-31,01,0不開0,10,00,10,0

三、擴展型博弈的納什均衡B

A(開,開)(開,不)(不,開)(不,不)開發-3,-3-3,-31,01,0不開0,10,00,10,0

此博弈有三個納什均衡:(開發,(不開發,開發))(開發,(不開發,不開發))(不開發,(開發,開發))

三、擴展型博弈的納什均衡

1、定義擴展型博弈的策略2、定義擴展型博弈的納什均衡

三、擴展型博弈的納什均衡1、有限擴展型博弈:擴展型博弈有有限個信息集,每個信息集上只有有限個行動。2、定理:(Zemelo,1913;Kuhn,1953)完美信息有限擴展型博弈存在純策略納什均衡。

四、有限擴展型博弈一、子博弈:稱G1是G的一個子博弈,如果滿足:

1、子博弈G1是原博弈G的一部分;

2、子博弈G1必須從單結信息集開始;

3、子博弈G1的信息集和支付向量都繼承自原博弈G。

第三節子博弈完美納什均衡房地產開發博弈有三個子博弈,除原博弈外,還有:

BB

開發不開發開發不開發(-3,-3)(1,0)(0,1)(0,0)

G1G2

例3.1房地產開發博弈的子博弈二、子博弈完美納什均衡(SubgameperfectNashEquilibrium)擴展型博弈的一個策略組合是子博弈完美納什均衡當且僅當它在每一個子博弈上都構成納什均衡。

第三節子博弈完美納什均衡三、子博弈完美納什均衡的求法

1、定義

2、逆向歸納法(BackwardInduction)——完美信息有限博弈

第三節子博弈完美納什均衡例3.1、房地產開發博弈的子博弈完美納什均衡:

——定義求法

——逆向歸納法求法

四、舉例房地產開發博弈

A

開發不開發

BB

開發不開發開發不開發(-3,-3)(1,0)(0,1)(0,0)

子博弈完美納什均衡的求法房地產開發博弈

A

開發不開發

BB不開發開發不開發(1,0)(0,1)(0,0)

子博弈完美納什均衡的求法房地產開發博弈

A

開發不開發

B

B不開發開發(1,0)(0,1)

子博弈完美納什均衡的求法房地產開發博弈

A

開發不開發

BB不開發開發(1,0)(0,1)

子博弈完美納什均衡的求法

局中人:廠商1,廠商2

策略:廠商1先行動,選擇產量去q1;廠商2觀察到q1

后,選擇自己的產量q2.假設:價格

支付(利潤)函數:

例3.2兩寡頭產量競爭的Stackelberg(1934)模型

用逆向歸納法求出子博弈完美納什均衡:

(1)

Stackelberg

模型求解

代入(1)式得:

Stackelberg

模型求解子博弈完美納什均衡:與Cournot模型的納什均衡比較:子博弈完美納什均衡納什均衡><動態博弈時,廠商1有先動優勢。

Stackelberg

模型求解

局中人:廠商1,廠商2

策略:廠商1先行動,選擇價格p1;廠商2觀察到p1

后,選擇自己的價格p2。支付(利潤)函數:

例3.3完全信息動態下的Bertrand模型

用逆向歸納法求出子博弈完美納什均衡:

(1)動態Bertrand模型求解

代入(1)式得:動態Bertrand模型求解

子博弈完美納什均衡:與Bertrand模型的納什均衡比較:取a=2,b=1,c=2子博弈完美納什均衡納什均衡>>

<

>

動態博弈時,廠商2有后動優勢。動態Bertrand模型求解利用逆向歸納法求解出的子博弈完美納什均衡的結果與現實存在一定的差異,受到了一些學者的批評。其中最著名的是蜈蚣博弈及其實驗。

五、逆向歸納法的不足

小寶C大寶C小寶C大寶C小寶C大寶CSS

S

S

S

S

例3.4蜈蚣博弈

小寶C大寶C小寶C大寶C大寶CSS

S

S

S

例3.5蜈蚣博弈一、重復博弈:同樣結構的博弈重復多次。

1、重復博弈的基本特征:(1)單次博弈之間沒有實質聯系,即前一階段的博弈不改變其它階段的博弈結構;(2)所有局中人能夠觀測并記憶以往的博弈歷史;(3)局中人的總支付為各階段支付的貼現值之和或者加權平均值。

第四節重復博弈2、影響重復博弈均衡結果的主要因素:(1)博弈重復的次數;(2)信息的完備性。

一、重復博弈1、有限次重復博弈的子博弈完美納什均衡

——以囚徒困境為例

二、有限次重復博弈2、定理:以階段博弈G構成的重復T次(T<∞)的重復博弈中,如果G中僅存在唯一的納什均衡,那么重復博弈G(T)的唯一子博弈完美均衡是階段博弈的唯一納什均衡重復T次。每次博弈結局都是該納什均衡。

二、有限次重復博弈3、如果階段博弈中有多個納什均衡,那么在有限次重復博弈中非納什均衡的結局就有可能出現。

二、有限次重復博弈1、無限次重復博弈的子博弈完美納什均衡以囚徒困境為例,證明“冷酷策略”是一個子博弈完美納什均衡。“冷酷策略”:開始選擇不坦白;選擇不坦白直到對方選擇了坦白,然后自己永遠選擇坦白。

三、無限次重復博弈2、無名氏定理:(Friedman,

1971)在以n人博弈G為階段博弈的無限重復博弈G(,)中,如果為G的一個納什均衡,e=(e1,e2,…,en)為對應的均衡支付向量,v=(v1,v2,…,vn)為任意可行支付向量,V為可行支付向量集合,那么,對于任何滿足vi>ei的v(對每個i),存在一個貼現因子<1使得對于所有的,v=(v1,v2,…,vn)是一個特定的子博弈完美均衡的支付向量。

三、無限次重復博弈

無名氏定理的含義:在無限次重復博弈中,如果局中人有足夠的耐心(即足夠大),那么,任何滿足個人理性的可行的支付向量都可以通過一個特定的子博弈完美均衡而實現。

三、無限次重復博弈經濟博弈論基礎

EconomicGameTheory第二部分非合作博弈理論

第二章策略型博弈第三章擴展型博弈第四章貝葉斯博弈第五章動態貝葉斯博弈

主要內容第一節動態貝葉斯博弈第二節完美貝葉斯納什均衡第三節

信號傳遞博弈第四節

重復博弈與聲譽模型

第五章動態貝葉斯博弈

——不了解對手,行動有先有后時,如何決策

第一節動態貝葉斯博弈動態貝葉斯博弈的含義:動態貝葉斯博弈即不完全信息動態博弈,其含義是:自然首先選擇局中人的類型,局中人自己知道,其他局中人不知道;自然選擇之后,局中人開始行動,局中人的行動有先有后,后行動者能夠觀察到先行動者的行動,但不能觀察到先行動者的類型。

第一節動態貝葉斯博弈動態貝葉斯博弈的含義:但是每個局中人的行動是類型依存的,每個局中人的行動都傳遞著有關自己類型的某種信息,后行動者就可以通過觀察到的先行動者的行動來推斷其類型或修正對其類型的先驗信念(概率分布),然后選擇自己的最優行動。先行動者預測到自己的行動將被后行動者所利用,就會設法選擇傳遞對自己最有利的信息,避免傳遞對自己不利的信息。

第一節動態貝葉斯博弈動態貝葉斯博弈的博弈過程不僅是局中人選擇行動的過程,而且是局中人不斷修正信念的過程。一、基本思路動態貝葉斯博弈的完美貝葉斯納什均衡是Selten的完全信息動態博弈中子博弈完美納什均衡和Harsanyi

的不完全信息靜態博弈中貝葉斯納什均衡的結合。

第二節完美貝葉斯納什均衡

策略型博弈

Harsanyi

貝葉斯博弈(完全信息靜態博弈)(不完全信息靜態博弈)(納什均衡)貝葉斯化(貝葉斯納什均衡)

Selten完美化Selten完美化

(子博弈)

(后續博弈)

擴展型博弈動態貝葉斯博弈(完全信息動態博弈)(不完全信息動態博弈)

(子博弈完美納什均衡)貝葉斯化(完美貝葉斯納什均衡)

第二節完美貝葉斯納什均衡三、完美貝葉斯納什均衡要求給定有關其他局中人的類型的信念,局中人的策略在每一個信息集開始的“后續博弈”(即從本信息集開始的博弈剩余部分)上構成貝葉斯納什均衡;并且,在所有可能的情況下,局中人使用貝葉斯法則修正有關其他局中人的類型的信念。

第二節完美貝葉斯納什均衡四、動態貝葉斯博弈要素分析

1、局中人:n個

2、類型:局中人i的類型

,θi是私人信息;

3、先驗概率:是類型為θi的局中人i認為其他局中人屬于

的先驗概率。

4、策略空間(行動組合):是在信息集h上局中人i觀察到的其他n-1個局中人的行動組合,它是策略組合的一部分。

第二節完美貝葉斯納什均衡四、動態貝葉斯博弈要素分析

5、后驗概率:是局中人i在信息集h上觀察到其他n-1個局中人的行動組合后認為其他n-1個局中人

屬于θ-i

的后驗概率;

6、支付函數:是i的支付函數。

第二節完美貝葉斯納什均衡五、完美貝葉斯納什均衡定義

完美貝葉斯納什均衡是一個策略組合和一個后驗概率組合,滿足:(P)對于所有的局中人i,在每個信息集h上,

(B)是局中人i觀測到和最優策略后,使用貝葉斯法則從先驗概率得到的。

第二節完美貝葉斯納什均衡例1:完美貝葉斯納什均衡是{M,

U;

p=1}1

LM[p]R[1-p](1,3)2UBUB(2,1)(0,0)(0,2)(0,1)

六、不完美信息博弈的完美貝葉斯納什均衡一、信號傳遞博弈

兩個局中人:1是信號發送者;2是信號接受者

不完全信息:

局中人1的類型是私人信息;局中人2的類型是公共信息(只有一個類型)

第三節

信號傳遞博弈信號傳遞博弈的順序

1、自然首先選擇局中人1的類型,1知道θ,2不知道,只知道1屬于θ的先驗概率是P=P(θ);2、局中人1觀測到自己的類型θ后發出信號;

3、局中人2觀測到1發出的信號m(但不是類型θ),使用貝葉斯法則從先驗概率P=P(θ)得到后驗概率,然后選擇行動。

4、支付函數分別為。

信號傳遞博弈的完美貝葉斯納什均衡是策略組合和后驗概率的組合,它滿足:(P1);(P2);(B)是局中人2使用貝葉斯法則從先驗概率P(θ)、觀測到的信號m和局中人1的最優策略得到的。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論