策略型博弈總結課件_第1頁
策略型博弈總結課件_第2頁
策略型博弈總結課件_第3頁
策略型博弈總結課件_第4頁
策略型博弈總結課件_第5頁
已閱讀5頁,還剩143頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

博弈論與信息經濟學

GameTheoryandInformationEconomics第二部分非合作博弈理論

博弈論與信息經濟學

GameTheoryandIn第二章策略型博弈第三章擴展型博弈第四章貝葉斯博弈第五章動態貝葉斯博弈

主要內容第二章策略型博弈主要內容第一節策略型博弈的表示第二節重復剔除嚴格劣策略均衡第三節

納什均衡第四節

混合策略納什均衡第五節納什均衡的存在性

第二章策略型博弈

——同時行動,如何決策第一節策略型博弈的表示第二章策略型博弈

策略型(標準型)表述

——適合表示靜態博弈擴展型表述

——適合表示動態博弈

博弈有兩種表述方法博弈有兩種表述方法一、策略型博弈的含義

完全信息靜態博弈又稱為策略型博弈。完全信息是指局中人對自己與其他局中人的所有與博弈有關的事前信息(策略空間、支付函數等)有充分的了解(局中人的支付函數是共同知識)。靜態博弈是指在博弈中,局中人同時采取行動,或者局中人的行動有先有后,但后行動者不能知道先行動者的行動選擇。

第一節策略型博弈的表示一、策略型博弈的含義第一節策略型博弈的表示

二、策略型博弈的三個要素:

1、局中人(Players):1,2,…,n;2、策略(Strategies):

;3、支付函數(Payoff

functions)表示為:

第一節策略型博弈的表示二、策略型博弈的三個要素:第一節策略型博弈的表示

1、有限博弈:

(1)博弈中局中人人數有限;

(2)每個局中人只有有限個策略。

2、零和博弈:博弈中局中人所獲支付之和為零,即一方所得為另一方所失。

三、兩種特殊博弈類型1、有限博弈:三、兩種特殊博弈類型1、局中人:甲,乙2、策略:{坦白,不坦白}3、支付函數——支付矩陣(雙人有限博弈)每個位置上第一個數字表示局中人1在對應的策略組合中得到的支付,第二個數字表示局中人2的相應所獲支付。例2.1囚徒困境及其策略型表示

(Tucker,1950)1、局中人:甲,乙例2.1囚徒困境及其策略型表示

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2囚徒困境的支付矩陣

乙坦白不坦白坦白-6,-6-1,

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1例2.2石頭、剪刀、布的支付矩陣

乙石頭剪刀布石頭0,01,-1-

田忌齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3例2.3田忌賽馬的支付矩陣

田忌上中下上下中中上下中下上下上中下中上上中

局中人:男,女

策略:男:看足球,看芭蕾女:看足球,看芭蕾

支付矩陣:見下一頁

例2.4性別大戰(battleofthesexes)局中人:男,女例2.4性別大戰(battleo

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

性別大戰的支付矩陣女足球芭蕾足球3,21,1芭一、基本思想:

如果一個局中人在任何情況下從某種策略中得到的支付均小于從另一種策略中得到的支付,那么顯然對他而言,前一種策略劣于后一種策略。從個人利益出發,被剔除的策略不會被局中人采用。從而可以利用剔除嚴格劣策略的概念來簡化博弈局勢,可能會得到博弈的解。第二節

重復剔除嚴格劣策略均衡一、基本思想:第二節重復剔除嚴格劣策略均衡

,如果存在,對于所有的都有且其中至少有一個為嚴格不等式,則稱是第i個局中人的一個嚴格劣策略。

二、嚴格劣策略的定義,如果存在1、根據理性的局中人不會選擇嚴格劣策略這一原則,可以通過重復剔除嚴格劣策略的方法對博弈進行求解。

2、其方法是:對每個局中人尋找嚴格劣策略,由于它不會被局中人選擇實施,所以找到一種后就可以將其從博弈局勢中剔除,從而得到一種新的縮減后的博弈局勢,對這種新局勢重復上述過程,直到無法找到新的嚴格劣策略為止。

三、重復剔除嚴格劣策略1、根據理性的局中人不會選擇嚴格劣策略這一原則,可以通過

對局中人甲而言,無論局中人乙采取何種策略,采用“不坦白”策略得到的支付都小于采用“坦白”策略。局中人甲的“不坦白”策略嚴格劣于“坦白”策略.“不坦白”策略都是一種嚴格劣策略,從而可以剔除。博弈中局中人各自從自身利益出發的理性選擇(博弈均衡解)就是(坦白,坦白)。

四、囚徒困境的解對局中人甲而言,無論局中人乙采取何種策略,采用“不

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2例2.1囚徒困境的支付矩陣

甲:“不坦白”相對于“坦白”是嚴格劣策略

乙坦白不坦白坦白-6,-6-1,-8不

乙甲坦白不坦白坦白-6,-6-1,-8乙:“不坦白”相對于“坦白”是嚴格劣策略

乙坦白不坦白坦白-6,-6-1,

乙甲坦白坦白-6,-6乙坦白坦白-6,-6·例2.5

利用重復剔除嚴格劣策略求解

乙甲左中右上1,01,20,1下0,30,12,0·例2.5利用重復剔除嚴格劣策略求解乙·乙:“右”相對于“中”是嚴格劣策略

乙甲左中右上1,01,20,1下0,30,12,0·乙:“右”相對于“中”是嚴格劣策略乙·甲:“下”相對于“上”是嚴格劣策略

乙甲左中上1,01,2下0,30,1·甲:“下”相對于“上”是嚴格劣策略乙·乙:“左”相對于“中”是嚴格劣策略

乙甲左中上1,01,2·乙:“左”相對于“中”是嚴格劣策略乙·重復剔除嚴格劣策略均衡是(上,中)

乙甲中上1,2·重復剔除嚴格劣策略均衡是(上,中)乙1、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把這一過程應用到任意多步,需要假定“局中人是理性的”是共同知識。2、這一方法對博弈結果的預測經常是不準確的.

五、重復剔除嚴格劣策略有兩個缺陷1、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0例2.2石頭、剪刀、布的支付矩陣

利用重復剔除嚴格劣策略無法求解

乙石頭剪刀布石頭0,01,-1-例2.6

利用重復剔除嚴格劣策略無法求解

乙甲左中右上0,44,05,3中4,00,45,3下3,53,56,6例2.6利用重復剔除嚴格劣策略無法求解大多數的博弈局勢中使用剔除嚴格劣策略的方法能夠對博弈局勢進行簡化,但可能得不到博弈的均衡解。需要引入非合作博弈理論中的核心概念

——納什均衡(NashEquilibrium)。

六、注意六、注意一、納什均衡的思想

“雙贏”或“多贏”

第三節納什均衡一、納什均衡的思想第三節納什均衡它是關于博弈結局的一致性預測如果所有局中人預測一個特定的納什均衡會出現,那么這種均衡就會出現。只有納什均衡才能使每個局中人均認可這種結局,而且他們均知道其他局中人也認可這種結局。二、納什均衡的意義它是關于博弈結局的一致性預測二、納什均衡的意義

1、博弈的納什均衡是這樣一種最優策略組合,是一種你好、我好大家都好的理性結局,其中每一個局中人均不能也不想單方面改變自己的策略而增加收益,每個局中人選擇的策略是對其他局中人所選策略的最佳反應。

三、納什均衡的定義1、博弈的納什均衡是這樣一種最優策略組合

2、數學定義:在策略型博弈中,如果對于每個局中人i,存在,都有

則稱策略組合是此博弈G的一個納什均衡。三、納什均衡的定義2、數學定義:三、納什均衡的定義1、雙人有限博弈:雙劃線法

首先對局中人2的每一個策略,局中人1尋找支付最大的策略,在其對應支付下劃線;然后對局中人1進行相應的步驟;最后,凡是兩個局中人支付下均被劃線的結局就是納什均衡。四、納什均衡的求法1、雙人有限博弈:雙劃線法四、納什均衡的求法用雙劃線法可以求出納什均衡:(坦白,坦白),(-6,-6)意義:揭示個人理性與集體理性之間的矛盾。

例2.1

囚徒困境的納什均衡用雙劃線法可以求出納什均衡:例2.1囚徒困境的納什均衡

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

局中人:大豬,小豬策略:大豬:按,等待小豬:按,等待支付矩陣:見下一頁納什均衡:(按,等待)

例2.7智豬博弈(boxedpigs)局中人:大豬,小豬例2.7智豬博弈(boxed

小豬大豬按等待按5,14,4等待9,-10,0

例2.7智豬博弈的支付矩陣小豬按等待按5,14,4等待9,-10

小豬大豬按等待按5,14,4等待9,-10,0小豬按等待按5,14,4等待9,-10

小豬大豬按等待按5,14,4等待9,-10,0小豬按等待按5,14,4等待9,-10

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

例2.4性別大戰博弈的支付矩陣女足球芭蕾足球3,21,1芭蕾-1

女男足球芭蕾足球3,21,1芭蕾-1,-12,3女足球芭蕾足球3,21,1芭蕾-1

女男足球芭蕾足球3,21,1芭蕾-1,-12,3女足球芭蕾足球3,21,1芭蕾-1

局中人:甲,乙

策略:甲:放左手,放右手乙:猜左手,猜右手

支付矩陣:見下一頁沒有納什均衡

例2.8猜左右手游戲局中人:甲,乙例2.8猜左右手游戲

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,-

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,2、連續性博弈納什均衡的求法首先求出每個局中人對其他局中人策略組合的反應函數——即在其他局中人策略組合給定時極大化自己的支付,得到的最佳反應策略表現為其他局中人策略組合的函數;然后將這些反應函數聯立求解即得到博弈的納什均衡解。四、納什均衡的求法2、連續性博弈納什均衡的求法四、納什均衡的求法

局中人:廠商1,廠商2

策略:廠商1:選擇產量

廠商2:選擇產量

假設:價格

支付函數(利潤函數):

例2.9兩寡頭產量競爭Cournot(1838)模型局中人:廠商1,廠商2例2.9兩寡頭

Cournot模型求解Cournot模型求解

反應函數:

納什均衡:

Cournot模型求解反應函數:Cournot模型求解

假設兩寡頭可以串謀,共同確定產量Q使總利潤最大化,利潤函數為:(Q)=Q(a-Q-c)

總利潤最大的產量為:——稱為契約曲線總利潤為:

比較及含義:

兩寡頭產量串謀模型假設兩寡頭可以串謀,共同確定產量Q使總利潤最大化,

Q1

廠商2的反應曲線

納什均衡

契約曲線廠商1的反應曲線

OQ2

圖1反應曲線、納什均衡與契約曲線Q1圖1反局中人:廠商1,廠商2策略:廠商1選擇價格;廠商2選擇價格假設:兩寡頭固定成本都為0,邊際成本為常數c,

消費者對廠商1和2生產產品的需求量分別為:;例2.10兩寡頭價格競爭Bertrand(1883)模型局中人:廠商1,廠商2例2.10兩寡頭價格競爭Bert支付(利潤)函數:

最優化的一階條件是:

Bertrand(1883)模型及求解支付(利潤)函數:Bertrand(1883)模型及求解

反應函數:

納什均衡價格:

Bertrand(1883)模型及求解反應函數:Bertrand(1883)模型及求解在n個局中人的策略型博弈中,

1、如果重復剔除嚴格劣策略剔除掉除策略組合s以外的所有策略,則這一策略組合s為該博弈的唯一的納什均衡。

2、如果策略組合s是一個納什均衡,那么它就不會被重復剔除嚴格劣策略所剔除。納什均衡是比重復剔除嚴格劣策略更強的解概念。五、納什均衡與重復剔除嚴格劣策略均衡在n個局中人的策略型博弈中,五、納什均衡與重

一、舉例說明混合策略納什均衡

例2.8猜左右手游戲

第四節混合策略納什均衡

乙甲(q)猜左手(1-q)猜右手(p)放左手-1,

11,

-1(1-p)放右手1,

-1-1,

1一、舉例說明混合策略納什均衡第四節混合策略納什均衡

在甲選,乙選這種策略時,他們的期望效用分別為:

混合策略與期望效用在甲選甲和乙的目標是:最優化的一階條件是:

混合策略納什均衡甲和乙的目標是:混合策略納什均衡

混合策略納什均衡為:

混合策略納什均衡混合策略納什均衡1、混合策略(mixedStrategy)

局中人i的一個混合策略是在其純策略空間上的一個概率分布,其中是i選擇策略

的概率。局中人i的混合策略空間是他的所有混合策略構成的集合。

純策略可以理解為混合策略的特例。如等價于

二、混合策略納什均衡1、混合策略(mixedStrategy)二、混合策

在混合策略組合下,局中人i的期望效用函數為:

其中

2、期望效用函數在混合策略組合下,局中人

在策略型博弈中,如果對于每個局中人i,存在,都有

則稱是博弈G的一個混合策略納什均衡。3、混合策略納什均衡在策略型博弈

奇數定理(Wilson1971):幾乎所有的有限博弈都有奇數個納什均衡。

4、奇數定理奇數定理(Wilson1971):幾乎所有的例2.11社會保障博弈

局中人:政府和下崗工人

策略:政府:救濟,不救濟下崗工人:找工作,不找工作

支付矩陣為:

三、應用舉例例2.11社會保障博弈三、應用舉例

工人政府找工作不找救濟3,2-1,3不救濟-1,10,0工人找工作不找救濟3,2-1,3不救濟-1,

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

求出性別大戰博弈的混合策略納什均衡女足球芭蕾足球3,21,1芭蕾-1

定理1:(Nash,

1950)每個有限策略型博弈至少存在一個納什均衡(純策略的或混合策略的)。

第五節納什均衡的存在性定理1:(Nash,1950)每個有限策

Brouwer不動點定理:如果X是非空的有界閉凸集,f(x)是X到自身的連續映射,那么至少存在一個xX,使得f(x)=x,x稱為不動點。

Kakutani不動點定理:設f(X)是點集X上的一個集值映射,如果X是非空的有界閉凸集,并且對于所有的xX,f(x)是非空的、凸的且上半連續的,那么至少存在一個xX,使得xf(x),x稱為不動點。

納什均衡的存在性證明Brouwer不動點定理:如果X是非空的有界

1、集值映射:對于集合X上的任何一個點x,如果f(x)給出唯一的一個點yY,則f(x)稱為從X到Y的映射;如果f(x)給出一個集合f(x)Y,則f(x)稱為從X到Y的集值映射。映射是集值映射的特例。

2、上半連續:設f(x)是X到自身的一個集值映射,如果對于所有的xX和包含f(x)的開集V,都存在x的一個鄰域U,使得對于所有的xU,有f(x)V,則稱f(x)是上半連續的。

注:集值映射和上半連續1、集值映射:對于集合X上的任何一個點x,如果f(

定理2:(Debreu,

1952

;Glicksberg,1952

;Fan,

1952)在n人策略型博弈中,如果每個局中人的純策略空間Si是歐氏空間中的一個非空的有界閉凸集,支付函數ui(s)是連續的且對si是擬凹的,那么該博弈存在一個純策略納什均衡。

定理3:(Glicksberg,1952)在n人策略型博弈中,如果每個局中人的純策略空間Si是歐氏空間中的一個非空的有界閉凸集,支付函數ui(s)是連續的,那么該博弈存在一個混合策略納什均衡。

定理1的推廣:從有限到無限定理2:(Debreu,1952;Glicks博弈論與信息經濟學

GameTheoryandInformationEconomics第二部分非合作博弈理論

博弈論與信息經濟學

GameTheoryandIn第二章策略型博弈第三章擴展型博弈第四章貝葉斯博弈第五章動態貝葉斯博弈

主要內容第二章策略型博弈主要內容第一節策略型博弈的表示第二節重復剔除嚴格劣策略均衡第三節

納什均衡第四節

混合策略納什均衡第五節納什均衡的存在性

第二章策略型博弈

——同時行動,如何決策第一節策略型博弈的表示第二章策略型博弈

策略型(標準型)表述

——適合表示靜態博弈擴展型表述

——適合表示動態博弈

博弈有兩種表述方法博弈有兩種表述方法一、策略型博弈的含義

完全信息靜態博弈又稱為策略型博弈。完全信息是指局中人對自己與其他局中人的所有與博弈有關的事前信息(策略空間、支付函數等)有充分的了解(局中人的支付函數是共同知識)。靜態博弈是指在博弈中,局中人同時采取行動,或者局中人的行動有先有后,但后行動者不能知道先行動者的行動選擇。

第一節策略型博弈的表示一、策略型博弈的含義第一節策略型博弈的表示

二、策略型博弈的三個要素:

1、局中人(Players):1,2,…,n;2、策略(Strategies):

;3、支付函數(Payoff

functions)表示為:

第一節策略型博弈的表示二、策略型博弈的三個要素:第一節策略型博弈的表示

1、有限博弈:

(1)博弈中局中人人數有限;

(2)每個局中人只有有限個策略。

2、零和博弈:博弈中局中人所獲支付之和為零,即一方所得為另一方所失。

三、兩種特殊博弈類型1、有限博弈:三、兩種特殊博弈類型1、局中人:甲,乙2、策略:{坦白,不坦白}3、支付函數——支付矩陣(雙人有限博弈)每個位置上第一個數字表示局中人1在對應的策略組合中得到的支付,第二個數字表示局中人2的相應所獲支付。例2.1囚徒困境及其策略型表示

(Tucker,1950)1、局中人:甲,乙例2.1囚徒困境及其策略型表示

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2囚徒困境的支付矩陣

乙坦白不坦白坦白-6,-6-1,

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1例2.2石頭、剪刀、布的支付矩陣

乙石頭剪刀布石頭0,01,-1-

田忌齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3例2.3田忌賽馬的支付矩陣

田忌上中下上下中中上下中下上下上中下中上上中

局中人:男,女

策略:男:看足球,看芭蕾女:看足球,看芭蕾

支付矩陣:見下一頁

例2.4性別大戰(battleofthesexes)局中人:男,女例2.4性別大戰(battleo

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

性別大戰的支付矩陣女足球芭蕾足球3,21,1芭一、基本思想:

如果一個局中人在任何情況下從某種策略中得到的支付均小于從另一種策略中得到的支付,那么顯然對他而言,前一種策略劣于后一種策略。從個人利益出發,被剔除的策略不會被局中人采用。從而可以利用剔除嚴格劣策略的概念來簡化博弈局勢,可能會得到博弈的解。第二節

重復剔除嚴格劣策略均衡一、基本思想:第二節重復剔除嚴格劣策略均衡

,如果存在,對于所有的都有且其中至少有一個為嚴格不等式,則稱是第i個局中人的一個嚴格劣策略。

二、嚴格劣策略的定義,如果存在1、根據理性的局中人不會選擇嚴格劣策略這一原則,可以通過重復剔除嚴格劣策略的方法對博弈進行求解。

2、其方法是:對每個局中人尋找嚴格劣策略,由于它不會被局中人選擇實施,所以找到一種后就可以將其從博弈局勢中剔除,從而得到一種新的縮減后的博弈局勢,對這種新局勢重復上述過程,直到無法找到新的嚴格劣策略為止。

三、重復剔除嚴格劣策略1、根據理性的局中人不會選擇嚴格劣策略這一原則,可以通過

對局中人甲而言,無論局中人乙采取何種策略,采用“不坦白”策略得到的支付都小于采用“坦白”策略。局中人甲的“不坦白”策略嚴格劣于“坦白”策略.“不坦白”策略都是一種嚴格劣策略,從而可以剔除。博弈中局中人各自從自身利益出發的理性選擇(博弈均衡解)就是(坦白,坦白)。

四、囚徒困境的解對局中人甲而言,無論局中人乙采取何種策略,采用“不

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2例2.1囚徒困境的支付矩陣

甲:“不坦白”相對于“坦白”是嚴格劣策略

乙坦白不坦白坦白-6,-6-1,-8不

乙甲坦白不坦白坦白-6,-6-1,-8乙:“不坦白”相對于“坦白”是嚴格劣策略

乙坦白不坦白坦白-6,-6-1,

乙甲坦白坦白-6,-6乙坦白坦白-6,-6·例2.5

利用重復剔除嚴格劣策略求解

乙甲左中右上1,01,20,1下0,30,12,0·例2.5利用重復剔除嚴格劣策略求解乙·乙:“右”相對于“中”是嚴格劣策略

乙甲左中右上1,01,20,1下0,30,12,0·乙:“右”相對于“中”是嚴格劣策略乙·甲:“下”相對于“上”是嚴格劣策略

乙甲左中上1,01,2下0,30,1·甲:“下”相對于“上”是嚴格劣策略乙·乙:“左”相對于“中”是嚴格劣策略

乙甲左中上1,01,2·乙:“左”相對于“中”是嚴格劣策略乙·重復剔除嚴格劣策略均衡是(上,中)

乙甲中上1,2·重復剔除嚴格劣策略均衡是(上,中)乙1、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把這一過程應用到任意多步,需要假定“局中人是理性的”是共同知識。2、這一方法對博弈結果的預測經常是不準確的.

五、重復剔除嚴格劣策略有兩個缺陷1、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0例2.2石頭、剪刀、布的支付矩陣

利用重復剔除嚴格劣策略無法求解

乙石頭剪刀布石頭0,01,-1-例2.6

利用重復剔除嚴格劣策略無法求解

乙甲左中右上0,44,05,3中4,00,45,3下3,53,56,6例2.6利用重復剔除嚴格劣策略無法求解大多數的博弈局勢中使用剔除嚴格劣策略的方法能夠對博弈局勢進行簡化,但可能得不到博弈的均衡解。需要引入非合作博弈理論中的核心概念

——納什均衡(NashEquilibrium)。

六、注意六、注意一、納什均衡的思想

“雙贏”或“多贏”

第三節納什均衡一、納什均衡的思想第三節納什均衡它是關于博弈結局的一致性預測如果所有局中人預測一個特定的納什均衡會出現,那么這種均衡就會出現。只有納什均衡才能使每個局中人均認可這種結局,而且他們均知道其他局中人也認可這種結局。二、納什均衡的意義它是關于博弈結局的一致性預測二、納什均衡的意義

1、博弈的納什均衡是這樣一種最優策略組合,是一種你好、我好大家都好的理性結局,其中每一個局中人均不能也不想單方面改變自己的策略而增加收益,每個局中人選擇的策略是對其他局中人所選策略的最佳反應。

三、納什均衡的定義1、博弈的納什均衡是這樣一種最優策略組合

2、數學定義:在策略型博弈中,如果對于每個局中人i,存在,都有

則稱策略組合是此博弈G的一個納什均衡。三、納什均衡的定義2、數學定義:三、納什均衡的定義1、雙人有限博弈:雙劃線法

首先對局中人2的每一個策略,局中人1尋找支付最大的策略,在其對應支付下劃線;然后對局中人1進行相應的步驟;最后,凡是兩個局中人支付下均被劃線的結局就是納什均衡。四、納什均衡的求法1、雙人有限博弈:雙劃線法四、納什均衡的求法用雙劃線法可以求出納什均衡:(坦白,坦白),(-6,-6)意義:揭示個人理性與集體理性之間的矛盾。

例2.1

囚徒困境的納什均衡用雙劃線法可以求出納什均衡:例2.1囚徒困境的納什均衡

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

局中人:大豬,小豬策略:大豬:按,等待小豬:按,等待支付矩陣:見下一頁納什均衡:(按,等待)

例2.7智豬博弈(boxedpigs)局中人:大豬,小豬例2.7智豬博弈(boxed

小豬大豬按等待按5,14,4等待9,-10,0

例2.7智豬博弈的支付矩陣小豬按等待按5,14,4等待9,-10

小豬大豬按等待按5,14,4等待9,-10,0小豬按等待按5,14,4等待9,-10

小豬大豬按等待按5,14,4等待9,-10,0小豬按等待按5,14,4等待9,-10

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

例2.4性別大戰博弈的支付矩陣女足球芭蕾足球3,21,1芭蕾-1

女男足球芭蕾足球3,21,1芭蕾-1,-12,3女足球芭蕾足球3,21,1芭蕾-1

女男足球芭蕾足球3,21,1芭蕾-1,-12,3女足球芭蕾足球3,21,1芭蕾-1

局中人:甲,乙

策略:甲:放左手,放右手乙:猜左手,猜右手

支付矩陣:見下一頁沒有納什均衡

例2.8猜左右手游戲局中人:甲,乙例2.8猜左右手游戲

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,-

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,2、連續性博弈納什均衡的求法首先求出每個局中人對其他局中人策略組合的反應函數——即在其他局中人策略組合給定時極大化自己的支付,得到的最佳反應策略表現為其他局中人策略組合的函數;然后將這些反應函數聯立求解即得到博弈的納什均衡解。四、納什均衡的求法2、連續性博弈納什均衡的求法四、納什均衡的求法

局中人:廠商1,廠商2

策略:廠商1:選擇產量

廠商2:選擇產量

假設:價格

支付函數(利潤函數):

例2.9兩寡頭產量競爭Cournot(1838)模型局中人:廠商1,廠商2例2.9兩寡頭

Cournot模型求解Cournot模型求解

反應函數:

納什均衡:

Cournot模型求解反應函數:Cournot模型求解

假設兩寡頭可以串謀,共同確定產量Q使總利潤最大化,利潤函數為:(Q)=Q(a-Q-c)

總利潤最大的產量為:——稱為契約曲線總利潤為:

比較及含義:

兩寡頭產量串謀模型假設兩寡頭可以串謀,共同確定產量Q使總利潤最大化,

Q1

廠商2的反應曲線

納什均衡

契約曲線廠商1的反應曲線

OQ2

圖1反應曲線、納什均衡與契約曲線Q1圖1反局中人:廠商1,廠商2策略:廠商1選擇價格;廠商2選擇價格假設:兩寡頭固定成本都為0,邊際成本為常數c,

消費者對廠商1和2生產產品的需求量分別為:;例2.10兩寡頭價格競爭Bertrand(1883)模型局中人:廠商1,廠商2例2.10兩寡頭價格競爭Bert支付(利潤)函數:

最優化的一階條件是:

Bertrand(1883)模型及求解支付(利潤)函數:Bertrand(1883)模型及求解

反應函數:

納什均衡價格:

Bertrand(1883)模型及求解反應函數:Bertrand(1883)模型及求解在n個局中人的策略型博弈中,

1、如果重復剔除嚴格劣策略剔除掉除策略組合s以外的所有策略,則這一策略組合s為該博弈的唯一的納什均衡。

2、如果策略組合s是一個納什均衡,那么它就不會被重復剔除嚴格劣策略所剔除。納什均衡是比重復剔除嚴格劣策略更強的解概念。五、納什均衡與重復剔除嚴格劣策略均衡在n個局中人的策略型博弈中,五、納什均衡與重

一、舉例說明混合策略納什均衡

例2.8猜左右手游戲

第四節混合策略納什均衡

乙甲(q)猜左手(1-q)猜右手(p)放左手-1,

11,

-1(1-p)放右手1,

-1-1,

1一、舉例說明混合策略納什均衡第四節混合策略納什均衡

在甲選,乙選這種策略時,他們的期望效用分別為:

混合策略與期望效用在甲選甲和乙的目標是:最優化的一階條件是:

混合策略納什均衡甲和乙的目標是:混合策略納什均衡

混合策略納什均衡為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論