




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
教案5教案5――第二章完全信息靜態(tài)博弈 #教案4教學(xué)題目:(第一章完全信息靜態(tài)博弈,§2—§3)學(xué)時(shí)數(shù)2教學(xué)目的和要求:理解Nash均衡的表達(dá)。掌握Nash均衡的應(yīng)用。教學(xué)基本內(nèi)容:基本方法:理解Nash均衡的表達(dá)。掌握Nash均衡的應(yīng)用。教學(xué)重點(diǎn)與難點(diǎn):重點(diǎn)在于Nash均衡的應(yīng)用;難點(diǎn)在于例2.6的討論。教學(xué)過(guò)程:課前復(fù)習(xí)理解博弈均衡的概念。講授新課:§2.2Nash均衡我們?cè)僖郧敉嚼Ь碁槔懻撊缦拢呵敉紹坦白囚徒B抗拒囚徒A坦白-6,-60,-10囚徒A抗拒-10,0-1,-1顯然,不論囚徒A選擇坦白還是抗拒,囚徒B的最優(yōu)策略都是坦白;不論囚徒B選擇坦白還是抗拒,囚徒A的最優(yōu)策略都是坦白;由收益函數(shù):UA(抗拒,坦白)=」10;UA(坦白,坦白)=-6;
UA(抗拒,抗拒)=—1;UA(坦白,抗拒)=0。UB(抗拒,坦白)=0;UB(坦白,坦白)=-6;
UB(抗拒,抗拒)=—;UB(坦白,抗拒)=—10。UA(坦白,。)>UA(抗拒O);Ub(O,坦白)>Ub(O,抗拒);這時(shí),“坦白”策略就成為囚徒A,B的嚴(yán)格優(yōu)策略,如果一個(gè)博弈中的所有局中人都存在嚴(yán)格優(yōu)策略,那么由這些嚴(yán)格優(yōu)策略組成的局勢(shì),就是該博弈的惟一均衡解。在囚;困境中的囚徒A,B的嚴(yán)格優(yōu)策略“坦白”組成的局勢(shì)(坦白,坦白)就是該博弈的惟-均衡解記S斗=(仆2,…,s^,s加…,Sn),則局勢(shì)s^Ss?,…,S斗S,S如…,Sn)=(s,sJES=3宀咒S。定義2—2(嚴(yán)格優(yōu)策略)在n人博弈G=N,S,U沖,除局中人i夕卜,其余n—1個(gè)局中人的所有可能的局勢(shì)s_j=(q,s2,…,第,s十,…,sn),局中人i存在著一個(gè)自己的策略s*,使得對(duì)一切的SiES(Si式s),有**Ui(Si,S_J=Ui(si,s2,…,匚,s,sm…,sj>Ui(q,…,Si「’,Sn)=Ui(Si,St),則稱S*?Si是局中人i的嚴(yán)格優(yōu)策略。囚徒A,B在囚徒困境中都有自己儼格優(yōu)策略“坦白”組成的局勢(shì)(坦白,坦白)為該博弈的惟一均衡解。這種現(xiàn)象是一般規(guī)律嗎?命題2—1在n人博弈G=〈N,S,U〉中,如果每一個(gè)局中人都有自己的嚴(yán)格優(yōu)策略s*(i=1,…,n),那么,n個(gè)局中人每人的嚴(yán)格優(yōu)策略組成的局勢(shì)s*=(s*,…,s*,…,s;)是博弈G=〈N,S,U)的惟一均衡解并稱S*=(s*,…,S*,…,s;)為嚴(yán)格優(yōu)策略均衡局勢(shì)或嚴(yán)格優(yōu)策略均衡解。證明:由以上的討論,n個(gè)局中人的嚴(yán)格優(yōu)策略組成的局勢(shì)*=(『??■,s*,…,s;)是博弈G=(N,S,U〉的一個(gè)均衡解。如果博弈G=〈N,S,U〉有兩個(gè)均衡解s*,s**,則至少有一個(gè)局中人j有兩個(gè)嚴(yán)*************格優(yōu)策略Sj, Sj ,設(shè)S=(s,…,Sj,…,sn), s= (s,,…,Sj ,…,sj.因?yàn)閟*是局中人j的嚴(yán)格優(yōu)策略所以***(1) Uj(S)>Uj(S);又因?yàn)镾j也是局中人j的嚴(yán)格優(yōu)策略所以***⑵ Uj(sp"Uj(s).結(jié)合(1)(2)兩式有:****Uj(S)>Uj(S)=Uj(S), 、,******此為矛盾因此,Sj=Sj.從而S=S,即解是唯一的口定義2—4(優(yōu)策略)在n人博弈G=〈N,S,U〉中,除局中人i外,其余n—1個(gè)局中人的所有可能的局
勢(shì)s」=(q,s2,…,s」s扣…,sn),局中人i存在著一個(gè)自己的策略s*,使得對(duì)一切的s€S,有Ui(s*,s_J=Ui(3,s2,…,s*,s和…,sn)>Ui(s「…,Si,…,Sn)=Ui(s,S」),并且局中人i至少存在著一個(gè)自己的策略s"eS,使得Ui(s*,s」)=Ui(s, ,Si“s*,s1, , sn) Ui(Si, ,Si, , Sn)二Ui(s, s」),則稱s?Si是局中人i的優(yōu)策略。顯然,嚴(yán)格優(yōu)策略一定是優(yōu)策略但在許多情況下,不要說(shuō)嚴(yán)格優(yōu)策略,就是優(yōu)策略都未必存在!我們以例2-1(獵鹿博弈)為例討論如下獵人B-獵鹿獵人B-獵兔獵人A-獵鹿何河0,1獵人A-獵兔1,0I1, □由收益函數(shù):UAUA(獵鹿,獵鹿)=10;UA(獵鹿,獵兔)=0;UB(獵鹿,獵鹿)=10;UB(獵鹿,獵兔)=0;UA(獵兔,獵鹿)=1;UA(獵兔,獵兔)=1UB(獵兔,獵鹿)=1;UB(獵兔,獵兔)=1但是,UA(獵鹿,o)>uA(獵兔,。)不成立,因?yàn)閁A(獵鹿,獵鹿)=10>UA(獵兔,獵鹿)=1;UA(獵鹿,獵兔)=0<UA(獵兔,獵兔)=1;因此,獵人A沒(méi)有優(yōu)策略,更沒(méi)有嚴(yán)格優(yōu)策略。對(duì)獵人B的討論也同樣沒(méi)有優(yōu)策略
但卻存在兩個(gè)Nash均衡解。博弈解的第一組值為(10,10)(雙值),對(duì)應(yīng)博弈的解為(獵鹿,獵鹿);博弈解的第二組值為(1, 1)(雙值),對(duì)應(yīng)博弈的解為(獵兔獵兔),它們都是Nash均衡,即此博弈有2個(gè)解,或兩個(gè)均衡點(diǎn)。問(wèn)題是:這兩個(gè)解應(yīng)當(dāng)如何去看?如果將博弈改為獵人乙-獵鹿獵人乙-獵兔獵人甲-獵鹿10,100,1獵人甲-獵兔1,00,0請(qǐng)同學(xué)們發(fā)表意見。毛澤東的思考Ua(獵鹿,Ua(獵鹿,獵鹿)=10;Ua(獵兔,獵鹿)=0;Ua(獵鹿,獵兔)=1;Ua(獵兔,獵兔)=0Ub(獵鹿,獵鹿)=10;Ub(獵兔,獵鹿)=1;Ub(獵鹿,獵兔)=0;Ub(獵兔,獵兔)=0<Ua(獵鹿,?)>Ua(獵兔,?)成立,顯然,因?yàn)閁A(獵鹿,獵鹿)=10>UA(獵兔,獵鹿)=1;UA(獵鹿,獵兔)=1>UA(獵兔,獵兔)=0;因此,獵人A有嚴(yán)格劣策略’獵兔”同理,獵人B也有嚴(yán)格劣策略“昔兔”我們?cè)谏鲜龌臼街刑蕹龂?yán)格劣策略,我們就只剩下一個(gè)均衡解:
獵人B孑昔鹿獵人A-獵鹿10,10我們?yōu)槭裁匆钯Y本主義的尾巴?智豬博弈產(chǎn)生了,我的經(jīng)歷:獵鹿博弈=智豬博弈=囚徒困境例2-2斗雞博弈首先,依據(jù)情景描述寫出博弈的基本式再列出博弈雙方的收益矩陣雙矩陣)飛車黨黨徒B讓飛車黨黨徒B撞飛車黨黨徒A讓—10—10—10+10飛車黨黨徒A撞+10—10——OO ——OO最后,用相對(duì)優(yōu)勢(shì)策略的劃線法求解飛車黨黨徒B讓飛車黨黨徒B撞飛車黨黨徒A讓—10—10飛車黨黨徒A撞+0—10——OO ——OO博弈解的第一組值為(一10,+10)(雙值),對(duì)應(yīng)博弈的解為(讓,撞);博弈解的第二組值為(+10,—10)(雙值),對(duì)應(yīng)博弈的解為(撞讓),它們都是Nash均衡,即此博弈有2個(gè)解,或兩個(gè)均衡點(diǎn)。例2-3雙寡頭壟斷博弈(Cournot模型(1838年))首先,依據(jù)情景描述寫出博弈的基本式;再列出博弈雙方的收益矩陣雙矩陣)企業(yè)乙-定咼價(jià)企業(yè)乙-定低價(jià)企業(yè)甲-定咼價(jià)1000,1000500, 1500企業(yè)甲-定低價(jià)1500, 500700, 700最后,用相對(duì)優(yōu)勢(shì)策略的劃線法求解企業(yè)乙-定咼價(jià)企業(yè)乙-定低價(jià)企業(yè)甲-定咼價(jià)1000,1000500, 1500企業(yè)甲-定低價(jià)〔1500, 500匝,殛博弈的值為(700,700)(雙值),對(duì)應(yīng)博弈的解為(低價(jià),低價(jià));它是Nash均衡。思考它與哪一個(gè)博弈是一致的?例2—4(雙人抬物)
博弈G「博弈G「N,S,U的基本式為局中人的集合N={1,2};策略空間S1S,=收益函數(shù):Ui(出力,出力)=v-c?0,U1(出力,不出力)=v-2c::0,U1(不出力,出力)=v0,U1(不出力,不出力)=0。容易看出局中人1的偏好序?yàn)椋海ú怀隽Γ隽Γ福ǔ隽Γ隽Γ┤菀卓闯鼍种腥?的偏好序?yàn)椋海ǔ隽Γ怀隽Γǔ隽Γ隽Γ╋@然,兩局中人均有{出力,不出力}X{出力,不出力;U2(出力,出力)=v-c?0,U2(出力,不出力)=v-2s0,
U2(出力,不出力)=v0,U2(不出力,不出力)=0。(不出力,不出力)—(出力,不出力);(不出力,不出力)-(不出力,出力);U1(不出力>U1(出力,O),U2(不出力U2(出力,。);即,選擇“不出力”是兩局中人的嚴(yán)格優(yōu)策略,因此,惟一的Nash均衡為(不出力,不出力)博弈的值為(0,0)。我們還可以用劃線法解決:局中人2出力局中人2不出力局中人1出力v—C,v—Cv-2c,v局中人1不出力v,v-2c0,0討論:例2—5(雙人抬物)和哪一個(gè)博弈一致?關(guān)于道德風(fēng)險(xiǎn);如何從技術(shù)上改變這種情況?例2-6(雙虎爭(zhēng)獵物)博弈G「N,S,U的基本式為局中人的集合N二{A,B};策略空間S=SASB={堅(jiān)持,放棄堅(jiān)持,放棄;收益函數(shù):Ua(堅(jiān)持,堅(jiān)持)=UB(堅(jiān)持,堅(jiān)持0,Ua(堅(jiān)持,放棄)=UB(放棄,堅(jiān)持)=f0,Ua(放棄,堅(jiān)持)=Ub(堅(jiān)持,放棄)=0,Ua(放棄,放棄)=ue}(放棄,,放棄)=0。容易看出兩老虎沒(méi)有嚴(yán)格優(yōu)策略,我們還是用劃線法解決:老虎B堅(jiān)持老虎B放棄老虎A堅(jiān)持—C,一cf,0老虎A放棄0,f0,0因此,Nash均衡為(堅(jiān)持,放棄)和(放棄,堅(jiān)持),博弈的值分別為(f,0)和(0,f)。討論:例2-10和哪一個(gè)博弈一致?現(xiàn)實(shí)中有何意義?例2—7(情侶分歧)博弈G=N,S,U的基本式為局中人的集合N={甲(男),乙(女)};策略空間S二S乙二{古典音樂(lè),流行音樂(lè)古典音樂(lè),流行音樂(lè)}收益函數(shù)用矩陣表示為:乙-古典音樂(lè)乙-流行音樂(lè)甲一古典音樂(lè)a,b0,0甲一流行音樂(lè)0,0b,a,用劃線法解決:乙-古典音樂(lè)乙-流行音樂(lè)甲一古典音樂(lè)a,b0,0甲一流行音樂(lè)0,0因此,Nash均衡為(古典音樂(lè),古典音樂(lè))和(流行音樂(lè),流行音樂(lè))博弈的值分別為(a,b)和小,a),(O^b^a)。討論:例2—7和哪一個(gè)博弈一致?協(xié)調(diào)型博弈在現(xiàn)實(shí)中有何意義?(總收益高)例2—8(公共產(chǎn)品的提供一一集資建橋博弈G“N,S,U的基本式為局中人的集合N二{1,2,…,n};策略空間S2 Sn-{出資,不出資}乂……x{出資,不出資;收益函數(shù)根據(jù)參加出資的人數(shù)有不同的情況:1)出資人數(shù)k二n(人人出資才能建橋)5=u2「二un(出資,……,出資)T-t0,出資居民i的收益Uj(至少有一個(gè)人不出資)=t舟0,不出資居民j的收益Uj(至少有一個(gè)人不出資)=0。我們簡(jiǎn)化問(wèn)題為兩個(gè)局中人的情況:局中人j出資局中人j不出資局中人i出資V-1,V-1-t,o局中人i不出資o, -t0,0因此,Nash均衡為(出資,……,出資)和(不出資,……,不出資)2)出資人數(shù)kn如果恰有k個(gè)居民出資而n-k個(gè)居民不出資。有2種情況,討論如下:如果已經(jīng)有k-1個(gè)居民出資而n-k個(gè)居民不出資,局中人將選擇出資:k-1個(gè)局中人出資,n-k個(gè)局中人不出資局中人i出資v-1>0局中人i不出資0如果已經(jīng)有k個(gè)居民出資而n-k-1個(gè)居民不出資k個(gè)局中人出資,n-kT個(gè)局中人不出資局中人i出資v-1a0局中人i不出資vNash均衡出現(xiàn)了:(k個(gè)居民出資,n-k個(gè)居民不出資);根據(jù)組合的知識(shí),這樣的均衡共有Ck種。如果已經(jīng)有0咗mk-1個(gè)居民出資,那么局中人的選擇是不出資,因?yàn)?蘭m*k-1個(gè)局中人出資局中人i出資-t局中人i不出資0由于每一個(gè)局中人面對(duì)m(0乞m”:kT)個(gè)局中人出資時(shí),必選擇不出資,因此,Nash均衡為(不出資,……,不出資。對(duì)m(m-k)個(gè)居民出資,局中人的選擇是不出資,因?yàn)閙(m-k)個(gè)局中人出資
局中人i出資v-1局中人i不出資vNash均衡出現(xiàn)了:(k個(gè)居民出資,n-k個(gè)居民不出資);綜上所述,這樣的均衡共有2+C;種。討論:1.通過(guò)例2-7,談?wù)劶Y建設(shè)和公共產(chǎn)品如何攤派和收取集資款?例2-8(經(jīng)濟(jì)學(xué)著名例子:公共地悲劇n個(gè)牧民共同擁有一片草地,每年,他們?cè)谶@片草地上放牧養(yǎng)羊。設(shè)牧民i放牧的羊?yàn)閝j(i=0,1/,n,…)只,則全體牧民養(yǎng)羊G=q q? qn照看一只羊的平均成本為c,當(dāng)草地上有G只羊時(shí),牧民養(yǎng)每只羊的價(jià)值為v(G)(v(G)0)。假設(shè)使草地上草的生長(zhǎng)和羊群達(dá)到平衡的羊的只數(shù)為imax,如果羊的數(shù)量超過(guò)了Gmax,必將使草地的生態(tài)受到損害,從而使整個(gè)羊群不能吃飽,使羊的值v(G)下降(此地將自變量3看作連續(xù)變量),這就可以用數(shù)學(xué)語(yǔ)言來(lái)表達(dá)為(1)dV(1)dV0,dG4<odG2公共地悲劇博弈W二N,S,U的基本式為局中人的集合N二{1,2, ,n};策略空間S2 Sn=[0,x……x[0,,);收益函數(shù):Uj(q,…,q「…,qn)=v(G)qj-cq1蘭i蘭n.博弈問(wèn)題:每一個(gè)牧民如何確定自己羊群的數(shù)量(i=1/,n),以獲得自己的最大收益(僅僅考慮個(gè)人利益的最大化?根據(jù)微積分的知識(shí),這需要去求n元函數(shù)Uj(q[,…,q,…,qn)的極值,而方法是先求n個(gè)變量的偏導(dǎo)數(shù):-Ui dvdG dv芥呵①^拓亦一^心^詰一。(T「n).再令v(G)qidV=c(i「, ,n),dG當(dāng)v(G)為已知函數(shù)時(shí),由以上n個(gè)方程,可以解出n個(gè)數(shù)q;,…,q;,則得到Nash均衡局勢(shì)(q;,…,qn)=q。記我們以n二3,v(G)二kG=k(q1q2q3)為例,有3個(gè)方程構(gòu)成的方程組:2q^q^q3=c/kq「2q2q3=c/kg+q2+2q3二c/k解出qi二q2=q3C4k為簡(jiǎn)單起見,我們進(jìn)一步假設(shè)這1個(gè)牧民的基本情況相同,因此,我們不妨設(shè)q;=q*(仁i乞n),則n個(gè)收益函數(shù)成為Uj(q,…4,…,qn)二v(nq口一cq1G蘭n,于是據(jù)(2)式,v(G*)q*v(G*)=c仁i乞n,1*]**v(G) -Gv(G)=c.n那么,為什么稱作公共地悲劇呢?這n個(gè)牧民的總收益函數(shù)是⑶ U=nUj=nqv(G)-ncq=Gv(G)-cG.這n個(gè)牧民在Nash均衡q*下的總收益是(4) U=nUinqiv(G)-ncqi二Gv(G)-cG如果這塊草地是由政府管理的,專家認(rèn)定最佳的放牧量是*=Gmax,即F*是使得收益最優(yōu)的值,即(5)收益最優(yōu)的值,即(5)F*二maxU,或?qū)σ磺械目偸找鍶冬F(xiàn)根據(jù)極值的必要條件應(yīng)當(dāng)有9^4=0(邊際收益=邊際成本)從(3)式推得dGdU
dG二dU
dG二v(G)Gv(G)-c,代入執(zhí)廠0有:v(F*)F*v(F*)二c.H(G)二v(G)Gv(G),我們首先有H(G)二2v(G)Gv(G):0.所以函數(shù)H(G)是遞減的,其次H(G*)-H(F*)二v(G*)G*v(G*)-[v(F*)F*v(F*)]二v(G*)G*v(G*)-c1* * * * I * *二v(G)Gv(G)-[v(G)Gv(G)]nn-1Gv(G) 0.n我們得到H(G*)::H(F*),即**GF.牧民在均衡處的羊多于專家設(shè)定的羊的最佳數(shù)量,又由于1*是使得收益函數(shù)取得最大值的點(diǎn),有:U*g*蘭U*F* ?公共地悲劇指出:如果每個(gè)牧民僅僅考慮個(gè)人利益的最大化那么,在Nash均衡(q;,…,q;)二q*處羊群的數(shù)量G*大,但不如羊群為F*的收益,而且,草地將退化,所以生產(chǎn)應(yīng)當(dāng)是有組織的公共資源應(yīng)當(dāng)科學(xué)地開發(fā)怎么組織學(xué)問(wèn)很深!公共地悲劇(P.87)公共衛(wèi)生一一國(guó)家資源一一 例2-9(密封式二級(jí)價(jià)格拍賣密封式二級(jí)價(jià)格拍賣——規(guī)則介紹分析局中人的集合:N二{1,2, ,n};策略集A=(0,g)(i=1,2,…,n),策略空間:A=A4…A;局勢(shì):{sA|^(b1,b2/,bn)}是一個(gè)無(wú)限集。收益函數(shù):Uj(s)=?-sbi=1,2,…,n。表示為局中人12oooiooon標(biāo)的物價(jià)值ViV2oooVioooVn競(jìng)拍報(bào)價(jià)bb2ooobooobn收益VifoooV-bj°oooVn-S為討論方便,除第個(gè)局中人的報(bào)價(jià)b外,把其余的n-1個(gè)局中人報(bào)價(jià)的最大值記作眄刈口}=bj°我們討論如下:fb=Vi£bj°徑b“]bj05=v二Ui=v-bb>0.biVibjo:brtbjo口<? =5r-S>0bibjoVi:.TOC\o"1-5"\h\z\o"CurrentDocument"v「bj bj =Ui二w-% 0 :\o
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 質(zhì)押車轉(zhuǎn)讓協(xié)議書
- 增股東期權(quán)協(xié)議書
- 階段性補(bǔ)償協(xié)議書
- 房產(chǎn)被委托協(xié)議書
- 委托書鑒定協(xié)議書
- 大平臺(tái)建設(shè)協(xié)議書
- 按揭未還清協(xié)議書
- 理療館加盟協(xié)議書
- 屋頂瓦維護(hù)協(xié)議書
- 房子對(duì)半分協(xié)議書
- Unit6RainorShine課文知識(shí)填空2024-2025學(xué)年人教版英語(yǔ)七年級(jí)下冊(cè)
- 三力老人測(cè)試題及答案
- 更換外窗施工方案
- 四年級(jí)下冊(cè)道德與法制全冊(cè)電子教案?jìng)湔n
- 《食源性疾病》課件
- JJF(鄂)149-2025 電力行業(yè)碳計(jì)量技術(shù)規(guī)范 火電機(jī)組碳排放量化
- 2025年春統(tǒng)編版語(yǔ)文一年級(jí)下冊(cè)第八單元單元任務(wù)群整體公開課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 《房顫教學(xué)查房》課件
- 臨床試驗(yàn)流程培訓(xùn)
- 清理脫硫塔施工方案
- 2025年軍隊(duì)文職考試《公共科目》試題與參考答案
評(píng)論
0/150
提交評(píng)論