第三講_混合策略納什均衡_第1頁
第三講_混合策略納什均衡_第2頁
第三講_混合策略納什均衡_第3頁
第三講_混合策略納什均衡_第4頁
第三講_混合策略納什均衡_第5頁
已閱讀5頁,還剩48頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 主講人:李美娟主講人:李美娟 引言引言有些博弈不存在納什均衡,或者納什均衡不唯有些博弈不存在納什均衡,或者納什均衡不唯一,如猜硬幣博弈,前述納什均衡分析就無法一,如猜硬幣博弈,前述納什均衡分析就無法對博弈方的選擇和博弈結果作明確的預測。對博弈方的選擇和博弈結果作明確的預測。這部分對不存在納什均衡和存在多個納什均衡這部分對不存在納什均衡和存在多個納什均衡的博弈作一些討論。的博弈作一些討論。混合策略的引進混合策略的引進一、撲克牌對色游戲一、撲克牌對色游戲-1, 11, -11, -1-1, 1紅紅黑黑乙乙甲甲紅紅黑黑不存在前面定義的納什均衡策略組合。不存在前面定義的納什均衡策略組合。這類博弈很多

2、,引出混合策略納什均衡概念。這類博弈很多,引出混合策略納什均衡概念。混合策略的相關概念混合策略的相關概念混合策略是一種按照什么概率選擇這個純策略、混合策略是一種按照什么概率選擇這個純策略、按照什么概率選擇那種純策略的策略選擇指示。按照什么概率選擇那種純策略的策略選擇指示。混合策略表明:參與人可以按照一定的概率,隨混合策略表明:參與人可以按照一定的概率,隨機地從純策略集合中選擇一種純策略的實際行動機地從純策略集合中選擇一種純策略的實際行動。期望值:假定存在期望值:假定存在 個可能的取值個可能的取值 ,并且這些取值發生的概率分別為:并且這些取值發生的概率分別為: ,則期,則期望值為:望值為: n1

3、2, ,nX XX12,np pp1122nnp Xp Xp X 小孩玩的游戲小孩玩的游戲“石頭,剪子,布石頭,剪子,布”,也是一種博弈。但是,這個博弈有一,也是一種博弈。但是,這個博弈有一種有趣的特征,即給定一方的任何選擇種有趣的特征,即給定一方的任何選擇,另一方都有制勝對方的戰略,因而這,另一方都有制勝對方的戰略,因而這個戰略不是最優的。任何個戰略不是最優的。任何“純戰略純戰略”都都不是最優的,純戰略是不是最優的,純戰略是“石頭,剪子,石頭,剪子,布布”中的任何一個。中的任何一個。石頭、剪刀、布石頭、剪刀、布0, 01, -1 -1, 1-1, 11, -10, 01, -1-1, 10,

4、 0石石 頭頭剪剪 子子布布博弈方博弈方2 2石石 頭頭剪剪 子子布布博博弈弈方方1 但是,我們知道,玩這個游戲總是但是,我們知道,玩這個游戲總是以對方不易猜出的隨機方式出招。事實以對方不易猜出的隨機方式出招。事實上,可以通過數學證明,當雙方都以每上,可以通過數學證明,當雙方都以每個戰略按個戰略按1/3的概率出招時,達成一種的概率出招時,達成一種雙方都不愿改變這種概率分布的局面。雙方都不愿改變這種概率分布的局面。這被稱為這被稱為“混合戰略納什均衡混合戰略納什均衡”,而這,而這種以隨機方式選擇純戰略的博弈被稱為種以隨機方式選擇純戰略的博弈被稱為“混合戰略博弈混合戰略博弈”。 以混合戰略博弈我們來

5、看下面幾個以混合戰略博弈我們來看下面幾個例子。例子。 例子例子1 為什么一般人總是小錯不斷,大為什么一般人總是小錯不斷,大錯不犯;偷稅漏稅的一般是中小企業,錯不犯;偷稅漏稅的一般是中小企業,大企業會老老實實地交稅?大企業會老老實實地交稅? 稅務部門不會對所有企業的交稅情稅務部門不會對所有企業的交稅情況每一次都去檢查,因為這樣做的成本況每一次都去檢查,因為這樣做的成本太高,得不償失。所以,稅務部門總是太高,得不償失。所以,稅務部門總是隨機地對企業的交稅情況進行檢查。隨機地對企業的交稅情況進行檢查。 企業也是隨機地在交稅與偷漏稅之企業也是隨機地在交稅與偷漏稅之間進行選擇。稅收部門與企業間進行的間進

6、行選擇。稅收部門與企業間進行的是混合戰略博弈。因為如果企業總是交是混合戰略博弈。因為如果企業總是交稅,稅務部門就最好不檢查;但給定不稅,稅務部門就最好不檢查;但給定不檢查,企業就會偷漏稅。所以,兩者只檢查,企業就會偷漏稅。所以,兩者只有在隨機地檢查與不檢查,企業隨機地有在隨機地檢查與不檢查,企業隨機地在偷漏稅與交稅之間選擇,才會達成均在偷漏稅與交稅之間選擇,才會達成均衡。衡。 對于大企業,因一旦偷稅數額就巨大,所對于大企業,因一旦偷稅數額就巨大,所以,稅務部門在隨機檢查時放在大企業上的可以,稅務部門在隨機檢查時放在大企業上的可能性就大一些;而給定稅務部門檢查大企業的能性就大一些;而給定稅務部門

7、檢查大企業的可能性較大,大企業偷漏稅的行為就較少,否可能性較大,大企業偷漏稅的行為就較少,否則就容易被逮個正著。所以,偷漏稅較多的就則就容易被逮個正著。所以,偷漏稅較多的就是一些中小企業,大企業納稅的積極性較高。是一些中小企業,大企業納稅的積極性較高。同樣的道理,在犯罪或對錯誤的監督懲罰博弈同樣的道理,在犯罪或對錯誤的監督懲罰博弈中,也是混合博弈,人們可能總是大錯不犯小中,也是混合博弈,人們可能總是大錯不犯小錯不斷。錯不斷。 例子例子2 田忌賽馬新編田忌賽馬新編 春秋戰國時期,齊威王常與旗下大將田春秋戰國時期,齊威王常與旗下大將田忌賽馬。規則是:每次賽三局,每一局齊威王忌賽馬。規則是:每次賽三

8、局,每一局齊威王與田忌各出一匹馬比賽奔跑速度。每一局中的與田忌各出一匹馬比賽奔跑速度。每一局中的勝者贏敗方一千斤銅。田忌有上、中、下三匹勝者贏敗方一千斤銅。田忌有上、中、下三匹馬,而齊威王也有上、中、下三匹馬。每次比馬,而齊威王也有上、中、下三匹馬。每次比賽,第一局田忌出上馬,齊威王也出上馬;第賽,第一局田忌出上馬,齊威王也出上馬;第二局田忌出中馬,齊威王也出中馬;第三局,二局田忌出中馬,齊威王也出中馬;第三局,田忌出下馬,齊威王也出下馬。齊威王的上馬田忌出下馬,齊威王也出下馬。齊威王的上馬比田忌的上馬好,齊威王的中馬也比田忌的中比田忌的上馬好,齊威王的中馬也比田忌的中馬好,齊威王的下馬還是比

9、田忌的下馬好。于馬好,齊威王的下馬還是比田忌的下馬好。于是,每次比賽的結果都是田忌連輸三局。是,每次比賽的結果都是田忌連輸三局。 田忌的謀士孫臏了解了田忌的困境田忌的謀士孫臏了解了田忌的困境后,就打聽到這樣一個消息:盡管齊威后,就打聽到這樣一個消息:盡管齊威王的上、中、下三匹馬都要比田忌的對王的上、中、下三匹馬都要比田忌的對應上、中、下三匹馬好,但碰巧的是田應上、中、下三匹馬好,但碰巧的是田忌的上馬可勝齊威王的中馬,田忌的中忌的上馬可勝齊威王的中馬,田忌的中馬可勝齊威王的下馬。于是,孫臏為田馬可勝齊威王的下馬。于是,孫臏為田忌獻計:下一次比賽中第一局時田忌出忌獻計:下一次比賽中第一局時田忌出下

10、馬對齊威王的上馬輸一局,第二局田下馬對齊威王的上馬輸一局,第二局田忌出上馬對齊威王的中馬,第三局田忌忌出上馬對齊威王的中馬,第三局田忌出中馬對齊威王的下馬,這樣可連贏兩出中馬對齊威王的下馬,這樣可連贏兩局,最后凈勝一千斤銅。田忌依計而行局,最后凈勝一千斤銅。田忌依計而行,果真贏回一千斤銅。,果真贏回一千斤銅。 這個故事曾經被很多人當作博弈論的例這個故事曾經被很多人當作博弈論的例子來演繹,但實際上這個故事與博弈論無關。子來演繹,但實際上這個故事與博弈論無關。博弈論會假定所有局中人都是理性的,不能假博弈論會假定所有局中人都是理性的,不能假定一些局中人聰明而另一些局中人卻是傻子。定一些局中人聰明而另

11、一些局中人卻是傻子。當田忌出下馬時,齊威王最好的選擇是出下馬當田忌出下馬時,齊威王最好的選擇是出下馬而不是上馬。孫臏的計謀中假定齊威王是傻子而不是上馬。孫臏的計謀中假定齊威王是傻子,當田忌出下、上、中馬時,他仍然按上、中,當田忌出下、上、中馬時,他仍然按上、中、下馬出,當然要輸了。事實上,當田忌出下、下馬出,當然要輸了。事實上,當田忌出下馬時,齊威王應出下馬,但齊威王出下馬時,馬時,齊威王應出下馬,但齊威王出下馬時,田忌不應出下馬而是出中馬,但此時齊威王又田忌不應出下馬而是出中馬,但此時齊威王又應出中馬而不是下馬了,應出中馬而不是下馬了,。這樣,博弈不。這樣,博弈不會有純戰略的均衡。會有純戰略

12、的均衡。 兩人只能玩混合戰略博弈,齊威兩人只能玩混合戰略博弈,齊威王分別以王分別以1/6隨機的概率選擇出上、中隨機的概率選擇出上、中、下馬的任一排列,田忌也如此。由于、下馬的任一排列,田忌也如此。由于齊威王存在絕對優勢,他平均看來仍然齊威王存在絕對優勢,他平均看來仍然會贏田忌一千斤銅。會贏田忌一千斤銅。 混合策略均衡混合策略均衡純策略與純策略納什均衡純策略與純策略納什均衡純策略:肯定會被選擇純策略:肯定會被選擇以以100%100%的概率的概率被被選擇的策略。選擇的策略。混合策略混合策略混合策略:以一定的概率分布選擇某幾個行動的混合策略:以一定的概率分布選擇某幾個行動的策略。策略。混合策略定義:

13、混合策略定義:在n人博弈的策略式表述 中,假定參與人 有K個純策略: ,那么,概率分布 稱為 的一個混合策略混合策略,這里 是 選擇 的概率,對于所有的 。nnuuSSG,;,11 i1,iiiKSSS1,iiiKpppi)(ikikspp iiks1, 10 , 11 KikikppKk 顯然,純策略可以理解為混合策略的特例,比如說,純策略 等價于混合策略 ,即選擇純策略 的概率為1,選擇任何其他純策略的概率為0。is0 , 0 , 1 ipis混合策略混合策略混合策略均衡混合策略均衡設設 是是n n人策略式博弈人策略式博弈的一個混合策略組合。如果對于所有的的一個混合策略組合。如果對于所有的

14、 , 對于每一個對于每一個 都成立,則稱混都成立,則稱混合策略組合合策略組合 是這個博弈的一是這個博弈的一個納什均衡。個納什均衡。 1(, , ,)inppppnnuuSSG,;,11 1,in ( ,)( ,)iiiiiiV p pV p pip1(, , ,)inpppp期望支付期望支付 例:例:參與人參與人1 1的混合策略:(的混合策略:(p,1-p)p,1-p) 參與人參與人2 2的混合策略:的混合策略:(q,1-q)(q,1-q)參與人參與人1的期望支付:的期望支付:如果參與人如果參與人1 1選擇選擇S S1111:如果參與人如果參與人1 1選擇選擇S S1212:EVEV1 1(p

15、,q)=p,q)=參與人參與人2 2的期望支付:的期望支付:EVEV2 2(p,q)=p,q)=u1,u2u3,u4u5,u6u7,u8參與參與人人2S11 pS12 1-pS21S22參與人參與人2q1-q13(1)quq u57(1)quq u1357(1) (1)(1) pququp ququ 2468(1) (1)(1) q pup uq pup u混合策略均衡混合策略均衡 例:監督博弈例:監督博弈給定工人偷懶,老板的最優給定工人偷懶,老板的最優選擇是監督;給定老板監督,選擇是監督;給定老板監督,工人的最優選擇是不偷懶;工人的最優選擇是不偷懶;給定工人不偷懶,老板的最給定工人不偷懶,老

16、板的最優選擇是不監督;給定老板優選擇是不監督;給定老板不監督,工人的最優選擇是不監督,工人的最優選擇是偷懶;如此循環。偷懶;如此循環。1,-1-1,2-2,32,2老板監督不監督偷懶不偷懶工人混合策略均衡混合策略均衡監督不監督偷懶不偷懶工人老板n 假定老板選擇混合戰略(0.5,0.5)n 工人選擇“偷懶”期望支付為 (-1)0.5+30.5=1n 工人選擇“不偷懶”期望支付為20.5+20.5=2n 工人應選擇“不偷懶” 老板選擇“不監督” 工人選擇“偷懶0.50.5n 假定老板選擇混合戰略(0.2,0.8)n 工人選擇“偷懶”期望支付為(-1)0.2+30.8=2.2n 工人選擇“不偷懶”(

17、期望)支付為20.2+20.8=2n 工人應選擇“偷懶” 老板選擇“監督” 工人選擇“不偷懶1,-1-1,2-2,32,2混合策略均衡混合策略均衡 什么情況下達到納什均衡狀態?n假定存在一個概率q,老板選擇混合策略(q,1-q)n工人選擇“偷懶”期望收益為(-1)q+3(1-q)=3-4qn工人選擇“不偷懶”收益為2n如果老板真的以概率q選擇監督,1-q選擇不監督,那么意味著他不會始終重復地選擇某個純策略,而他不重復選擇的條件必須是工人也不會重復地選擇純策略。 因此,老板以概率q選擇監督必然意味著在這種情況下工人沒有合適的純策略選擇。=老板的選擇必須使工人使工人在兩個純策略之間隨機選擇在兩個純

18、策略之間隨機選擇。n工人什么情況下隨機選擇?混合策略均衡混合策略均衡當工人選擇任何一個策略的期望支付相等時,只能隨機選擇。于是,3-4q=2 ,即q*=1/4,1- q*=3/4。這樣,當老板選擇(1/4,3/4)的混合戰略時,可以使工人在兩個純戰略之間無差異。 同理,假設工人選擇(p,1-p),(p,1-p)成為其最優混合戰略的條件是老板在選擇監督與選擇不監督之間無差異,即1p+(-1)(1-p)=(-2)p+2(1-p),即p*=1/2,1- p*=1/2。當老板選擇(1/4,3/4),工人選擇(1/2,1/2)時,剛好互為彼此的最優反應,達到納什均衡狀態,稱為混合戰略納什均衡。混合策略均

19、衡混合策略均衡參與人參與人1 1和參與人和參與人2 2的混合策略組合的混合策略組合 構成均構成均衡的必要條件:衡的必要條件:11(,)(,)V p qV p q22(,)(,)VpqVpq( , )p q混合戰略均衡的求解方法混合戰略均衡的求解方法方法方法1 1:支付最大化法:支付最大化法 給定其他參與人的混合戰略,自己選擇行動的給定其他參與人的混合戰略,自己選擇行動的概率分布要使自己期望支付最大化。概率分布要使自己期望支付最大化。q1-q1-pp工人的期望支付函數為(-1)pq+2(1-p)q+3p(1-q)+2(1-p)(1-q)=-4pq+p-2q+2最優化一階條件為:-4q+1=0 q

20、*=1/4給定工人的混合戰略為(p,1-p),老板的混合戰略為(q,1-q)支付最大化法求混合戰略納什均衡支付最大化法求混合戰略納什均衡1,-1-1,2-2,32,2老板監督不監督偷懶不偷懶工人混合戰略均衡的求解方法混合戰略均衡的求解方法方法方法2 2:支付等值法:支付等值法 自己選擇策略概率分布使對方不會偏好于任何行自己選擇策略概率分布使對方不會偏好于任何行動,即選擇每一個策略都會得到相同的收益。動,即選擇每一個策略都會得到相同的收益。例子例子例:博弈方例:博弈方1的混合策略(的混合策略(p,1-p) 博弈方博弈方2的混合策略(的混合策略(q,1-q)博弈方博弈方1:由由 可得可得 :q=0

21、.8博弈方博弈方2:由由 可得可得 :p=0.8 2, 35, 23, 11, 5CDAB博弈方博弈方2博博弈弈方方1=25(1)AVqq=3(1)BVqq=ABVV=3(1)CVpp =25(1)DVpp=CDVVn得雙方的策略及相應得益:其中,博弈方其中,博弈方1 1的期望得益為:的期望得益為:n博弈方博弈方2 2的期望得益為:的期望得益為:策略策略期望得益期望得益博弈方博弈方1(0.8,0.2)2.6博弈方博弈方2(0.8,0.2)2.611111,(1),(1),(1)(1),0.8 0.8 2 0.8 0.2 5 0.2 0.8 3 0.2 0.2 1 2.6eupqu ACpq u

22、 A Dp qu B Cpq u B D 12222,(1),(1),(1)(1),0.8 0.8 3 0.8 0.2 1 0.2 0.8 2 0.2 0.2 5 2.6eupqu ACpq u A Dp qu B Cpq u B D 多重均衡博弈和混合策略多重均衡博弈和混合策略一、夫妻之爭的混合策略納什均衡一、夫妻之爭的混合策略納什均衡首先,該博弈有兩個納什均衡,本博弈的兩個博弈方首先,該博弈有兩個納什均衡,本博弈的兩個博弈方不會害怕對方猜到自己的選擇,他們主觀上并不想隱不會害怕對方猜到自己的選擇,他們主觀上并不想隱藏自己的選擇。因此,該博弈中兩博弈方的決策思路藏自己的選擇。因此,該博弈中兩

23、博弈方的決策思路和原則應該與沒有納什均衡的嚴格競爭博弈有所不同和原則應該與沒有納什均衡的嚴格競爭博弈有所不同。2, 10, 00, 01, 3時時 裝裝足足 球球時裝時裝足球足球丈丈 夫夫妻妻子子夫妻之爭夫妻之爭但顯然,雙方的偏好不同,妻子喜歡前一個,丈夫喜歡但顯然,雙方的偏好不同,妻子喜歡前一個,丈夫喜歡后一個。故在純策略的范圍內,該博弈也是無法對兩博后一個。故在純策略的范圍內,該博弈也是無法對兩博弈方的選擇提出確定性建議,因此也需要考慮博弈方采弈方的選擇提出確定性建議,因此也需要考慮博弈方采用混合策略的可能性。用混合策略的可能性。設設p p和和1-p1-p分別為妻子選擇時裝表演和足球的概率

24、;分別為妻子選擇時裝表演和足球的概率;如果妻子不想讓丈夫利用自己的選擇傾向占上風,則自如果妻子不想讓丈夫利用自己的選擇傾向占上風,則自己的概率選擇應使丈夫選擇兩種策略的期望得益相同:己的概率選擇應使丈夫選擇兩種策略的期望得益相同:3-100-11)()(pppp得:得:p=3/4設設q q和和1-q1-q分別為丈夫選擇時裝表演和足球的概率。同分別為丈夫選擇時裝表演和足球的概率。同樣,如果丈夫不想讓妻子利用自己的選擇傾向占上風樣,如果丈夫不想讓妻子利用自己的選擇傾向占上風,則自己的概率選擇應使妻子選擇兩種策略的期望得,則自己的概率選擇應使妻子選擇兩種策略的期望得益相同:益相同:1)1 (00)1

25、 (2qqqq得:得:q=1/3夫妻之爭博弈的混合策略納什均衡夫妻之爭博弈的混合策略納什均衡 策略策略 得益得益妻子妻子 (0.75,0.25) 0.67丈夫丈夫 (1/3,2/3) 0.75可見,這個結果明顯不如夫妻雙方能交流協商可見,這個結果明顯不如夫妻雙方能交流協商時,任何一方遷就另一方的得益好。這是因為時,任何一方遷就另一方的得益好。這是因為缺乏溝通時可能出現最差的結果造成的。缺乏溝通時可能出現最差的結果造成的。也就是說,如果不強行設定雙方不能交流串通也就是說,如果不強行設定雙方不能交流串通的博弈規則,雙方決策時沒有被客觀或人為的的博弈規則,雙方決策時沒有被客觀或人為的原因隔離開來,也

26、沒有因為賭氣而采取不理性原因隔離開來,也沒有因為賭氣而采取不理性的態度,那么這種夫妻之間的決策問題一般不的態度,那么這種夫妻之間的決策問題一般不應該用上述博弈方式解決。應該用上述博弈方式解決。二、制式問題二、制式問題電器和電子設備往往有不同的原理或相關技術電器和電子設備往往有不同的原理或相關技術標準,稱之為不同的制式。標準,稱之為不同的制式。如果生產相關電器或電子設備的廠商采用相同如果生產相關電器或電子設備的廠商采用相同的制式,那么產品之間就能相互匹配,零配件的制式,那么產品之間就能相互匹配,零配件也可能相互通用,這對于推廣各自的產品和在也可能相互通用,這對于推廣各自的產品和在生產經營中進行合

27、作很有幫助。生產經營中進行合作很有幫助。設有兩個廠商同時計劃引進彩電生產線,而彩設有兩個廠商同時計劃引進彩電生產線,而彩電有電有A A、B B兩種不同的制式,那么這時候兩個廠兩種不同的制式,那么這時候兩個廠商之間就有一個選擇制式的博弈問題。商之間就有一個選擇制式的博弈問題。二、制式問題二、制式問題1, 30, 00, 02, 2ABAB廠商廠商2 2廠廠商商1 1制式問題制式問題 制式問題混合策略納什均衡制式問題混合策略納什均衡 A B 得益得益廠商廠商1 1: 0.4 0.6 0.664廠商廠商2 2: 0.67 0.33 1.296假定兩廠商采用不同的制式所能獲取的各自好假定兩廠商采用不同

28、的制式所能獲取的各自好處如下圖所示:處如下圖所示:三、市場機會博弈三、市場機會博弈-50, -50 100, 00, 1000, 0進進不不 進進進進不進不進廠商廠商2廠廠商商1市場機會市場機會 進進 不進不進 得益得益廠商廠商1 1: 2/3 1/3 0廠商廠商2 2: 2/3 1/3 0兩廠商同時發現一個市場機會,但這個市場的容量兩廠商同時發現一個市場機會,但這個市場的容量并不大,兩個廠商該如何選擇呢?并不大,兩個廠商該如何選擇呢?廠商廠商1 1的混合策略必須使廠商的混合策略必須使廠商2 2選擇進與不進的期望選擇進與不進的期望得益相同,廠商得益相同,廠商2 2 的情形類似。的情形類似。混合

29、策略反應函數混合策略反應函數反應函數:一博弈方對另一博弈方每種可能的反應函數:一博弈方對另一博弈方每種可能的決策內容的最佳反應決策構成的函數。決策內容的最佳反應決策構成的函數。n在純策略的范疇內,反應函數是各博弈方選擇的純在純策略的范疇內,反應函數是各博弈方選擇的純策略對其他博弈方純策略的反應;策略對其他博弈方純策略的反應;n在混合策略的范疇內,博弈方的決策內容為選擇概在混合策略的范疇內,博弈方的決策內容為選擇概率分布,反應函數就是一方對另一方的概率分布的率分布,反應函數就是一方對另一方的概率分布的反應,也是一定的概率分布。反應,也是一定的概率分布。n由于純策略可理解為混合策略,因此實際上反由

30、于純策略可理解為混合策略,因此實際上反應函數的概念,可以在混合策略概率分布之間應函數的概念,可以在混合策略概率分布之間反應的意義上統一起來。反應的意義上統一起來。法三:混合策略反應函數法三:混合策略反應函數猜硬幣博弈猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方猜硬幣方正面反面猜硬幣博弈猜硬幣博弈蓋蓋硬硬幣幣方方rq111/21/2)(2rRq )(1qRr (r,1-r):蓋硬幣方選擇正反面的混合策略概率分布:蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布:猜硬幣方選擇正反面的混合策略概率分布當q0.5時,取r為0當r0.5時

31、,取q為1夫妻之爭博弈夫妻之爭博弈2, 10, 00, 01, 3時裝時裝足球足球丈夫丈夫時裝時裝足球足球妻妻子子夫妻之爭夫妻之爭rq111/33/4)(2rRq )(1rRr (r,1-r):妻子的混合策略概率分布:妻子的混合策略概率分布(q,1-q):丈夫的混合策略概率分布:丈夫的混合策略概率分布當q1/3時,取r為1當r3/4時,取q為1混合戰略均衡混合戰略均衡 混合戰略要求人們以隨機的方式選擇自己的行混合戰略要求人們以隨機的方式選擇自己的行動,由于隨機性行為無法準確預期,因此很多人動,由于隨機性行為無法準確預期,因此很多人認為混合戰略并非一個令人滿意的均衡概念。現認為混合戰略并非一個令

32、人滿意的均衡概念。現實生活中人們真會這樣采取行動嗎?實生活中人們真會這樣采取行動嗎?如何解釋混合戰略?如何解釋混合戰略?參與人試圖通過選擇混合戰略給對手造成一種不參與人試圖通過選擇混合戰略給對手造成一種不確定性,使對手不能預測自己的行動。確定性,使對手不能預測自己的行動。如,猜硬幣、劃拳。混合戰略均衡混合戰略均衡對參與人類型的一種推斷。對參與人類型的一種推斷。如監督博弈,老板不知道工人的類型,只知道“勤奮”、“懶惰”型工人各占50%。老板在選擇自己 戰略時仿佛面臨的是一個選擇混合戰略的 工人。納什定理:納什定理:在一個由在一個由n n個博弈方的博弈個博弈方的博弈 中,如果中,如果n n是有限的

33、,且是有限的,且 S Si i 都是有限集都是有限集( (對對 i=1,n)i=1,n),則該博弈至少存在一個納什均衡,但可能包含混合策略。則該博弈至少存在一個納什均衡,但可能包含混合策略。奇數定理(奇數定理(Wilson,1971Wilson,1971):幾乎所有有限博弈都有有限):幾乎所有有限博弈都有有限奇數個納什均衡。奇數個納什均衡。納什均衡的存在性納什均衡的存在性,;,11nnuuSSG納什均衡的存在性納什均衡的存在性 占優均衡占優均衡 重復剔除的占優均衡重復剔除的占優均衡 純戰略純戰略NENE 混合戰略混合戰略NENEn前一個均衡是后一前一個均衡是后一個均衡的特例,后一個個均衡的特例

34、,后一個均衡是前一個的擴展。均衡是前一個的擴展。n上述四個均衡概念統稱上述四個均衡概念統稱為納什均衡。為納什均衡。占優均衡占優均衡重復剔除占優均衡重復剔除占優均衡純戰略納什均衡純戰略納什均衡混合戰略納什均衡混合戰略納什均衡多重均衡與協調多重均衡與協調 多重均衡的概念多重均衡的概念很多博弈具有多個納什均衡,比如以上講到的麥琪的禮物很多博弈具有多個納什均衡,比如以上講到的麥琪的禮物、性別戰等,稱為、性別戰等,稱為多重均衡。多重均衡。多重均衡降低博弈的解釋力多重均衡降低博弈的解釋力一方面無法知道哪個均衡一方面無法知道哪個均衡會出現,另一方面會發生真正出現的結果與均衡結果不一會出現,另一方面會發生真正

35、出現的結果與均衡結果不一致致在某些具有多重均衡的博弈中,各個博弈方偏好于不同的在某些具有多重均衡的博弈中,各個博弈方偏好于不同的均衡結果,如麥琪的禮物和性別博弈。均衡結果,如麥琪的禮物和性別博弈。那么,博弈方如何使自己偏好的均衡成為實際的均衡結果那么,博弈方如何使自己偏好的均衡成為實際的均衡結果呢?這就是呢?這就是多重均衡的協調問題多重均衡的協調問題。多重均衡與協調多重均衡與協調 帕累托上策均衡帕累托上策均衡風險上策均衡風險上策均衡聚點均衡聚點均衡相關均衡相關均衡一、帕累托上策均衡一、帕累托上策均衡有些博弈,雖然存在多個納什均衡,但這些納有些博弈,雖然存在多個納什均衡,但這些納什均衡可能有明顯

36、的什均衡可能有明顯的優劣差異優劣差異,所有博弈方都,所有博弈方都偏好其中同一個納什均衡。換句話說,可能有偏好其中同一個納什均衡。換句話說,可能有這些納什均衡中的某一個,這些納什均衡中的某一個,給所有博弈方帶來給所有博弈方帶來的利益,都大于其他所有納什均衡會帶來的利的利益,都大于其他所有納什均衡會帶來的利益益,此時,博弈方的選擇傾向性就會是一致的,此時,博弈方的選擇傾向性就會是一致的,各個博弈方不僅自己會選擇該納什均衡的策,各個博弈方不僅自己會選擇該納什均衡的策略,而且可以預料其他博弈方也會選擇該納什略,而且可以預料其他博弈方也會選擇該納什均衡的策略,因此不會有選擇困難。均衡的策略,因此不會有選

37、擇困難。用這種方法選擇出來的納什均衡,也稱為用這種方法選擇出來的納什均衡,也稱為“帕帕累托上策均衡累托上策均衡”。一、帕累托上策均衡一、帕累托上策均衡這個博弈中有兩個純策略納什均衡,(戰爭,戰爭)和這個博弈中有兩個純策略納什均衡,(戰爭,戰爭)和(和平,和平),顯然后者帕累托優于前者,所以,(和(和平,和平),顯然后者帕累托優于前者,所以,(和平,和平)是本博弈的一個帕累托上策均衡。平,和平)是本博弈的一個帕累托上策均衡。-5, -5-10, 88, -1010, 10戰爭戰爭和平和平國家國家2戰爭戰爭和平和平國國家家1戰爭與和平戰爭與和平為什么理性的國家之間不會選擇戰爭,為什么理性的國家之間不會選擇戰爭,但歷史上會有那么多戰爭呢?但歷史上會有那么多戰爭呢?n決策者考慮短期利益、個人或小集團利益;決策者考慮短期利益、個人或小集團利益;n決策者確實缺乏理性和理智;決策者確實缺乏理性和理智;n局部地區或特定時期的利益比上述博弈中所局部地區或特定時期的利益比上述博弈中所假設的要大等;假設的要大等;二、風險上策均衡二、風險上策均衡帕累托上策均衡并不是有強制力的法則帕累托上策均衡并不是有強制力的法則。有時候其他某種同樣是合理的選擇邏輯有時候其他某種同樣是合理的選擇邏輯的作用會超過帕累托效率的選擇邏

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論