第三講混合策略納什均衡ppt課件_第1頁
第三講混合策略納什均衡ppt課件_第2頁
第三講混合策略納什均衡ppt課件_第3頁
第三講混合策略納什均衡ppt課件_第4頁
第三講混合策略納什均衡ppt課件_第5頁
已閱讀5頁,還剩48頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第三講 混合戰略納什平衡 主講人:李美娟 引言有些博弈不存在納什平衡,或者納什平衡不獨一,如猜硬幣博弈,前述納什平衡分析就無法對博弈方的選擇和博弈結果作明確的預測。這部分對不存在納什平衡和存在多個納什平衡的博弈作一些討論?;旌蠎鹇缘囊M一、撲克牌對色游戲-1, 11, -11, -1-1, 1紅黑乙甲紅黑不存在前面定義的納什平衡戰略組合。這類博弈很多,引出混合戰略納什平衡概念?;旌蠎鹇缘南嚓P概念混合戰略是一種按照什么概率選擇這個純戰略、按照什么概率選擇那種純戰略的戰略選擇指示。混合戰略闡明:參與人可以按照一定的概率,隨機地從純戰略集合中選擇一種純戰略的實踐行動。期望值:假定存在 個能夠的取值

2、,并且這些取值發生的概率分別為: ,那么期望值為: 小孩玩的游戲“石頭,剪子,布,也是一種博弈。但是,這個博弈有一種有趣的特征,即給定一方的任何選擇,另一方都有制勝對方的戰略,因此這個戰略不是最優的。任何“純戰略都不是最優的,純戰略是“石頭,剪子,布中的任何一個?;旌蠎鹇圆┺氖^、剪刀、布0, 01, -1-1, 1-1, 11, -10, 01, -1-1, 10, 0石 頭剪 子布博弈方2石 頭剪 子布博弈方1 但是,我們知道,玩這個游戲總是以對方不易猜出的隨機方式出招?,F實上,可以經過數學證明,當雙方都以每個戰略按1/3的概率出招時,達成一種雙方都不愿改動這種概率分布的局面。這被稱為“混

3、合戰略納什平衡,而這種以隨機方式選擇純戰略的博弈被稱為“混合戰略博弈。 以混合戰略博弈我們來看下面幾個例子。 例子1 為什么普通人總是小錯不斷,大錯不犯;偷稅漏稅的普通是中小企業,大企業會老老實實地交稅? 稅務部門不會對一切企業的交稅情況每一次都去檢查,由于這樣做的本錢太高,得不償失。所以,稅務部門總是隨機地對企業的交稅情況進展檢查。 企業也是隨機地在交稅與偷漏稅之間進展選擇。稅收部門與企業間進展的是混合戰略博弈。由于假設企業總是交稅,稅務部門就最好不檢查;但給定不檢查,企業就會偷漏稅。所以,兩者只需在隨機地檢查與不檢查,企業隨機地在偷漏稅與交稅之間選擇,才會達成平衡。 對于大企業,因一旦偷稅

4、數額就宏大,所以,稅務部門在隨機檢查時放在大企業上的能夠性就大一些;而給定稅務部門檢查大企業的能夠性較大,大企業偷漏稅的行為就較少,否那么就容易被逮個正著。所以,偷漏稅較多的就是一些中小企業,大企業納稅的積極性較高。同樣的道理,在犯罪或對錯誤的監視懲罰博弈中,也是混合博弈,人們能夠總是大錯不犯小錯不斷。 例子2 田忌賽馬新編 春秋戰國時期,齊威王常與旗下大將田忌賽馬。規那么是:每次賽三局,每一局齊威王與田忌各出一匹馬競賽奔跑速度。每一局中的勝者贏敗方一千斤銅。田忌有上、中、下三匹馬,而齊威王也有上、中、下三匹馬。每次競賽,第一局田忌出上馬,齊威王也出上馬;第二局田忌出中馬,齊威王也出中馬;第三

5、局,田忌出下馬,齊威王也出下馬。齊威王的上馬比田忌的上馬好,齊威王的中馬也比田忌的中馬好,齊威王的下馬還是比田忌的下馬好。于是,每次競賽的結果都是田忌連輸三局。 田忌的謀士孫臏了解了田忌的姿態后,就探聽到這樣一個音訊:雖然齊威王的上、中、下三匹馬都要比田忌的對應上、中、下三匹馬好,但碰巧的是田忌的上馬可勝齊威王的中馬,田忌的中馬可勝齊威王的下馬。于是,孫臏為田忌獻計:下一次競賽中第一局時田忌出下馬對齊威王的上馬輸一局,第二局田忌出上馬對齊威王的中馬,第三局田忌出中馬對齊威王的下馬,這樣可連贏兩局,最后凈勝一千斤銅。田忌依計而行,果真贏回一千斤銅。 這個故事曾經被很多人當作博弈論的例子來演繹,但

6、實踐上這個故事與博弈論無關。博弈論會假定一切局中人都是理性的,不能假定一些局中人聰明而另一些局中人卻是傻子。當田忌出下馬時,齊威王最好的選擇是出下馬而不是上馬。孫臏的計謀中假定齊威王是傻子,當田忌出下、上、中馬時,他依然按上、中、下馬出,當然要輸了。現實上,當田忌出下馬時,齊威王應出下馬,但齊威王出下馬時,田忌不應出下馬而是出中馬,但此時齊威王又應出中馬而不是下馬了,。這樣,博弈不會有純戰略的平衡。 兩人只能玩混合戰略博弈,齊威王分別以1/6隨機的概率選擇出上、中、下馬的任一陳列,田忌也如此。由于齊威王存在絕對優勢,他平均看來依然會贏田忌一千斤銅。 混合戰略平衡純戰略與純戰略納什平衡純戰略:一

7、定會被選擇以100%的概率被選擇的戰略?;旌蠎鹇曰旌蠎鹇裕阂砸欢ǖ母怕史植歼x擇某幾個行動的戰略?;旌蠎鹇远x:在n人博弈的戰略式表述 中,假定參與人 有K個純戰略: ,那么,概率分布 稱為 的一個混合戰略,這里 是 選擇 的概率,對于一切的 。 顯然,純戰略可以了解為混合戰略的特例,比如說,純戰略 等價于混合戰略 ,即選擇純戰略 的概率為1,選擇任何其他純戰略的概率為0。混合戰略納什平衡:包含混合戰略的戰略組合,構成納什平衡?;旌蠎鹇曰旌蠎鹇云胶庠O 是n人戰略式博弈的一個混合戰略組合。假設對于一切的 , 對于每一個 都成立,那么稱混合戰略組合 是這個博弈的一個納什平衡。 期望支付 例:參與人1

8、的混合戰略:p,1-p) 參與人2的混合戰略:(q,1-q)參與人1的期望支付:假設參與人1選擇S11:假設參與人1選擇S12:EV1p,q)=參與人2的期望支付:EV2p,q)=u1,u2u3,u4u5,u6u7,u8參與人2S11 pS12 1-pS21S22參與人2q1-q混合戰略平衡 例:監視博弈給定工人偷懶,老板的最優選擇是監視;給定老板監視,工人的最優選擇是不偷懶;給定工人不偷懶,老板的最優選擇是不監視;給定老板不監視,工人的最優選擇是偷懶;如此循環。1,-1-1,2-2,32,2老板監視不監視偷懶不偷懶工人混合戰略平衡監視不監視偷懶不偷懶工人老板 假定老板選擇混合戰略0.5,0.

9、5) 工人選擇“偷懶期望支付為 (-1)0.5+30.5=1 工人選擇“不偷懶期望支付為20.5+20.5=2 工人應選擇“不偷懶 老板選擇“不監視 工人選擇“偷懶0.50.5 假定老板選擇混合戰略0.2,0.8) 工人選擇“偷懶期望支付為(-1)0.2+30.8=2.2 工人選擇“不偷懶期望支付為20.2+20.8=2 工人應選擇“偷懶 老板選擇“監視 工人選擇“不偷懶1,-1-1,2-2,32,2混合戰略平衡 什么情況下到達納什平衡形狀?假定存在一個概率q,老板選擇混合戰略q,1-q工人選擇“偷懶期望收益為(-1)q+3(1-q)=3-4q工人選擇“不偷懶收益為2假設老板真的以概率q選擇監

10、視,1-q選擇不監視,那么意味著他不會一直反復地選擇某個純戰略,而他不反復選擇的條件必需是工人也不會反復地選擇純戰略。 因此,老板以概率q選擇監視必然意味著在這種情況下工人沒有適宜的純戰略選擇。=老板的選擇必需使工人在兩個純戰略之間隨機選擇。工人什么情況下隨機選擇?混合戰略平衡當工人選擇任何一個戰略的期望支付相等時,只能隨機選擇。于是,3-4q=2 ,即q*=1/4,1- q*=3/4。這樣,當老板選擇1/4,3/4的混合戰略時,可以使工人在兩個純戰略之間無差別。 同理,假設工人選擇(p,1-p),(p,1-p)成為其最優混合戰略的條件是老板在選擇監視與選擇不監視之間無差別,即1p+(-1)(

11、1-p)=(-2)p+2(1-p),即p*=1/2,1- p*=1/2。當老板選擇1/4,3/4,工人選擇1/2,1/2時,剛好互為彼此的最優反響,到達納什平衡形狀,稱為混合戰略納什平衡。混合戰略平衡參與人1和參與人2的混合戰略組合 構成平衡的必要條件:混合戰略平衡的求解方法方法1:支付最大化法 給定其他參與人的混合戰略,本人選擇行動的概率分布要使本人期望支付最大化。q1-q1-pp工人的期望支付函數為(-1)pq+2(1-p)q+3p(1-q)+2(1-p)(1-q)=-4pq+p-2q+2最優化一階條件為:-4q+1=0 q*=1/4給定工人的混合戰略為(p,1-p),老板的混合戰略為(q

12、,1-q)支付最大化法求混合戰略納什平衡1,-1-1,2-2,32,2老板監視不監視偷懶不偷懶工人混合戰略平衡的求解方法方法2:支付等值法 本人選擇戰略概率分布使對方不會偏好于任何行動,即選擇每一個戰略都會得到一樣的收益。例子例:博弈方1的混合戰略p,1-p) 博弈方2的混合戰略q,1-q博弈方1:由 可得 :q=0.8博弈方2:由 可得 :p=0.8 2, 35, 23, 11, 5CDAB博弈方2博弈方1得雙方的戰略及相應得益:其中,博弈方1的期望得益為:博弈方2的期望得益為:策略期望得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6多重平衡博弈和混合戰略一、夫妻之爭的混

13、合戰略納什平衡首先,該博弈有兩個納什平衡,本博弈的兩個博弈方不會害怕對方猜到本人的選擇,他們客觀上并不想隱藏本人的選擇。因此,該博弈中兩博弈方的決策思緒和原那么應該與沒有納什平衡的嚴厲競爭博弈有所不同。2, 10, 00, 01, 3時 裝足 球時裝足球丈 夫妻子夫妻之爭但顯然,雙方的偏好不同,妻子喜歡前一個,丈夫喜歡后一個。故在純戰略的范圍內,該博弈也是無法對兩博弈方的選擇提出確定性建議,因此也需求思索博弈方采用混合戰略的能夠性。設p和1-p分別為妻子選擇時裝扮演和足球的概率;假設妻子不想讓丈夫利用本人的選擇傾向占上風,那么本人的概率選擇應使丈夫選擇兩種戰略的期望得益一樣:得:p=3/4設q

14、和1-q分別為丈夫選擇時裝扮演和足球的概率。同樣,假設丈夫不想讓妻子利用本人的選擇傾向占上風,那么本人的概率選擇應使妻子選擇兩種戰略的期望得益一樣:得:q=1/3夫妻之爭博弈的混合戰略納什平衡 戰略 得益妻子 0.75,0.25 0.67丈夫 1/3,2/3 0.75可見,這個結果明顯不如夫妻雙方能交流協商時,任何一方遷就另一方的得益好。這是由于缺乏溝通時能夠出現最差的結果呵斥的。也就是說,假設不強行設定雙方不能交流串通的博弈規那么,雙方決策時沒有被客觀或人為的緣由隔分開來,也沒有由于賭氣而采取不理性的態度,那么這種夫妻之間的決策問題普通不應該用上述博弈方式處理。二、制式問題電器和電子設備往往

15、有不同的原理或相關技術規范,稱之為不同的制式。假設消費相關電器或電子設備的廠商采用一樣的制式,那么產品之間就能相互匹配,零配件也能夠相互通用,這對于推行各自的產品和在消費運營中進展協作很有協助。設有兩個廠商同時方案引進彩電消費線,而彩電有A、B兩種不同的制式,那么這時候兩個廠商之間就有一個選擇制式的博弈問題。二、制式問題1, 30, 00, 02, 2ABAB廠商2廠商1制式問題 制式問題混合戰略納什平衡 A B 得益廠商1: 0.4 0.6 0.664廠商2: 0.67 0.33 1.296假定兩廠商采用不同的制式所能獲取的各自益處如以下圖所示:三、市場時機博弈-50, -50100, 00

16、, 1000, 0進不 進進不進廠商2廠商1市場時機 進 不進 得益廠商1: 2/3 1/3 0廠商2: 2/3 1/3 0兩廠商同時發現一個市場時機,但這個市場的容量并不大,兩個廠商該如何選擇呢?廠商1的混合戰略必需使廠商2選擇進與不進的期望得益一樣,廠商2 的情形類似?;旌蠎鹇苑错懞瘮捣错懞瘮担阂徊┺姆綄α硪徊┺姆矫糠N能夠的決策內容的最正確反響決策構成的函數。在純戰略的范疇內,反響函數是各博弈方選擇的純戰略對其他博弈方純戰略的反響;在混合戰略的范疇內,博弈方的決策內容為選擇概率分布,反響函數就是一方對另一方的概率分布的反響,也是一定的概率分布。由于純戰略可了解為混合戰略,因此實踐上反響函數

17、的概念,可以在混合戰略概率分布之間反響的意義上一致同來。法三:混合戰略反響函數猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合戰略概率分布(q,1-q):猜硬幣方選擇正反面的混合戰略概率分布當q0.5時,取r為0當r0.5時,取q為1夫妻之爭博弈2, 10, 00, 01, 3時裝足球丈夫時裝足球妻子夫妻之爭rq111/33/4(r,1-r):妻子的混合戰略概率分布(q,1-q):丈夫的混合戰略概率分布當q1/3時,取r為1當r3/4時,取q為1混合戰略平衡 混合戰略要求人們以隨機的方式

18、選擇本人的行動,由于隨機性行為無法準確預期,因此很多人以為混合戰略并非一個令人稱心的平衡概念?,F實生活中人們真會這樣采取行動嗎?如何解釋混合戰略?參與人試圖經過選擇混合戰略給對手呵斥一種不確定性,使對手不能預測本人的行動。如,猜硬幣、劃拳?;旌蠎鹇云胶鈱⑴c人類型的一種推斷。如監視博弈,老板不知道工人的類型,只知道“勤勞、“懶惰型工人各占50%。老板在選擇本人 戰略時仿佛面臨的是一個選擇混合戰略的 工人。納什定理:在一個由n個博弈方的博弈 中,假設n是有限的,且 Si 都是有限集(對 i=1,n),那么該博弈至少存在一個納什平衡,但能夠包含混合戰略。奇數定理Wilson,1971:幾乎一切有限

19、博弈都有有限奇數個納什平衡。納什平衡的存在性納什平衡的存在性 占優平衡 反復剔除的占優平衡 純戰略NE 混合戰略NE前一個平衡是后一個平衡的特例,后一個平衡是前一個的擴展。上述四個平衡概念統稱為納什平衡。占優平衡反復剔除占優平衡純戰略納什平衡混合戰略納什平衡多重平衡與協調 多重平衡的概念很多博弈具有多個納什平衡,比如以上講到的麥琪的禮物、性別戰等,稱為多重平衡。多重平衡降低博弈的解釋力一方面無法知道哪個平衡會出現,另一方面會發生真正出現的結果與平衡結果不一致在某些具有多重平衡的博弈中,各個博弈方偏好于不同的平衡結果,如麥琪的禮物和性別博弈。那么,博弈方如何使本人偏好的平衡成為實踐的平衡結果呢?

20、這就是多重平衡的協調問題。多重平衡與協調 帕累托上策平衡風險上策平衡聚點平衡相關平衡一、帕累托上策平衡有些博弈,雖然存在多個納什平衡,但這些納什平衡能夠有明顯的優劣差別,一切博弈方都偏好其中同一個納什平衡。換句話說,能夠有這些納什平衡中的某一個,給一切博弈方帶來的利益,都大于其他一切納什平衡會帶來的利益,此時,博弈方的選擇傾向性就會是一致的,各個博弈方不僅本人會選擇該納什平衡的戰略,而且可以預料其他博弈方也會選擇該納什平衡的戰略,因此不會有選擇困難。用這種方法選擇出來的納什平衡,也稱為“帕累托上策平衡。一、帕累托上策平衡這個博弈中有兩個純戰略納什平衡,戰爭,戰爭和和平,和平,顯然后者帕累托優于前者,所以,和平,和平是本博弈的一個帕累托上策平衡。-5, -5-10, 88, -1010, 10戰爭和平國家2戰爭和平國家1戰爭與和平為什么理性的國家之間不會選擇戰爭,但歷史上會有那么多戰爭呢?決策者思索短期利益、個人或小集團利益;決策者確實缺乏理性和明智;部分地域或特定時期的利益比上述博弈中所假設的要大等;二、風險上策平衡帕累托上策平衡并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論