第10章-博弈論初步_第1頁
第10章-博弈論初步_第2頁
第10章-博弈論初步_第3頁
第10章-博弈論初步_第4頁
第10章-博弈論初步_第5頁
已閱讀5頁,還剩46頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1第十章博弈論初步2(一)博弈論簡介博弈論(GameTheory)又稱對策論或游戲論,是一門研究在互動關系的游戲中,參與者選擇策略的科學。博弈論是研究在策略性環境中如何進行策略性決策和采取策略性行動的科學。。一、

博弈論和策略行為博弈論引例——“囚徒困境”

警察抓住了兩個合伙犯罪的罪犯,但卻缺乏足夠的證據指證他們的罪行。如果其中至少一人供認犯罪,就能確認罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關押并給他們同樣的選擇機會:如果他們兩人都拒不認罪,則因缺乏證據,他們會被以較輕的妨礙公務罪各判2年徒刑;如果他們兩人中有一人坦白認罪,則坦白者從輕處理,立即釋放,而另一人則將重判10年徒刑;如果兩人同時認罪,則他們將各判4年徒刑。囚徒2

坦白不坦白坦白-4,-40,-10囚徒1

不坦白-10,0-2,-24案例:田忌賽馬

《史記》:有一天,齊王要田忌與他賽馬,規定每個人從自己的上、中、下三等馬中各選出一匹參加比賽;并約定,各方每有一匹馬獲勝可獲黃金千兩,每有一匹馬落敗就要輸掉黃金千兩。

當時,齊王每一等次的馬都比田忌的馬跑得快,如果田忌用自己的上等馬與齊王的上等馬比,用自己的中等馬與齊王的中等馬比,用自己的下等馬與齊王的下等馬比,則田忌要輸三次,因而要輸黃金(銅)三千兩。但是比賽結果出人意料,田忌不但沒有輸,反而贏了一千兩黃金。這是怎么回事呢?5

原來:在賽馬之前,田忌的謀士孫臏給他出主意,讓田忌用自己的下等馬與齊王的上等馬比,用自己的上等馬與齊王的中等馬比,用自己的中等馬與齊王的下等馬比。田忌的下等馬當然會輸,但是上等馬和中等馬都贏了。因而田忌不僅沒有輸掉黃金三千兩,還贏了黃金(銅)一千兩。

在有雙方參加的競賽或競爭中,策略很重要。如果策略適當,就可能在注定要失敗的情況下取得勝利。

研究這種競賽策略的數學分支,叫作博弈論,也叫對策論;它是運籌學的一部分。

6案例:小乞丐的故事

有一個小乞丐,對于路人的施舍,他只接受1美元,而不要10美元。許多人都想見識一下這個小傻瓜,拿10美元和1美元給小乞丐,小乞丐總是選擇1美元。好奇的實驗者絡繹不絕,小乞丐則財源滾滾。

有人問小乞丐:為什么這么傻,只要1美元,不要10美元?

小乞丐回答說:如果我選擇了10美元,還會有這么多人來做實驗嗎?最后,讓我們做一個游戲,來測試一下你的博弈思維能力。要過年了,公司要發年終獎,作為老板,你論功行賞。你給每位員工一個信封,并告訴他們:每個信封里面都有一張撲克牌,如果里面裝著1,就可以去領1000元獎金,是2則可以領2000元,依此類推,是K就可以領13000元,“小王”可以領15000元,“大王”則是20000元7同時,你還告訴他們:拆開信封后,里面的撲克牌只能自己看,不能告訴別人。如果對自己的撲克牌(年終獎數額)不滿意,大家可以相互自由交換,但交換前還是不能讓對方知道自己的撲克牌是什么。問題是:會有多少人能成功與別人交換撲克牌,改變自己的年終獎數額?8答案是:一個都不會成功。讓我們同樣用“向前展望,倒后推理”的辦法來分析一下這個博弈:對于拿到“大王”的人來說(估計你會把這張牌給功勞最大的副總經理),他有交換和不交換兩種選擇,但他知道沒什么牌比“大王”更大,和誰交換都不合算,因此,不交換是“大王”的占優策略。拿到“小王”的人知道,除了“大王”,他和誰交換都不合算,而“大王”又不可能和其他人交換,因此,“小王”的占優策略也是不交換。9對于拿到K的人來說,除了“大王”和“小王”,和其他任何人交換都不合算,而可想而知,“大王”和“小王”肯定不會出來交換,因此,“K”的占優策略也是不交換。……依此類推,連拿到2的人也明白,即使拿3的人也肯定不會出來交換,因此,“2”的占優策略也是不交換。最后,敢出來與別人交換年終獎的肯定是那些拿“1”的人。既然大家的年終獎都是最少的1000元,還交換它干什么?這種原理,博弈論稱之為“逆向選擇”。10從游戲到博弈博弈就是策略對抗,或策略有關鍵作用的游戲博弈Game,博弈論GameTheory,Game即游戲、競技游戲和經濟等決策,具有競爭較量的共同特征:規則、結果、策略選擇,策略和利益相互依存,策略的關鍵作用游戲——下棋、猜大小、石頭剪刀布經濟——寡頭產量決策、市場阻入、投標拍賣(新娘拍賣)、股票市場政治——兩黨政治、多黨政治、政黨聯盟軍事——美國和伊拉克、印巴危機、以色列和巴勒斯坦、臺海兩岸(反分裂)娛樂——選美其他——婚姻市場12博弈論的發展改變了傳統經濟學的結構:1)傳統經濟學著重研究市場機制或價格制度,分析完全競爭市場中的最優決策,不考慮決策者之間的相互影響。但是,現實經濟運行中市場是不完全競爭的,行為主體之間的決策是相互影響的2)完全競爭市場是以完全信息為條件的,而現實經濟運行中也難以保證信息完全。在信息不對稱條件下,考慮行為主體相互影響的非價格制度可以用博弈論分析。博弈論與最優化理論是不同的決策理論。最優化理論——單人決策理論;博弈論——多人決策理論。13(二)博弈的基本要素

一個所謂博弈(Game/游戲)至少需要三個要素:(1)參與者。就是在博弈中進行決策的個體;博弈分析假定參與者都是理性的。(2)參與人的策略,指的是一項規則,根據該規則,參與人在博弈的每一時點上選擇如何行動;(3)支付(或結果):有可評價優劣的博弈結果(效用)。博弈論用數字表示這類結果,并稱之為支付(Payoff).02二月2023制作者:張昌廷(河北經貿大學)14博弈的簡單分類根據參與人的數量,可以分為二人博弈和多人博弈;根據參與人的支付情況,可分為零和博弈和非零和博弈;根據參與人擁有的策略的數量多少,可分為有限博弈和無限博弈;根據參與人在實施策略上是否有時間的先后,可分為同時博弈和序貫博弈。博弈樹:序貫博弈例:拋幣游戲。甲乙兩小孩拋硬幣,甲先拋,乙后拋。若硬幣同面,甲贏乙一個硬幣,如硬幣異面,甲輸乙一個硬幣。甲正反乙乙正正反反(1,-1)(1,-1)(-1,1)(-1,1)圖10—7競爭者—壟斷者博弈02二月2023制作者:張昌廷(河北經貿大學)1617

支付矩陣(PayoffMatrix,又稱收益矩陣等)描述一個博弈結構。下面的支付矩陣中,兩個參與者甲和乙各自可以選擇兩種策略;數字表示雙方在不同策略選擇組合下得到的支付,較大數字代表較大利益。

寡頭間的價格競爭

乙廠商策略合作不合作甲廠商策略合作5,61,5不合作7,12,3甲廠商的條件策略和條件策略組合02二月2023制作者:張昌廷(河北經貿大學)181.博弈均衡的概念

當兩個廠商的條件策略組合恰好相同,從而,兩個廠商都不再有單獨改變策略的傾向時,整個博弈就達到了均衡,即博弈均衡。博弈均衡是博弈各方最終選取的策略組合,是博弈的最終結果,是博弈的解。納什均衡02二月2023制作者:張昌廷(河北經貿大學)192.對納什均衡的理解一是“單獨改變策略”是指任何一個參與人在所有其他人都不改變策略的情況下改變自己的策略。其他人也同時改變策略的情況不在考慮之列。二是“不會得到好處”是指任何一個參與人在單獨改變策略之后自己的支付不會增加,這包括兩種情況:或者支付減少,或者支付不變。02二月2023制作者:張昌廷(河北經貿大學)201.基本方法先用下劃線法分別表示甲廠商和乙廠商的條件策略,最后確定博弈的均衡(就是找到在兩個數字之下都劃線的單元格即可,與這些單元格相對應的策略組合就是所要求的均衡策略組合)。五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經貿大學)212.條件策略下劃線方法的五步法第一,把整個的支付矩陣分解為甲廠商的支付矩陣和乙廠商的支付矩陣五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經貿大學)22第十章

博弈論初步

第二節

同時博弈:純策略均衡2.條件策略下劃線方法的五步法第二,在甲廠商的支付矩陣中,找出每一列的最大者(每列的最大者可能不只一個),并在其下劃線五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經貿大學)23第十章

博弈論初步

第二節

同時博弈:純策略均衡2.條件策略下劃線方法的五步法第三,在乙廠商的支付矩陣中,找出每一行的最大者(每行的最大者也可能不只一個),并在其下劃線五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經貿大學)24第十章

博弈論初步

第二節

同時博弈:純策略均衡2.條件策略下劃線方法的五步法第四,將已經劃好線的甲廠商的支付矩陣和乙廠商的支付矩陣再合并起來,得到整個的有下劃線的支付矩陣五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經貿大學)25第十章

博弈論初步

第二節

同時博弈:純策略均衡2.條件策略下劃線方法的五步法第五,在帶有下劃線的整個的支付矩陣中,找到兩個數字之下均劃有線的支付組合,則由該支付組合代表的策略組合就是均衡的策略組合五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經貿大學)263.總結在一個單元格中,如果兩個數字之下均劃有線,則兩個參與人都沒有單獨改變策略的動機,因為這兩個數字分別是列最大值和行最大值;如果兩個數字之下均沒有線,則兩個參與人都有單獨改變策略的動機,因為這兩個數字分別不是列最大值和行最大值;如果兩個數字中一個下面有線一個下面沒線,則有線的數字所代表的參與人沒有單獨改變策略的動機,沒線的數字所代表的參與人有單獨改變策略的動機。五、尋找納什均衡的方法——條件策略下劃線法27納什均衡的特點(1)納什均衡的存在性:在同時博弈中,(純策略)納什均衡可能存在,也可能不存在案例1:沒有納什均衡的同時博弈B廠商策略左右A廠商策略上4,69,1下7,32,828(2)納什均衡的唯一性:如果納什均衡存在,那么,均衡可能是一個,也可能是多個案例1:智豬博弈小豬策略:等待智豬博弈豬圈里有兩頭豬,一頭大豬,一頭小豬,采用自動喂養,豬圈一頭有一個豬食槽,按鈕在另一頭,控制豬食,按一下會有10個豬食進槽,但按的成本為2,若大豬先到,可吃9個食,小豬吃1個;若同時到,大7小3;若小豬先到,大6小4。納什均衡:大豬按,小豬等待,小豬搭便車智豬博弈的其他含義。

“小豬躺著大豬跑”的現象是由于故事中的游戲規則所導致的。規則的核心指標是:每次落下的事物數量和踏板與投食口之間的距離。

如果改變一下核心指標,豬圈里還會出現同樣的“小豬躺著大豬跑”的景象嗎?試試看。30改變方案:減量方案;增量方案。減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結果呢,小豬和大豬都在拼命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。

3132(3)納什均衡的最優性:如果納什均衡存在,那么,可能是最優的,也可能不是寡頭價格聯盟的不穩定性:每個成員都有強烈的降價獲利沖動33

寡頭廠商之間降價競爭導致兩敗俱傷;

寡頭廠商共謀比競爭更為有利,因而具有共謀(Collude)的動機。市場上的共謀現象十分普遍。當寡頭廠商共謀時,它們像一個壟斷廠商一樣行動:通過減產和提價來增加利潤,并對利潤加以瓜分,共同享有高價格帶來的高利潤。

共謀具有不穩定性:個別廠商不守規則可以得到巨大利益,利益驅動使寡頭遵守規則很困難。34

囚徒困境反映了一個深刻的問題,從個體角度出發所選擇的占優策略,從整體來看,卻是最差的結局,即個人理性和集體理性的沖突根據“看不見的手”原理,在市場機制的作用,理性的個體在追求自己利益的過程中,會同時增進整體利益,即個人理性與集體理性是一致的。西方經濟學家引入“重復博弈”的概念,以走出“囚徒困境”例:看芭蕾舞還是球賽?周末,壯壯喜歡去看球賽,而他的女朋友麗麗喜歡看芭蕾舞,具體支付如下圖,哪個是最優策略?36芭蕾足球男1,2-1,-10,02,1芭蕾足球女芭蕾足球女二、序貫博弈:情侶博弈(1)男方先選博弈均衡:足球37芭蕾足球女2,1-1,-10,012芭蕾足球男芭蕾足球男情侶博弈(2)女方先選博弈均衡:芭蕾38支付矩陣分析:情侶博弈女足球芭蕾教材第314頁女足球芭蕾男足球2,10,0芭蕾-1,-11,2策略:先下手為強納稅檢查假定稅務機關的檢查成本10,納稅人應稅額為20,如果查到逃稅,罰款為兩倍。結果不確定:納稅機關和納稅人均沒有上策還取決于納稅機關的檢查概率,比如稅收機關的檢查概率是20%,納稅人會選擇逃稅(-60*20%>-20),稅收機關會檢查;如果概率是50%,納稅人會選擇納稅(-60*50%<-20),稅收機關選擇不檢查。40一、混合策略:當純策略被賦予概率向量時,就轉化為混合策略。

例如:上策、下策分別被賦予0.6、0.4的概率,即博弈參與者以60%的概率選擇上策,以40%的概率選擇下策。教材第299頁B廠商策略q1=0.3q2=0.7左右A廠商策略p1=0.6上4,69,1p2=0.4下7,32,8§7-3同時博弈:混合策略均衡41二、混合策略組合如果:A、B廠商的混合策略分別是(0.6,0.4)和(0.3,0.7),那么:它們的組合可以記做(0.6,0.4),(0.3,0.7)即:混合策略組合B廠商策略q1=0.3q2=0.7左右A廠商策略p1=0.6上4,69,1p2=0.4下7,32,842

在混合策略博弈中,對于每一個混合策略組合,也存在一個支付組合,其中,每一項也都是相應參與人在該混合策略組合條件下所得到的支付。由于每個參與人都是以一定的概率來選擇其純策略,故相應的支付也就成了“期望支付”,即支付的期望值。

三、期望支付43四種策略組合發生的概率分別是:

B廠商策略q1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論