《博弈論》最完整版課件(加專題研究)_第1頁
《博弈論》最完整版課件(加專題研究)_第2頁
《博弈論》最完整版課件(加專題研究)_第3頁
《博弈論》最完整版課件(加專題研究)_第4頁
《博弈論》最完整版課件(加專題研究)_第5頁
已閱讀5頁,還剩290頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

博弈論GameTheory數(shù)學與管理工程系

1在市場的大背景中,個人只有通過關注他人所關注的東西并找到雙方利益的共同點,才能更好地促進自己的目標。————德威特商業(yè)上的信用關系不是用“歃血為盟〞的方法來維系的,它需要的必須是一個利益安排機制:不管是誰,其違背信用之所得肯定小于堅守誠信之所得。———娃哈哈集團老總宗慶后談判中只有采取適當?shù)淖尣讲呗圆拍艿玫饺思业淖尣剑罱K取得談判的成功———龍永圖2參考書目1.張維迎.博弈論與信息經(jīng)濟學.上海三聯(lián)書店.上海人民出版社2.謝識予.經(jīng)濟博弈論.復旦大學出版社3.[美]劉易斯.卡布羅.產(chǎn)業(yè)組織導論.人民郵電出版社6.王那么柯.新編博弈論平話.中信出版社4.[法]簡.泰勒爾.產(chǎn)業(yè)組織理論.中國人民大學出版社5.[美]艾里克.拉斯謬森.博弈與信息(第二版).博弈論概論北京大學出版、三聯(lián)書店7.[美]阿維納什.K.迪克西特,巴里.奈爾伯夫.策略思維—商界、政界及日常生活中的策略競爭.中國人民大學出版3課程結(jié)構(gòu)第一章博弈論的歷史和分類第二章完全信息靜態(tài)博弈第三章完全信息動態(tài)博弈第四章不完全信息靜態(tài)博弈第五章不完全信息動態(tài)博弈4第一章博弈論的歷史和分類1.什么是博弈論2.博弈論歷史和開展3.幾個經(jīng)典博弈模型4.博弈結(jié)構(gòu)和博弈的分類5.思考與練習51.什么是博弈論撲克、象棋、乒乓球團體賽等體育運動賭博彩票游戲〔Game〕博弈論——GameTheory——游戲理論?計策〔策略〕OPEC(石油輸出國組織)的成員國選擇其年產(chǎn)量;GM(通用汽車公司)向USX(美國鋼鐵)購置鋼材;兩家制造商分別制造螺釘和螺母,決定采用何種標準;某家公司董事會為其總經(jīng)理(CEO)設立一項期股安排.6這些游戲的特征:1.都有一定的規(guī)那么:規(guī)定游戲的參加者〔個人或團體〕可以做什么,不可以做什么,游戲的順序,游戲結(jié)束的時間,游戲者犯規(guī)的處分等;2.都有一個結(jié)果:如甲贏或輸、平局或參加者各有所得等,并且各方所得的結(jié)果可以用數(shù)值表示或按照一定的規(guī)那么折算成數(shù)值;3.每個參與者都有可供選擇的策略,并且不同的策略通常會帶來不同的游戲結(jié)果或所得;4.策略與利益相互依存,每個參加者的利益不僅取決于自身策略的選擇,也取決于其他參加者的策略選擇1.什么是博弈論由以上特征,可以引出一個非技術性的定義71.什么是博弈論一個非技術性定義博弈即假設干個人、隊組或其他組織,面對一定的環(huán)境,在一定的規(guī)那么下,同時或先后,一次或?qū)掖危瑥母髯栽试S的行動或策略中進行選擇并加以實施,各自取得相應結(jié)果的過程.博弈論是研究決策主體的行動發(fā)生直接相互作用時候的決策以及這種決策的均衡問題的,也就是說,當一個主體,好比一個人或一個企業(yè)的選擇受到其它人或其它企業(yè)選擇的影響,而且反過來影響其它人、其它企業(yè)選擇時的決策問題和均衡問題。82.博弈論歷史和開展萌芽時期:18世紀甚至更早瓦德格拉夫(Waldegrave)在1713年提出兩人博弈的極小化極大混合策略解;庫諾特(Cournot)在1838年、伯特蘭德(Bertrand)在1883年分別提出了博弈論中經(jīng)典的經(jīng)濟學模型;公元前,我國的齊威王田忌賽馬的博弈思想;早期研究:1500年前巴比倫猶太教法典中的“婚姻合同問題〞源于上世紀初,1913年齊默羅(Zermelo)提出了關于象棋博弈的定理是博弈論的第一個定理,提出的“逆推歸納法〞(BackwardInductionProcedure)那么是博弈論的第一種有著一般意義的分析方法;(19世紀及以前)(20世紀前半葉)92.博弈論歷史和開展波雷爾(Borel)在1921-1927年間給出了混合策略的第一個現(xiàn)代描述,并給出了有數(shù)種策略的兩人博弈的極小化極大解;馮.諾伊曼(VonNeumann)和摩根斯坦(Morgenstern)在1928年給出了擴展形博弈定義,證明了有限策略的兩人零和博弈有確定的結(jié)果等;以上研究沒有完成博弈論的理論體系博弈論的形成:馮.諾伊曼(VonNeumann)和摩根斯坦(Morgenstern)1944年出版了?博弈論和經(jīng)濟行為?(TheoryofGamesandEconomicBehavior),在該著作中,引進了博弈論的擴展形(ExtensiveForm)和正規(guī)形(NormalForm)或稱策略形(Strategy)、矩陣形(MatrixForm),定義了極小化極大解(MinmaxSolution),并說明了解在所有兩人零和博弈中的存在性,且提出了創(chuàng)立博弈論的一般理論的想法,給出了博弈論的一般框架、概念術語和表示方法.(20世紀40年代)10VonNeumannOskarMorgenstern1944年?博弈論與經(jīng)濟行為?11?博弈論和經(jīng)濟行為?出版的最大奉獻在于極大地促進了博弈論與經(jīng)濟學之間的聯(lián)系,使得博弈理論找到了用武之地.?博弈論和經(jīng)濟行為?的出版被公認為博弈論初步形成的標志博弈論的成長:美國數(shù)學家約翰.納什(JohnNash)在1950年提出了將博弈論擴展到非零和博弈,最終成為非合作博弈理論基石的成果--“納什均衡〞(NashEquilibrium)及納什定理.納什均衡被譽為現(xiàn)代博弈論中最重要的概念,隨著博弈論和經(jīng)濟學的開展,納什均衡現(xiàn)在已經(jīng)成為大多數(shù)現(xiàn)代經(jīng)濟分析的出發(fā)點和關鍵分析概念.同時代還有許多為博弈論的成長作出偉大奉獻的科學家.(20世紀50年代)2.博弈論歷史和開展12博弈論的開展:(20世紀60~70年代)2.博弈論歷史和開展最重要的成果是塞爾騰(R.Selten)在1965年提出了“空頭威脅〞(EmptyThreats)的問題,并提出“子博弈精煉納什均衡〞(SubgamePerfectNashEquilibrium)對納什均衡作完美化精煉的思想.更在1975年提出了“顫抖手均衡〞(TremblingHandPerfectEquilibrium)概念海薩尼(J.Harsanyi)在1967--1968年發(fā)表構(gòu)造了不完全信息(IncompleteInformation)博弈理論的系列論文,提出了分析不完全信息博弈問題的標準方法,以及“貝葉斯納什均衡〞(BayesianNashEquilibrium)的概念,在1973年提出了關于“混合策略〞的不完全信息解釋以及“嚴格納什均衡〞(StrictNashEquilibrium)的概念.13JOHNC.HARSANYIJOHNF.NASHREINHARDSELTEN1994年諾貝爾經(jīng)濟學獎得主1950年,Nash均衡1965年,空頭威脅子博弈精煉Nash均衡1967年,BayesNash均衡1973年,Harsanyi轉(zhuǎn)換14在該時期,博弈論開始真正受到經(jīng)濟學家的廣泛關注,并被看作重要的經(jīng)濟理論和經(jīng)濟學的核心分析方法,開始貫穿幾乎整個微觀經(jīng)濟學和產(chǎn)業(yè)組織理論,在環(huán)境、勞動、福利、國際經(jīng)濟學等學科中的地位也越來越重要,大有“吞噬〞整個現(xiàn)代西方經(jīng)濟理論的氣勢.1996年,博弈論和信息經(jīng)濟學家莫里斯(JamesA.Mirrless)和維克瑞(WilliamVickrey)因為在不對稱信息條件下鼓勵機制問題方面的根底性研究而再次共同獲得諾貝爾經(jīng)濟學獎.2.博弈論歷史和開展博弈論的成熟以及與主流經(jīng)濟學的融合:(20世紀80~90年代)在該時期,又出現(xiàn)了一批對博弈論有重要奉獻的科學家和理論.15JAMESA.MIRRLEESWILLIAMVICKREY1996年諾貝爾經(jīng)濟學獎得主不對稱信息條件下鼓勵機制的研究163.幾個經(jīng)典的博弈模型3.1囚徒的困境(Prisoners’Dilemma)博弈論中最著名的模型,1950年圖克(Tuker)提出囚徒A坦白抵賴囚徒B坦白抵賴囚徒A的戰(zhàn)略:坦白或抵賴囚徒B的戰(zhàn)略:坦白或抵賴囚徒的困境模型揭示了一個很深刻的問題:個人理性與集體理性的矛盾.在經(jīng)濟學上有著廣泛的應用,如雙寡頭競爭博弈、公共產(chǎn)品的供給、軍備競爭、經(jīng)濟改革等現(xiàn)象.173.2雙寡頭削價競爭模型寡頭之間的價格戰(zhàn)也是囚徒困境的現(xiàn)象之一.假設寡頭1和寡頭2是雙寡頭市場上的兩個寡頭,它們原來以同一較高的價格銷售同一種產(chǎn)品,都能得到較高的利潤.但是,也許都不滿足現(xiàn)有的市場份額和利潤,都想通過降價爭奪更大的市場份額和更高的利潤.寡頭1高價低價寡頭2高價低價1883年由貝特蘭德(Bertrand)提出了更為完善的削價模型幾個經(jīng)典的博弈模型183.3智豬博弈(BoxedPigs)豬圈里有兩頭豬,一頭大豬一頭小豬,豬圈的一頭有一個食槽,另一頭安裝了一個控制食物供給的按紐,每按一下有10個單位的食物進入食槽,但按紐的豬要付2個單位的本錢.假設大豬先到,大豬吃到9個單位的食物,小豬只能吃到1個單位;假設小豬先到,大豬吃到6個單位的食物,小豬只能吃到4個單位;假設同時到,大豬吃到7個單位的食物,小豬只能吃到3個單位;支付分析:大豬按不按小豬按不按穩(wěn)定的結(jié)果:大豬按,小豬不按多勞者不多得股票市場,大小企業(yè),貧富之間公共產(chǎn)品的供給幾個經(jīng)典的博弈模型193.4斗雞博弈(ChickenGame)支付分析:甲前進后退乙前進后退穩(wěn)定的結(jié)果:一方前進,另一方后退公共產(chǎn)品的供給,美蘇冷戰(zhàn)市場進入,夫妻鬧矛盾,等等兩個人舉著火棍從獨木橋的兩端走向橋的中央進行火拼,每人都有兩種可能:繼續(xù)前進或退下陣來.假設都繼續(xù)前進,那么兩敗俱傷;假設一人前進一人退下陣來,那么前進者獲利,后退者丟面子;假設雙方都退下,那么雙方都丟面子.幾個經(jīng)典的博弈模型203.5庫諾特的寡頭競爭模型(CournotModel)在某種價格水平上,市場容量是有限的,假設向市場投放的產(chǎn)品超出該數(shù)量,那么必須降價.能使產(chǎn)品全部售出的價格稱為市場出清價格,為產(chǎn)品數(shù)量的函數(shù).假設在同一個市場上只有兩個廠商(寡頭),生產(chǎn)銷售同一種產(chǎn)品,產(chǎn)量分別為和,并且只能取整數(shù)值.市場出清價格為總產(chǎn)量的函數(shù),假定為為突出其中的博弈關系,不妨假設各廠商的生產(chǎn)都無本錢,而且各廠商自己決定自己的產(chǎn)量.各廠商如何決定自己的產(chǎn)量???幾個經(jīng)典的博弈模型21顯然,各廠商的產(chǎn)量都不會超過20,各廠商的利潤為1082201688432328932427875403577642426774249668484856945545510505045114455哪種產(chǎn)量的組合是穩(wěn)定的?(7,7)是最穩(wěn)定的7764242在這個組合上,兩個寡頭都沒有改變產(chǎn)量的動機如果廠商的數(shù)量增加到n個,情況如何?如果產(chǎn)量可以連續(xù)變化,情況又將如何??幾個經(jīng)典的博弈模型223.6市場進入阻撓(Entrydeterrance)進入者的戰(zhàn)略:進入、不進入穩(wěn)定的結(jié)果:進入者進入在位者默許或:進入者不進入在位者斗爭有一個壟斷企業(yè)已在市場(稱為在位者),另一個企業(yè)虎視眈眈想進入(稱為進入者),在位者為保住自己的壟斷地位,要想法阻止進入者進入.在位者的戰(zhàn)略:默許、斗爭進入者進入不進入在位者默許斗爭幾個經(jīng)典的博弈模型23進入者進入不進入在位者默許斗爭如果將上述博弈的支付情況改成以下結(jié)果:穩(wěn)定的結(jié)果:進入者不進入在位者斗爭兩種情況可以理解為,在進入者決定進入的請況下,在位者選擇斗爭的本錢是不一樣的,前者可以認為是高本錢的,而后者是低本錢的.但是,一種不確定的問題是,進入者是不知道在位者是高本錢還是低本錢的,最多知道在位者上下本錢的可能性;當然,在位者自己知道自己是哪種本錢類型.這就造成了信息的不確定性.海薩尼研究了這個問題并引進了一個虛擬參與人“自然〞,由自然選擇參與人的類型.幾個經(jīng)典的博弈模型24進入不進入默許(40,50)斗爭(-10,0)默許(0,300)斗爭(0,300)進入不進入默許(30,100)斗爭(-10,140)默許(0,300)斗爭(0,300)高本錢低本錢自然進入者在位者幾個經(jīng)典的博弈模型上下本錢的可能性是如何區(qū)分的??254.博弈結(jié)構(gòu)和博弈的分類1.參與人(Players):指的是一個博弈中的決策的主體,也稱博弈方,即博弈的參加者,參與人的目的是通過選擇行動或策略以最大化自己的支付水平;4.1博弈論中常用的術語:參與人可以是個人、集體甚至是一個國家或者由國家組成的集團.一般,我們用表示參與人在有的博弈中,某些條件不是由參與人決定的,如氣候、政策等,為了方便分析,可以引進“虛擬參與人〞,稱之為“自然〞,“自然〞在博弈論中用N表示.262.行動(Actionsormoves):是參與人在博弈的某個時點的決策變量,一般用表示第個參與人的一個特定行動,而用表示可供選擇的所有行動的集合(Actionset).在囚徒困境中,在庫諾特模型中,在n個人的博弈中,n個參與人的行動的有序集稱為一個行動組合(Actionprofile),為第個參與人的行動在囚徒困境中,在庫諾特模型中,博弈結(jié)構(gòu)和博弈分類27完全信息:是指參與人對其他參與人的行動或支付構(gòu)成均完全了解的知識.共同知識:是“所有參與人都知道,所有參與人都知道所有參與人知道,…〞的知識.這是一個非常強的假定.信息集:是參與人在特定時刻有關變量值的知識,一個參與人無法準確知道的變量的全體屬于一個信息集.包含了一個參與人有關其他參與人之前行動的知識.完美信息:指一個參與人對其他參與人(包括“自然〞)的行動選擇均準確了解的信息.(主要針對動態(tài)博弈)3.次序(Orders).在現(xiàn)實的各種決策活動中,有時是要求各博弈方同時作出選擇,但有時各博弈方的抉擇有先后之分,并且一個博弈方還要作屢次決策,必須規(guī)定其中的決策次序.4.信息(Information).是參與人有關博弈的知識,特別是有關“自然〞的選擇、其他參與人的特征和行動的知識.信息集(Informationset)完美信息(PerfectInformation)完全信息(CompleteInformation)不完美信息(ImperfectInformation)不完全信息(IncompleteInformation)共同知識(Commonknowledge)博弈結(jié)構(gòu)和博弈分類285.戰(zhàn)略(Strategies).也稱策略,是參與人在給定信息集的情況下的行動規(guī)那么,它規(guī)定參與人在何時采用哪種行動.戰(zhàn)略也是一種“相機行動方案〞(ContingentActionPlan),它指導參與人如何對其他參與人的行動作出反響.進入者的所有可選擇的戰(zhàn)略集合為戰(zhàn)略與行動相同嗎?在靜態(tài)博弈中確實是相同的總共有四個戰(zhàn)略組合博弈結(jié)構(gòu)和博弈分類在市場阻撓模型中29在市場阻撓模型中,如果由進入者首先選擇是否進入,再由在位者選擇是否斗爭,此時,進入者有兩個戰(zhàn)略而在位者的戰(zhàn)略那么有四個但在位者的行動仍然是兩個戰(zhàn)略組合總共有8個動態(tài)博弈博弈結(jié)構(gòu)和博弈分類306.支付(Payoffs).也稱得益,對應各博弈方每一組可能的戰(zhàn)策組合,都必須有一個結(jié)果表示該戰(zhàn)略組合下各博弈方得到確實定收益或得到的期望收益(效用水平).在博弈中,很顯然,一個參與人的支付,不僅依賴于自己所選擇的戰(zhàn)略或行動,也依賴于其他參與人所選擇的戰(zhàn)略,即某個參與人的支付是所有參與人戰(zhàn)略組合的函數(shù):如在市場阻撓模型中在不能確定支付水平時,往往計算期望支付博弈結(jié)構(gòu)和博弈分類317.結(jié)果(Outcome).是博弈分析者所感興趣的所有東西,如均衡戰(zhàn)略組合、均衡行動組合和均衡支付組合等.8.均衡(Equilibrium).是指所有參與人的最優(yōu)的戰(zhàn)略組合.在均衡戰(zhàn)略組合下,任何參與人沒有改變自己戰(zhàn)略的動機,即如果改變戰(zhàn)略,自己的支付不會得到增加.(進入,默許)是一個均衡戰(zhàn)略組合(40,50)那么是一個均衡支付組合如在囚徒困境中,(坦白,坦白)是一個均衡在雙寡頭削價競爭模型中,(低價,低價)也是一個均衡在斗雞博弈中那么有兩個均衡(前進,后退)和(后退,前進)博弈結(jié)構(gòu)和博弈分類如在市場阻撓模型中32博弈結(jié)構(gòu)和博弈分類4.2博弈分類參與人的數(shù)量:單人博弈、雙人博弈和多人博弈單人博弈是指只有一個參與人的博弈.事實上,單人博弈就是一般的優(yōu)化問題.雙人博弈是指兩個各自獨立決策,但策略和利益具有相互依存關系的博弈方的決策問題.如迷宮問題;有自然參與的單人博弈等如囚徒困惑、智豬博弈等,雙人博弈是博弈論中最根本的也是研究最多的博弈類型.多人博弈是指有三個或三個以上參與人的博弈問題.多人博弈也是雙人博弈的推廣,但實際情形要復雜得多,另外可能出現(xiàn)破壞者等等33博弈結(jié)構(gòu)和博弈分類博弈中的戰(zhàn)略:有限博弈和無限博弈有限博弈是指一個博弈中的每個參與人的可選戰(zhàn)略都是有限的博弈.如前面介紹的幾個經(jīng)典博弈都屬于有限博弈無限博弈是指一個博弈中至少有一個參與人的可選戰(zhàn)略是無限的博弈.庫諾特的寡頭競爭模型中的產(chǎn)量如果是連續(xù)的情形時就屬于無限博弈.34博弈中的支付:零和博弈、常和博弈和變和博弈支付是參加博弈的各方從博弈中獲得的收益,是所有參與人追求的根本目標,即各參與人行動和判斷的依據(jù).在一個博弈中,每個參與人在每種戰(zhàn)略組合下都有相應的支付,稱所有參與人在同一個戰(zhàn)略組合中支付的總和為“(社會)總支付〞.零和博弈是指在任意戰(zhàn)略組合下“總支付〞均為零的博弈,如通常的打賭博弈,這種博弈最突出的特點是各參與人之間的利益是對立的.常和博弈是指在任意戰(zhàn)略組合下“總支付〞均為一個常數(shù)的博弈,如假設干個人分一筆固定獎金的博弈,這種博弈各參與人之間的利益也是對立的.變和博弈是指零和博弈和常和博弈以外的博弈的總稱.博弈結(jié)構(gòu)和博弈分類35博弈的次序:靜態(tài)博弈、動態(tài)博弈和重復博弈博弈的次序也是博弈很重要的因素,有些博弈中的所有參與人是同時選擇戰(zhàn)略的,但更多博弈中的參與人是先后選擇戰(zhàn)略的,也有的博弈是反復或重復進行的.靜態(tài)博弈是指在博弈中所有的參與人同時選擇戰(zhàn)略,或者雖然不是同時選擇戰(zhàn)略,但是后選擇的參與人不知道先選擇的參與人的戰(zhàn)略的博弈.如前面介紹的幾個經(jīng)典博弈都屬于靜態(tài)博弈動態(tài)博弈是指在博弈中各參與人是按某種規(guī)那么分先后行動,并且后行動者知道先行動者的戰(zhàn)略的博弈.比方下棋博弈,市場開發(fā)博弈等博弈結(jié)構(gòu)和博弈分類重復博弈是指在將博弈重復進行的博弈.36“完全信息”指的是每一個參與人都對其他所有參與人的特征、戰(zhàn)略空間及支付組合(主要是支付組合)有準確的知識;否則,稱為“不完全信息”.博弈中的信息:完全信息博弈和不完全信息博弈完美信息動態(tài)博弈和不完美信息動態(tài)博弈博弈方的能力和理性:“完美信息”指動態(tài)博弈中輪到行動的參與人對之前的博弈進程完全了解的知識.博弈結(jié)構(gòu)和博弈分類博弈中參與人的“行為邏輯〞包含兩個方面:參與人決策行為的根本目標和參與人追求目標的能力.“理性經(jīng)濟人假設〞:認為參與人都是以個體利益最大化為目標,且有準確的判斷選擇能力,同時還不會“犯錯誤〞.合作博弈和非合作博弈37博弈結(jié)構(gòu)和博弈分類以個體利益最大化為目標被稱為“個體理性〞;有完美的分析判斷能力和不會犯錯誤被稱為“完全理性〞,完全理性要求現(xiàn)實的參與人都能通過博弈分析找到最優(yōu)戰(zhàn)略,而且不會因為遺忘、失誤、任性等原因偏離最優(yōu)的選擇.相對與“個體理性〞而言是“集體理性〞,即在全部或局部問題上以集體(集團或團體)利益為目標,追求集體利益最大化.但在博弈論中,集體利益最大化并不是參與人的目標,不過,博弈論也允許在博弈中存在“有約束力的協(xié)議〞,在集體的成員間進行利益的有效補償.以“集體理性〞為根底的博弈稱為“合作博弈〞,以“個體理性〞為根底的博弈稱為“非合作博弈〞.38完全信息靜態(tài)博弈完全信息動態(tài)博弈完全且完美信息動態(tài)博弈完全但不完美信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈但是,博弈問題通常包含復雜的相互依存關系,博弈分析也變得很復雜,因此,只在“完全理性〞的假設下進行博弈分析是不夠的.與“完全理性〞相對應的是“有限理性〞,即參與人的判斷選擇能力在有缺陷的情況下分析博弈問題.4.3總結(jié)博弈非合作博弈合作博弈博弈結(jié)構(gòu)和博弈分類395.思考與練習1.什么是博弈?博弈論研究的內(nèi)容是什么?2.從經(jīng)濟學角度分析為什么博弈論中研究的多數(shù)為非合作博弈?3.一個博弈中應該包含多少要素?其中幾項稱為博弈的規(guī)那么?4.您知道寡頭和帕累托(Pareto,法國)優(yōu)勢的含義嗎?請到微觀經(jīng)濟學的某些教材中找到并記錄下來.5.Smith和Tom是類似于囚徒博弈的兩個人,不同的是Smith有前科,因此不管兩人是坦白還是抵賴,Smith都要至少比Tom多判5年.請構(gòu)造一個支付矩陣表示這個博弈,并分析博弈的合理性及穩(wěn)定的戰(zhàn)略組合.40第二章完全信息靜態(tài)博弈1.博弈論的戰(zhàn)略式表述2.納什均衡3.納什均衡應用舉例4.混合戰(zhàn)略納什均衡5.納什均衡的存在性和多重性41“完全信息〞是指每個參與人對所有其他參與人的特征(戰(zhàn)略空間、支付函數(shù)等)有完全的了解,即參與人的收益函數(shù)是“共同知識〞;“靜態(tài)〞是指所有參與人同時選擇行動且只選擇一次;“完全信息靜態(tài)博弈〞就是指每個參與人對所有其他參與人的特征(戰(zhàn)略空間、支付函數(shù)等)有完全了解的前提下,同時選擇一次行動的博弈.421.博弈論的戰(zhàn)略式表述我們首先回到囚徒的困境模型:囚徒A坦白抵賴囚徒B坦白抵賴支付矩陣:多變量矩陣,有三個特點1.列出了所有博弈的參與人;2.列出了每一個參與人可供選擇的戰(zhàn)略集,并且所有參與人同時選擇戰(zhàn)略;3.針對所有參與人可能選擇的戰(zhàn)略組合,列出了每一個參與人獲得的收益.滿足這三個特點的描述就稱為博弈的戰(zhàn)略式表述,也稱為博弈的標準式表述43將博弈的戰(zhàn)略式表述一般化,在有n個參與人的博弈中,戰(zhàn)略式表述必須給出以下三點:1.博弈中所有參與人的集合:2.每個參與人的戰(zhàn)略空間:3.每一個參與人的支付函數(shù):以后我們用代表戰(zhàn)略式表述的博弈囚徒困境博弈的戰(zhàn)略式表述為1.博弈論的戰(zhàn)略式表述44在庫諾特兩寡頭產(chǎn)量競爭模型中,戰(zhàn)略式表述為與戰(zhàn)略式表述對應的是擴展式表述,一般,戰(zhàn)略式表述常用于靜態(tài)博弈,而擴展式表述常用于動態(tài)博弈,擴展式表述將在動態(tài)博弈中介紹.1.博弈論的戰(zhàn)略式表述452.納什均衡2.1占優(yōu)戰(zhàn)略均衡(Dominant-strategyEquilibrium)囚徒A坦白抵賴囚徒B坦白抵賴囚徒困境博弈每個囚徒的最優(yōu)戰(zhàn)略都是“坦白〞,即不管其他參與人選擇什么戰(zhàn)略,“坦白〞都是囚徒A(也是B)的最好的戰(zhàn)略,即占優(yōu)戰(zhàn)略.一個戰(zhàn)略稱為某個參與人的“占優(yōu)戰(zhàn)略〞是指:不管其他參與人選擇什么戰(zhàn)略,這個戰(zhàn)略都是該參與人的最好的戰(zhàn)略.在一個博弈中,如果每個參與人都有“占優(yōu)戰(zhàn)略〞存在,那么,每個參與人的占優(yōu)戰(zhàn)略的組合就稱為“占優(yōu)戰(zhàn)略均衡〞,并且是唯一的“占優(yōu)戰(zhàn)略均衡〞.(Dominant-strategyEquilibrium)46占優(yōu)戰(zhàn)略的一般表述如下:2.納什均衡47在囚徒困境博弈中,(坦白,坦白)是一個占優(yōu)戰(zhàn)略均衡在雙寡頭削價競爭模型中,(低價,低價)也是一個占優(yōu)戰(zhàn)略均衡在智豬博弈、斗雞博弈、市場阻撓博弈中都沒有占優(yōu)戰(zhàn)略均衡,這些博弈是否存在其他的均衡呢?又如何判斷或?qū)ふ?占優(yōu)戰(zhàn)略均衡只要求每個參與人是理性的,而不必要求知道其他參與人是否是理性的,理性的人只要選擇自己的占優(yōu)戰(zhàn)略,即不要求“理性〞是共同知識.2.納什均衡482.2重復剔除的占優(yōu)均衡(iteratedDominanceEquilibrium)大豬按不按小豬按不按智豬博弈中的小豬有占優(yōu)策略,而大豬沒有占優(yōu)策略小豬的占優(yōu)策略:“不按〞假設小豬是理性的,總是“不按〞再假定大豬知道小豬是理性的,會預測到小豬的策略是“不按〞,因此大豬只能選擇“按〞.注意:對小豬而言,不管大豬選擇什么策略,“按〞相對于“不按〞對小豬都是較差的策略,稱其為“劣策略〞.(嚴格劣戰(zhàn)略)2.納什均衡49大豬按小豬不按對于一個理性的參與人,是不可能選擇“劣策略〞的,因此可以在戰(zhàn)略式表述(支付矩陣)中將其剔除,再重新構(gòu)造一個不含這個“劣策略〞的新的博弈,然后在新的博弈中尋找某個參與人的劣策略,再將其從博弈中剔除,重復進行下去,直到剩下唯一一個戰(zhàn)略組合,該組合稱為“重復剔除的占優(yōu)均衡〞大豬按不按小豬按不按大豬按不按小豬不按(按,不按)是智豬博弈的重復剔除的占優(yōu)均衡2.納什均衡50再看如下博弈:參與人AUD參與人BLMR相對于M為劣戰(zhàn)略相對于U為劣戰(zhàn)略相對于M為劣戰(zhàn)略(U,M)是唯一剩下的戰(zhàn)略組合(重復剔除的占優(yōu)均衡)以上每次剔除的都是嚴格的劣戰(zhàn)略,如果剔除的是弱劣戰(zhàn)略呢?2.納什均衡51參與人AUCD參與人BLMR參與人AUCD參與人BLMR再看如下博弈:(U,L)是唯一剩下的組合.在分析過程中剔除了弱的劣戰(zhàn)略.(U,R)是唯一剩下的組合.在分析過程中也剔除了弱的劣戰(zhàn)略.2.納什均衡一般只使用重復剔除嚴格劣戰(zhàn)略,而不使用剔除弱劣戰(zhàn)略的方法,否那么會將更好的均衡剔除.52劣戰(zhàn)略和重復剔除的占優(yōu)戰(zhàn)略的一般表述如下:2.納什均衡一個博弈經(jīng)過假設干次重復剔除劣戰(zhàn)略后剩下的唯一的戰(zhàn)略組合稱為“重復剔除的占優(yōu)均衡〞,且該博弈為“重復剔除占優(yōu)可解〞的.占優(yōu)戰(zhàn)略均衡一定是重復剔除的占優(yōu)均衡.即重復剔除嚴格劣戰(zhàn)略不會將占優(yōu)戰(zhàn)略均衡剔除.53參與人AUD參與人BLR分析博弈:在這個博弈中,兩個參與人都沒有占優(yōu)戰(zhàn)略,也沒有嚴格的劣戰(zhàn)略即這個博弈既沒有占優(yōu)戰(zhàn)略均衡,也沒有重復剔除的占優(yōu)均衡從分析中發(fā)現(xiàn),在戰(zhàn)略組合(U,L)或(D,R)上,兩個參與人都不會改變戰(zhàn)略,因為改變戰(zhàn)略不會帶來更多的支付,即沒有動機.甲前進后退乙前進后退斗雞博弈同樣在斗雞博弈中也有類似的結(jié)局納什均衡2.納什均衡542.3納什均衡(NashEquilibrium)納什均衡(NE)是博弈論中最重要的概念之一納什均衡是指這樣的一個戰(zhàn)略組合:在這個戰(zhàn)略組合之下,所有參與人都沒有改變戰(zhàn)略的動機,即改變戰(zhàn)略不會給該參與人帶來支付的增加或效用的改善.2.納什均衡納什均衡的一般描述552.納什均衡囚徒A坦白抵賴囚徒B坦白抵賴囚徒困境寡頭1高價低價寡頭2高價低價雙寡頭削價大豬按不按小豬按不按智豬博弈甲前進后退乙前進后退斗雞博弈(坦白,坦白)是占優(yōu)戰(zhàn)略均衡也是重復剔除的占優(yōu)均衡,還是納什均衡(低價,低價)是占優(yōu)戰(zhàn)略均衡也是重復剔除的占優(yōu)均衡,還是納什均衡(按,不按)是重復剔除的占優(yōu)均衡,也是納什均衡(前進,后退)和(后退,前進)都是納什均衡56進入者進入不進入在位者默許斗爭市場進入阻撓1進入者進入不進入在位者默許斗爭市場進入阻撓22.納什均衡沒有占優(yōu)戰(zhàn)略均衡也沒有重復剔除的占優(yōu)均衡兩個納什均衡〔進入,默許〕和〔不進入,斗爭〕在位者“斗爭〞是弱劣戰(zhàn)略沒有占優(yōu)戰(zhàn)略均衡也沒有重復剔除的占優(yōu)均衡一個納什均衡〔不進入,斗爭〕在位者“默許〞是弱劣戰(zhàn)略572.納什均衡參與人AUCD參與人BLMR參與人AUCD參與人BLMR戰(zhàn)略組合(U,L)和(U,R)都是納什均衡戰(zhàn)略組合(D,R)是唯一都是納什均衡畫線法:針對對手的每一戰(zhàn)略,找到自己的最優(yōu)戰(zhàn)略,并在其支付值下面畫線,最后,雙方同時畫線的戰(zhàn)略組合就是納什均衡582.納什均衡下面給出納什均衡與重復剔除嚴格劣戰(zhàn)略的關系:592.納什均衡命題B的證明:602.納什均衡命題A的證明:612.納什均衡占優(yōu)戰(zhàn)略均衡重復剔除的占優(yōu)均衡納什均衡在剔除過程中不能剔除弱劣戰(zhàn)略623.納什均衡應用舉例3.1古諾(Cournot)寡頭競爭模型(產(chǎn)量模型),1838年在某種價格水平上,市場容量是有限的,假設向市場投放的產(chǎn)品超出該數(shù)量,那么必須降價.能使產(chǎn)品全部售出的價格稱為市場出清價格,為產(chǎn)品數(shù)量的函數(shù).假設在同一個市場上只有兩個廠商(寡頭),生產(chǎn)銷售同一種產(chǎn)品,產(chǎn)量分別為和.63反響函數(shù)(reactionfunction)根據(jù)納什均衡的定義令3.納什均衡應用舉例64反響函數(shù):指參與人的戰(zhàn)略對其他參與人戰(zhàn)略的依賴關系,或者對其他參與人所選戰(zhàn)略根據(jù)反響函數(shù)可以求出自己的最優(yōu)戰(zhàn)略.反響函數(shù)法3.納什均衡應用舉例Cournot模型也可以使用重復剔除嚴格劣戰(zhàn)略得到納什均衡,你能求解嗎?6566令反響函數(shù)為3.納什均衡應用舉例67反響函數(shù)曲線為交叉點即納什均衡為3.納什均衡應用舉例683.2伯特蘭德(Bertrand)寡頭競爭模型(價格模型),1883年假設寡頭1和寡頭2是雙寡頭市場上的兩個寡頭,生產(chǎn)銷售同類但不完全一致的產(chǎn)品,產(chǎn)品具有一定的替代性,但兩個寡頭都想通過調(diào)整價格爭奪更大的市場份額和更高的利潤.依然采用反響函數(shù)法求其納什均衡〔NE〕3.納什均衡應用舉例69推出反響函數(shù)其交點即為納什均衡〔NE〕3.納什均衡應用舉例703.3豪泰林(Hotelling)價格競爭模型(價格模型),1929年3.納什均衡應用舉例產(chǎn)品的差異多種多樣,如品質(zhì)、性能、包裝等,Cournot模型中的產(chǎn)品是同質(zhì)的;Bertrand模型中的產(chǎn)品不同質(zhì),但具有互相替代性。產(chǎn)品還有一些特殊的差異,如時空。消費者購置商品時,不只是要考慮商品本身的價格,還會考慮購置商品時付出的本錢如交通本錢和時間本錢等等.線性城市商店A商店B城市長度為“1”居民均勻分布居民到哪個商店購買商品分析一個線性城市中兩個商店的定價競爭問題713.納什均衡應用舉例線性城市商店A商店B城市長度為“1”居民均勻分布居民到哪個商店購買商品01x兩個商店同時選擇價格;兩個商店的單位商品的本錢都是c;每個消費者購置商品的旅行本錢與離商店的距離成正比,單位距離的本錢為t;每個消費者每次都購置單位數(shù)量的商品假設:723.納什均衡應用舉例兩個商店的利潤分別為求導數(shù)733.納什均衡應用舉例反響函數(shù)為交點(納什均衡)為兩個商店的利潤為因此這個博弈的均衡價格和均衡利潤分別為74線性村莊村莊長度為“1”居民均勻分布3.4雜貨鋪定位博弈有兩家雜貨鋪要在一個線性的村莊開張,他們賣一樣的商品且價格也相同,兩家雜貨鋪會開在什么位置?雜貨鋪A雜貨鋪B線性村莊村莊長度為“1”居民均勻分布雜貨鋪A雜貨鋪B中心點為均衡位置菜場的小販,學校門口的出租車等等3.納什均衡應用舉例753.5三個和尚沒水吃(公共物品的私人供給)張三修不修李四修不修一個樓道中住著張三和李四,但樓道中的路燈壞了.該博弈存在重復剔除的占優(yōu)均衡和納什均衡為(不修,不修)但戰(zhàn)略組合(修,修)的支付組合更好!!!???這也是囚徒博弈問題降價競爭,沒有物業(yè)管理的小區(qū),沒制定值日制度的寢室等3.納什均衡應用舉例763.6唐僧肉誰都想吃(公共地的悲劇)一個有n個農(nóng)民的村莊中有一塊草地,每個農(nóng)民都有在草地上放牧的自由,每年春天每個農(nóng)民自己決定放養(yǎng)多少只羊.但問題是草地上的草是有限的,隨著羊的增加,平均每只羊能吃到的青草就減少,從而影響到羊的質(zhì)量即價格,當羊的數(shù)量過于大時,所有的羊都會餓死.農(nóng)民們在春天如何確定他們的羊的數(shù)量?羊的數(shù)量羊的價值最大數(shù)量羊的價值隨數(shù)量下降羊的價值由羊的總數(shù)決定,但是農(nóng)民在確定自己羊的數(shù)量時只會考慮自己增加一只羊后自己本錢和利潤的變化,而不會考慮其他農(nóng)民的結(jié)果.這種決策的結(jié)果使每個農(nóng)民的邊際本錢都會小于社會邊際本錢,最后都是增加羊的數(shù)量,從而草地被過量使用.3.納什均衡應用舉例773.納什均衡應用舉例特別注意草地上的草是有限的,而每只羊至少要吃一定量的草才不至于餓死假定羊的價值隨羊數(shù)量的增加降低得越來越快!783.納什均衡應用舉例農(nóng)民的目的:羊的數(shù)量羊的價值最大數(shù)量羊的價值隨數(shù)量下降一階條件為得到n個農(nóng)民的反響函數(shù)將n個一階條件相加Nash均衡總飼養(yǎng)量滿足的條件793.納什均衡應用舉例根據(jù)二階導數(shù)803.納什均衡應用舉例Nash均衡總飼養(yǎng)量滿足的條件但對社會而言,最優(yōu)目標是最大化社會總剩余價值:最大化的一階條件為個人自由的前提下,公共草地被過度使用了,公共地的悲劇!海洋漁業(yè)、草地沙化、環(huán)境污染、中國小煤窯等制度經(jīng)濟學中經(jīng)典例子(Hardin,1968)814.混合戰(zhàn)略納什均衡4.1福利博弈福利博弈的對象是政府和貧民.政府樂于救濟那種努力找工作的貧民,但不愿幫助那種坐等救濟的人,可是貧民只有在等不到政府的救濟時才會去尋找工作.這種現(xiàn)象被稱為“樂善好施〞的悖論.政府救濟不救濟貧民工作游手好閑在這個博弈中不存在純戰(zhàn)略的納什均衡.不過政府可以采用一種不確定的政策以鼓勵貧民努力尋找工作;同時,貧民也可以采用不定期地找工作,以引誘政府救濟!82政府救濟不救濟貧民工作游手好閑政府的期望支付是:4.混合戰(zhàn)略納什均衡83貧民的期望支付為:為獲得最大值,求導數(shù)得到一階條件,從而求出反響函數(shù):4.混合戰(zhàn)略納什均衡841.假設貧民找工作的概率大于0.2,那么政府總是選擇救濟;小于0.2,那么政府總是選擇不救濟;2.假設政府選擇救濟的概率大于0.5,那么貧民總是選擇不工作;小于0.5,那么貧民總是選擇找工作;3.均衡為政府以0.5的概率選擇救濟,而貧民那么以0.2的概率選擇找工作,這種均衡稱為混合戰(zhàn)略納什均衡4.福利博弈的納什均衡可以理解為政府每次只救濟50%的貧民,這樣至少可以鼓勵20%的貧民努力找工作.4.混合戰(zhàn)略納什均衡854.2混合戰(zhàn)略的一般描述4.混合戰(zhàn)略納什均衡86零和博弈,審計博弈,市民責任博弈等等4.混合戰(zhàn)略納什均衡875.納什均衡的存在性和多重性在一個博弈中,參與人或分析者有時并不能輕而易舉地找到一個特定的均衡,但是他能夠說明假設均衡存在的話,那么它應具有哪些特點,而且他也試圖證明均衡也是的確實確存在的.納什均衡的優(yōu)勢之一就是這種均衡在實際上可能碰見的每一個博弈中幾乎都存在,即使不存在純戰(zhàn)略均衡也存在混合戰(zhàn)略均衡.博弈中有一個特點有助于納什均衡的存在,這就是支付對于參與人戰(zhàn)略的連續(xù)性.如果參與人戰(zhàn)略的微小變化只會引起支付的微小或者零的變化,那么稱支付對于戰(zhàn)略而言是連續(xù)的.依靠這種連續(xù)性,參與人的戰(zhàn)略可以精密地調(diào)整,從而趨于在彼此之間達成最正確反響.5.1納什均衡的存在性88納什均衡的存在性定理I:每一個有限博弈至少存在一個純戰(zhàn)略納什均衡或混合戰(zhàn)略納什均衡.在福利博弈中,沒有純戰(zhàn)略的均衡,但是在引入了混合戰(zhàn)略,支付對于混合戰(zhàn)略就是連續(xù)的,因此就存在混合戰(zhàn)略納什均衡.博弈中另一個特點有助于納什均衡的存在,這就是參與人的戰(zhàn)略空間是有限的閉集,假設在一個股票市場博弈中,Smith可以借錢買股票,想借多少錢都可以,從而他想買多少股票都可以,因此他能夠買的股票數(shù)量構(gòu)成的戰(zhàn)略空間為[0,∞),這個集合是無界的.如果Smith知道明天的股價會高于今天的股價,那么這個博弈將沒有均衡;如果Smith購置股票的數(shù)量被限定為小于1000股,并且可以購置小數(shù)單位的股票,他能夠買的股票數(shù)量構(gòu)成的戰(zhàn)略空間為[0,1000),這個博弈仍然沒有均衡,因為他想購置的股票數(shù)量為999.999…..,但如果可以購置1000股,此時的均衡為1000.5.納什均衡的存在性與多重性895.納什均衡的存在性與多重性905.2納什均衡的多重性在一個博弈中,令博弈論專家棘手的不是這個博弈中是否存在均衡,而是可能存在多少均衡.許多博弈中都存在多個納什均衡,有些博弈中甚至存在無窮多個納什均衡.考慮兩個人分一塊蛋糕,每個人獨立地提出自己要求的份額,如果兩個人提出的份額沒有超過總的份額,那么各自得到自己要求的份額,如果超過了那么什么也得不到.這個博弈的均衡是什么?5.納什均衡的存在性與多重性91雙方的反響曲線是重合的因此這個博弈中有無窮個納什均衡但是哪個均衡會出現(xiàn)呢?(0.5,0.5)應該是最長出現(xiàn)的均衡這種均衡稱為“聚點〞,也稱為“聚點均衡〞聚點并不唯一,聚點的出現(xiàn)往往依賴于博弈的環(huán)境,不同的環(huán)境,出現(xiàn)的聚點可能是不一樣的.如果去年以四六開分過一次蛋糕,那么四六開可能就是今年的一個聚點.5.納什均衡的存在性與多重性92思考題一、張維迎:P761.3.4.6.11.93949596三、近年以來,中國汽車價格不斷下降,累積降幅平均到達20%以上,請用博弈理論分析這種現(xiàn)象。你能預測中國汽車市場的均衡價格嗎?二、上世紀90年代,中國彩電的價格大戰(zhàn)此起彼伏,給消費者帶來了實惠,而彩電企業(yè)的單機利潤大幅度下降,有報道稱某彩電企業(yè)每臺彩電的利潤只有10元,你認為可信嗎?請作出你的分析。974.俾斯麥海之戰(zhàn)“俾斯麥海之戰(zhàn)〞發(fā)生在1943年的南太平洋上,日本海軍上將木村受命將日本陸軍運抵新幾內(nèi)亞,期間要穿越俾斯麥海,而美國海軍上將肯尼欲對日軍運輸船進行轟炸.穿越俾斯麥海通往新幾內(nèi)亞由兩條航線:較短的北線和較長的南線,木村必須選擇其中的一條.而肯尼只能將飛機派往其中一處去搜索日軍.如果肯尼將他的飛機派到了錯誤的航線上,他雖然可以招回它們,但可供轟炸的時間就會減少.博弈參與人:木村和肯尼,支付假設為下表所示.肯尼北南木村北南這個博弈的純納什均衡是什么?(2)如果肯尼和木村分別先行動,

均衡的結(jié)果又分別是什么?(3)你能分析該博弈的混合戰(zhàn)略納什均衡嗎?985.市民責任博弈(吉蒂謀殺案)“吉蒂謀殺案〞是社會心理學中一個聲名狼籍的案例.吉蒂是在紐約被謀殺的,她的38位鄰居都目睹了案件的發(fā)生卻無人報案.如何解釋所發(fā)生的一切?將問題簡化為只有兩個目擊者:John和Smith,其支付假定如下表所示:Smith袖手旁觀報案John袖手旁觀報案博弈的純納什均衡是什么?分析該博弈的混合戰(zhàn)略納什均衡.(3)*將目擊中擴大為N個人,如果有人報案,報案者支付為7,其余目擊者支付為10,假設無人報案,所有目擊者支付均為0,分析該博弈的均衡.99第三章完全信息動態(tài)博弈1.博弈的擴展式表述2.擴展式表述博弈的納什均衡3.子博弈精煉納什均衡4.子博弈精煉納什均衡應用舉例5.重復博弈與民間定理(無名氏定理)100“完全信息〞是指每個參與人對所有其他參與人的特征(戰(zhàn)略空間、支付函數(shù)等)有完全的了解;“動態(tài)〞是指所有參與人分先后選擇行動且可能選擇多次行動;“完全信息動態(tài)博弈〞就是指每個參與人對所有其他參與人的特征(戰(zhàn)略空間、支付函數(shù)等)有完全了解的前提下,分先后選擇行動的博弈.手雷博弈:第一步:Tom要求Smith負1000$給自己,否那么就引爆手中的手雷;第二步:Smith決定是否要負Tom1000$(要判斷Tom所說話的可信度);第三步:Tom觀察Smith的決定,然后決定是否要引爆手雷.在動態(tài)博弈中都有一個問題:可信任性問題1011.博弈的擴展式表述在上一章,我們利用戰(zhàn)略式表述研究了完全信息靜態(tài)博弈,并且作為靜態(tài)博弈的解的概念,重點討論了納什均衡(NE).手雷博弈:第一步:Tom選擇是否威脅要求Smith付1000$給自己,否那么就引爆手中的手雷;第二步:Smith決定是否要付Tom1000$(要判斷Tom所說話的可信度);第三步:Tom觀察Smith的決定,然后決定是否要引爆手雷.該博弈的語言描述可以轉(zhuǎn)化為一種很直觀的表述結(jié)構(gòu):102這種結(jié)構(gòu)稱為博弈樹,也稱為博弈的擴展式表述.這是動態(tài)博弈分析中最常用的表述方法.博弈的擴展式表述包含以下要素:注意:在這里沒有提到戰(zhàn)略,戰(zhàn)略是選擇行動時的策略TomSmithTom不威脅威脅付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)博弈的擴展式表述103TomSmithTom不威脅威脅付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)博弈的擴展式表述的一般結(jié)構(gòu):結(jié)(nodes):分決策結(jié)和終點結(jié),決策結(jié)是參與人采取行動的時點,而終點結(jié)那么是對應支付向量的點.決策結(jié)終點結(jié)每一個決策結(jié)都只有一個直接前列結(jié)(初始結(jié)除外),但可能有假設干個直接后續(xù)結(jié).博弈的擴展式表述104TomSmithTom不威脅威脅付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)(2)枝(branches):是博弈樹上一個決策結(jié)到它的直接后續(xù)結(jié)的連線或箭頭,枝實際上是參與人的一個行動選擇.枝注意終點結(jié)不存在行動集合,只有支付組合初始結(jié)沒有進入的枝;終點結(jié)沒有出去的枝;每個中間的決策結(jié)只有一個進入的枝,但有多個出去的枝.博弈的擴展式表述105(3)信息集(informationsets)開發(fā)商A開發(fā)(4,4)支付:(開發(fā)商A,開發(fā)商B)不開發(fā)自然N自然N大大小小開發(fā)商BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)開發(fā)商博弈的行動次序:開發(fā)商A選擇行動:

開發(fā)、不開發(fā);自然選擇市場的大小:

大、小;開發(fā)商B選擇行動:

開發(fā)、不開發(fā);如果開發(fā)商B在決策之前清楚地知道開發(fā)商A和自然的選擇,即參與人在輪到他決策時知道在他之前所發(fā)生的一切,這種情形下的每一個決策結(jié)屬于一個信息集,即開發(fā)商B有四個信息集.只含有一個決策結(jié)的信息集成為單結(jié)信息集.如果博弈樹中的信息集都是但單結(jié)的,那么稱為完美信息博弈,在完美信息博弈中,參與人在決策前都知道自己處于哪個決策結(jié).信息集開發(fā)商博弈(1)博弈的擴展式表述106開發(fā)商A開發(fā)(4,4)支付:(開發(fā)商A,開發(fā)商B)不開發(fā)自然N自然N大大小小開發(fā)商BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)但是如果開發(fā)商B在決策之前只知道A的選擇,并不清楚自然的選擇,此時對于B只有兩個信息集,即B在決策前只知道自己處于哪個信息集,每個信息集有兩個決策結(jié),而開發(fā)商并不知道自己處于哪個決策結(jié).開發(fā)商博弈(2)含有兩個或以上的決策結(jié)的信息集稱為多結(jié)信息集,含有多結(jié)信息集的博弈稱為不完美信息博弈。不完美信息博弈中要求至少有一方具有不完美信息。博弈的擴展式表述107開發(fā)商A開發(fā)(4,4)支付:(開發(fā)商A,開發(fā)商B)不開發(fā)自然N自然N大大小小開發(fā)商BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)還有一種情形時,開發(fā)商B在決策之前知道市場需求的大小,但并不知道開發(fā)商A的選擇(如A,B同時選擇),此時對于B仍然只有兩個信息集,即B在決策前只知道自己處于哪個信息集,并且每個信息集也有兩個決策結(jié),而B不知道自己處于哪個決策結(jié).開發(fā)商博弈(3)博弈的擴展式表述108自然N大(4,4)支付:(開發(fā)商A,開發(fā)商B)小開發(fā)商A開發(fā)商A開發(fā)開發(fā)不開發(fā)不開發(fā)開發(fā)商BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)開發(fā)商博弈(4)將開發(fā)商博弈的行動順序改變:由自然首先選擇市場的大小,然后由開發(fā)商A選擇是否開發(fā).并且開發(fā)商A行動前不知道自然的選擇(市場的大小),開發(fā)商B在行動前知道市場的大小,但不知道開發(fā)商A的選擇.博弈的擴展式表述109博弈的擴展式表述1101UD22LLRR111完美記憶和不完美記憶NUD11LLRR2211參與人2的不完美信息集參與人1將第一步自己的選擇忘記了參與人2的不完美信息集參與人1將第二步自己的選擇忘記了忘記自己選擇的博弈稱為不完美記憶博弈的擴展式表述1112.擴展式表述博弈的納什均衡2.1擴展式表述博弈的戰(zhàn)略式表述戰(zhàn)略式表述在博弈開始之前就制定了相機行動方案,即“如果….,我將選擇…...擴展式表述是相機行動,要等待博弈到達自己的信息集,然后再決定選擇什么行動.TomSmithTom不威脅威脅付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)考慮手雷博弈是否存在納什均衡擴展式表述的博弈如何求納什均衡?先考慮該博弈的戰(zhàn)略式表述方法:112擴展式表述博弈的納什均衡威脅,引爆Tom威脅,不引爆不威脅Smith付不付(-10000,-10000)(0,0)(1000,-1000)(-100,0)(0,0)(-10000,-10000)手雷博弈的戰(zhàn)略式表述TomSmithTom不威脅威脅付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)第一步Tom有兩個純戰(zhàn)略:{威脅,不威脅}第二步在Tom選擇“威脅時〞Smith有兩個戰(zhàn)略為:{付,不付}{引爆,不引爆}第三步在Smith選擇“付〞時Tom有兩個戰(zhàn)略為:唯一的納什均衡(不威脅,不付)113(4,4)支付:(開發(fā)商A,開發(fā)商B)開發(fā)商A開發(fā)不開發(fā)開發(fā)商BB開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)開發(fā)商博弈開發(fā)商A的戰(zhàn)略有兩個:{開發(fā),不開發(fā)}而開發(fā)商B的戰(zhàn)略有四個:A開發(fā)我也開發(fā);A開發(fā)我不開發(fā);A不開發(fā)我開發(fā);A不開發(fā)我不開發(fā);開發(fā)商B的四個戰(zhàn)略表示為{開發(fā),開發(fā)};{開發(fā),不開發(fā)};{不開發(fā),開發(fā)};{不開發(fā),不開發(fā)};注意行動和戰(zhàn)略的區(qū)別戰(zhàn)略是行動的準那么擴展式表述博弈的納什均衡114(4,4)支付:(開發(fā)商A,開發(fā)商B)開發(fā)商A開發(fā)不開發(fā)開發(fā)商BB開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)開發(fā)商博弈開發(fā)商B{開發(fā),開發(fā)}{開發(fā),不開發(fā)}{不開發(fā),開發(fā)}{不開發(fā),不開發(fā)}開發(fā)開發(fā)商A不開發(fā)(4,4)(4,4)(8,0)(8,0)(0,8)(0,8)(0,0)(0,0)這個戰(zhàn)略式表述的博弈中有兩個純戰(zhàn)略的納什均衡:(開發(fā),{開發(fā),開發(fā)}),(開發(fā),{開發(fā),不開發(fā)})對應的行動組合只有一個:(A開發(fā),B也開發(fā))但均衡(開發(fā),{開發(fā),不開發(fā)})中B的均衡戰(zhàn)略{開發(fā),不開發(fā)}是不可信的.擴展式表述博弈的納什均衡115TomSmithTom不威脅威脅付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)手雷博弈123再考慮第二步:Smith知道第三步Tom會選擇“不引爆〞,因此比較了“付〞和“不付〞的支付后,Smith應該選擇“不付〞最后考慮第一步:Tom知道Smith第二步會選擇“不付〞,因此Tom一開始就會選擇“不威脅〞因此可以得到該博弈的均衡〔不威脅、不付、不引爆〕這種從后面往前面推導的方法稱為逆向歸納法我們先考慮第三步:Tom的行動“不引爆〞比“引爆〞更占優(yōu),Tom應該選擇“不引爆〞2.2擴展式表述博弈的納什均衡和逆向歸納法擴展式表述博弈的納什均衡116定理(Zermelo,1913;Kuhn,1953):一個有限完美信息博弈至少有一個純戰(zhàn)略納什均衡.如果一個擴展式博弈有有限個信息集,每個信息集上參與人有有限個行動選擇,并且這個博弈是完美信息的,那么一定有一個純戰(zhàn)略納什均衡,即這個定理可是使用逆向歸納法解釋.開發(fā)商博弈:假設這是一個有限完美信息博弈.自然N大(4,4)支付:(開發(fā)商A,開發(fā)商B)小開發(fā)商A開發(fā)商A開發(fā)開發(fā)不開發(fā)不開發(fā)開發(fā)商BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)有均衡的結(jié)果:(市場需求大,A開發(fā),B開發(fā))(市場需求小,A開發(fā),B不開發(fā))擴展式表述博弈的納什均衡117將這兩個納什均衡寫成戰(zhàn)略組合形式有四個:(大,開發(fā),{開發(fā),開發(fā)})(市場需求大,A開發(fā),B開發(fā))(市場需求小,A開發(fā),B不開發(fā))(小,開發(fā),{不開發(fā),開發(fā)})(大,開發(fā),{開發(fā),不開發(fā)})(小,開發(fā),{不開發(fā),不開發(fā)})戰(zhàn)略組合(大,開發(fā),{開發(fā),不開發(fā)}),(小,開發(fā),{不開發(fā),不開發(fā)})顯然不合理,B的合理戰(zhàn)略在市場需求大時為{開發(fā),開發(fā)},而在市場需求小時應為{不開發(fā),開發(fā)}那么如何將不合理的納什均衡剔除呢?擴展式表述博弈的納什均衡118自然N大(4,4)支付:(開發(fā)商A,開發(fā)商B)小開發(fā)商A開發(fā)商A開發(fā)開發(fā)不開發(fā)不開發(fā)開發(fā)商BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)開發(fā)商博弈TomSmithTom不威脅威脅付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)手雷博弈3.子博弈精煉納什均衡3.1子博弈子博弈非子博弈圖例:119自然N大(4,4)支付:(開發(fā)商A,開發(fā)商B)小開發(fā)商A開發(fā)商A開發(fā)開發(fā)不開發(fā)不開發(fā)開發(fā)商BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)開發(fā)商博弈如果開發(fā)商B在行動時不知道開發(fā)商A的選擇,那么開發(fā)商B有兩個信息集,且每個信息集有兩個決策結(jié).子博弈非子博弈圖例:定義:由一個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構(gòu)成的,有初始信息集和進行博弈所需要的全部信息,能夠自成一個博弈的一局部,稱為原動態(tài)博弈的一個“子博弈〞.子博弈精煉納什均衡120條件(1)說明,“子博弈〞的初始結(jié)x必定在原博弈的一個單結(jié)信息集中,即只有當參與人在原博弈中確切地知道博弈進入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的初始結(jié).如果一個信息集包含兩個以上的決策結(jié),那么這些決策結(jié)都不能作為子博弈的初始結(jié).完美信息博弈由于所有信息集都是單結(jié)的,所以每個決策結(jié)都可以開始一個子博弈.條件(2)說明,“子博弈〞中的信息集必須只含有子博弈中的決策結(jié),并且結(jié)構(gòu)與原博弈一致.子博弈精煉納什均衡1213.2子博弈精煉(完美)納什均衡(4,4)支付:(開發(fā)商A,開發(fā)商B)開發(fā)商A開發(fā)不開發(fā)開發(fā)商BB開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)開發(fā)商博弈開發(fā)商博弈有兩個純戰(zhàn)略的納什均衡:(開發(fā),{開發(fā),開發(fā)}),(開發(fā),{開發(fā),不開發(fā)})子博弈1子博弈2子博弈1的納什均衡是開發(fā)商B“開發(fā)〞子博弈2的納什均衡也是開發(fā)商B“開發(fā)〞在擴展式表述的動態(tài)博弈中,有的納什均衡中可能會含有不可信的戰(zhàn)略被選擇,在前面的例子中我們已經(jīng)發(fā)現(xiàn),雖然這些戰(zhàn)略構(gòu)成的戰(zhàn)略組合是納什均衡,但就這些戰(zhàn)略本身而言不符合參與人的自身利益.子博弈精煉納什均衡122原博弈的另一個納什均衡(開發(fā),{開發(fā),不開發(fā)})中B的戰(zhàn)略為{開發(fā),不開發(fā)},即A開發(fā)那么B開發(fā),A不開發(fā)那么B也不開發(fā),與子博弈2的納什均衡“開發(fā)〞矛盾.(開發(fā),{開發(fā),開發(fā)})是既是原博弈也是子博弈的納什均衡原博弈的第一個納什均衡(開發(fā),{開發(fā),開發(fā)})中,B的戰(zhàn)略是{開發(fā),開發(fā)},即不管A是否開發(fā),都選擇開發(fā),即B的戰(zhàn)略也是子博弈1和2的納什均衡.(開發(fā),{開發(fā),不開發(fā)})雖然什原博弈的納什均衡,但并不是子博弈的納什均衡,即這是一個不合理的均衡如何將擴展式博弈中博不合理的納什均衡去除?子博弈精煉納什均衡123子博弈精煉納什均衡和納什均衡的區(qū)別就在于子博弈精煉納什均衡可以將含有不可信戰(zhàn)略的納什均衡排除.在開發(fā)商博弈中,納什均衡(開發(fā),{開發(fā),開發(fā)})是子博弈精煉納什均衡,但(開發(fā),{開發(fā),不開發(fā)})不是一個子博弈精煉納什均衡.(開發(fā),{開發(fā),開發(fā)})也是原博弈中唯一可信的純戰(zhàn)略的納什均衡子博弈精煉納什均衡124自然N大(4,4)支付:(開發(fā)商A,開發(fā)商B)小開發(fā)商A開發(fā)商A開發(fā)開發(fā)不開發(fā)不開發(fā)開發(fā)商BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)開發(fā)商博弈(4,4)支付:(開發(fā)商A,開發(fā)商B)開發(fā)商A開發(fā)不開發(fā)開發(fā)商BB開發(fā)不開發(fā)開發(fā)不開發(fā)(8,0)(0,8)(0,0)開發(fā)商博弈3.3用逆向歸納法求完美信息博弈的子博弈精煉納什均衡子博弈1子博弈2使用逆向歸納法可以求出完全且完美信息動態(tài)博弈的純戰(zhàn)略的子博弈精煉納什均衡.(開發(fā),開發(fā))(大,開發(fā),開發(fā))和(小,開發(fā),不開發(fā))子博弈精煉納什均衡1254.1討價還價博弈(一)Smith和Jones分100美圓.在談判的第一回合中由Smith提出方案,由自己留下S1美圓,出價費用為零,Jones或者接受(此時博弈結(jié)束)或者拒絕并轉(zhuǎn)入第二回合;第二回合由Jones提出方案,出價費用為10美圓,Jones提出給Smith的數(shù)量為S2美圓,Smith選擇接受(此時博弈也結(jié)束)或拒絕并轉(zhuǎn)入第三回合;第三回合再次由Smith提出方案,出價費用為c美圓,Smith提出自己留下S3美圓.討價還價談判最多只進行三輪,如果三輪都不能達成協(xié)議,那么100$將全部給Jim.如何就不同的出價費用c找到均衡的結(jié)果?(1)c=0;(2)c=80;(3)c=10;4.子博弈精煉納什均衡應用舉例126討價還價博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)SmithJonesJonesSmith提出給Smith為S2提出要求S3支付:(Smith,Jones)(1)(2)(3)應用逆向歸納法求解:首先考慮第三回合Smith提出自己留下100美圓Jones會接受再考慮第二回合Jones只能提出自己留下0美圓而給Smith100美圓,否那么Smith一定是不接受(100,-10)(0,-10)(100,-10)子博弈精煉納什均衡應用舉例127最后考慮第一回合Smith提出自己留下100美圓,而Jones只能選擇接受,不然第二回合還要出10美圓的出價費用討價還價博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)SmithJonesJonesSmith提出給Smith為S2提出要求S3支付:(Smith,Jones)(1)(2)(3)(100,-10)(0,-10)(100,-10)(100,0)子博弈精煉納什均衡應用舉例128討價還價博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)SmithJonesJonesSmith提出給Smith為S2提出要求S3支付:(Smith,Jones)(1)(2)(3)首先考慮第三回合Smith提出自己留下100美圓Jones會接受再考慮第二回合Jones只能提出自己留下80美圓而給Smith20美圓,否那么Smith一定是不接受(20,-10)(-80,-10)(20,70)子博弈精煉納什均衡應用舉例129最后考慮第一回合Smith提出自己留下30美圓,而Jones只能選擇接受,不然第二回合還要出10美圓的出價費用討價還價博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(100,

-10)(0,-10)SmithJonesJonesSmith提出給Smith為S2提出要求S3支付:(Smith,Jones)(20,70)(30,70)(1)(2)(3)(20,-10)(-80,-10)子博弈精煉納什均衡應用舉例130討價還價博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)Sm

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論