




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第五篇不確定性決策第十五章對策論本章的學習要求與內容本章要求掌握對策論的性質、要素和類型,求解完全信息和不完全信息對策均衡的方法。本章分三節,分別介紹對策的特點、完全信息對策、不完全信息對策。1第五篇-第十五章對策論第一節對策的特點一、對策的性質1.對策論是研究理性決策主體間發生沖突時的決策及其均衡問題,即研究理性決策者之間沖突和合作的理論。2.對策論中個人決策同任何經濟主體一樣,是在給定約束條件下追求效用或收益最大化,但其約束條件不盡相同。傳統經濟學中經濟主體獨自決策,既不考慮自己的決策對他人決策的影響,也不考慮他人決策對自己決策的作用,而對策論里的對策,不僅依賴于自己的選擇,也依賴于他人的選擇,個人最優選擇是其他人選擇的函數,這就考慮了人們決策的相互影響,更接近于現實世界。2/4/20232第五篇-第十五章對策論3.對策論的應用領域很多,包括政治、經濟、軍事、體育以及國際關系等多個方面。在經濟學中,這種重視理性選擇的相互依賴性的思想,不僅構成了現代微觀經濟學的重要理論,而且為宏觀經濟分析提供了重要的微觀基礎。第一節對策的特點2/4/20233第五篇-第十五章對策論二、對策要素(一)局中人1.局中人是指參與對策的直接當事人,他是對策的決策主體和策略的制定者。在不同的對策問題中,局中人的含義是不同的,可能是個人,也可能是團體或集團。2.對策論要求局中人具有理性。(二)策略集合1.策略集合是局中人可能采取的全部策略的集合。2.每個策略集合至少應該有兩種不同的策略。
第一節
對策的特點2/4/20234第五篇-第十五章對策論(三)收益函數1.收益函數表征了局中人從對策中獲得的收益或效用水平,它是所有局人中策略的函數。2.收益函數通常可以用兩種形式表示:一種是用實物或貨幣收入的絕對數值或相對數值,另一種是用局中人的效用。(四)信息對策的信息是指局中人有關對策的全部知識,包括局中人的特征和行動。(五)均衡均衡是所有局中人最優策略的組合。第一節對策的特點2/4/20235第五篇-第十五章對策論三、對策的類型(一)合作對策與非合作對策1.按照局中人之間能否達成一個有約束力的協議,對策可分為合作對策與非合作對策。2.如果在一個對策過程中,局中人之間的協議、承諾或威脅具有完全的約束力,并能夠強制執行,稱為合作對策,否則稱為非合作對策。
第一節對策的特點2/4/20236第五篇-第十五章對策論(二)靜態對策與動態對策1.按照局中人決策時是否存在時間的先后次序,對策可分為靜態對策與動態對策。2.如果局中人同時進行決策選擇,或者雖非同時但后行動者并不知道先行動者采取什么具體行動,稱之為靜態對策。當考慮時間因素,對策需要多階段或重復地進行下去時,就稱為動態對策。
第一節對策的特點2/4/20237第五篇-第十五章對策論(三)完全信息對策與不完全信息對策1.按照局中人事先是否擁有其他局中人決策方面的信息,對策可分為完全信息對策與不完全信息對策。2.在完全信息對策中,每一位局中人都擁有所有其他局中人的特征、策略集合及收益函數方面準確的信息;在不完全信息對策中,局中人只能了解上述信息中的一部分。
第一節對策的特點2/4/20238第五篇-第十五章對策論(四)對抗性對策與非對抗性對策在對抗性對策中,局中人的收益或效用完全對立,一方所得必為另一方所失,一方利益的增加必然導致另一方利益的減少,局中人收益之和為零或常數。在非對抗性對策過程中,局中人有各自不同的收益值,其和可以是任意變數。在對抗性對策中,如果局中人各方不管采取何種策略,各自收益之和恒為零,則稱之為零和對策;如果各自的收益之和為常數,則稱之為常和對策;否則稱之為變和對策。第一節對策的特點2/4/20239第五篇-第十五章對策論第二節完全信息對策一、完全信息靜態對策標準型對策的基本要素對策的局中人表;每個局中人的所有策略表;每個策略組合所對應的每個局中人的收益表。2/4/202310第五篇-第十五章對策論(一)上策均衡(即占優均衡)1.占優均衡:不管對策中其他局中人的策略是什么,對某一局中人來說,他所采取的策略都是最優策略。2.占優均衡就是所有局中人的占優策略的組合。[例]囚徒困境:該對策占優均衡就是(坦白,坦白)。第二節完全信息對策囚徒困境體現了個人理性和集體理性的矛盾,即個人利己,不一定導致帕累托最優,從而動搖了傳統經濟學中“經濟人”假設,于是以對策論為基石,重構現代經濟學理論大廈,已成為一個引人注目的重要研究領域。圖5.15.1囚徒困境模型(靜態)2/4/202311第五篇-第十五章對策論第二節完全信息對策(二)納什均衡納什均衡:當給定其他局中人選擇策略的前提下,每個人選擇自己的最優策略,把所有局中人選擇的最優策略組合起來,就構成納什均衡。1.純策略納什均衡[例]新產品開發[例]性別大戰2/4/202312第五篇-第十五章對策論第二節完全信息對策2.混策略納什均衡混策略即局中人按照某一概率選擇純策略。[例]石頭、剪子、布:取勝原則:保守秘密和隨機選擇。(三)極大化極小均衡2/4/202313第五篇-第十五章對策論第二節完全信息對策二、完全信息動態對策(一)動態對策[例]市場進入阻擾模型若為靜態對策,從收益矩陣可見存在兩個納什均衡:(進入,合作)與(不進入,斗爭)。若為動態對策,根據逆向遞推的思路,可剔除一納什均衡(不進入,斗爭),則動態對策中各局中人理性選擇的唯一納什均衡是(進入,合作)。2/4/202314第五篇-第十五章對策論逆推法:在一般的有限次對策中,逆推法均可用于求解均衡問題,即首先從對策樹的末端開始,求解末端的子對策均衡,然后將求出的均衡解取代該子對策。在完全信息動態條件下,如果原對策的所有子對策均達到納什均衡,則稱整個對策均衡為子對策完美納什均衡。承諾行動是指,局中人使自己的威脅策略變成可以置信的行動。不可置信的威脅,則稱空洞威脅。第二節完全信息對策2/4/202315第五篇-第十五章對策論(二)重復對策重復對策是一種特殊的完全信息動態對策,指同樣結構的對策重復多次。重復對策可能是有限次的,也可能是無限次的重復對策的均衡結果,往往與一次性對策不同,有限次對策的均衡結果,也與無限次重復對策的均衡結果不同。第二節完全信息對策2/4/202316第五篇-第十五章對策論[例]無限重復囚徒困境囚徒困境重復進行無限次時假定(1)A,B均追求效用最大化,并用
U1,U2,…,Un…分別表示A在各個子對策中獲得的收益。(2)A,B收益或效用的貼現系數為
a,且a=1/(1+i),其中i為利率。A在所有子對策中所獲收益的貼現值之和可表示為。第二節完全信息對策2/4/202317第五篇-第十五章對策論此時,局中人考慮的是所有未來收益的貼現值之和,而不是一次性的收益。如果A提出彼此抵賴的合作建議,并威脅說:如果你中途變卦,我也將一直坦白,對你懲罰。若施行威脅帶來的重復對策貼現值之和,大于不施行威脅的重復對策貼現值之和,威脅變得可以置信。若A與B相互合作,均一直抵賴,可知在每一個子對策中A的收益值為U1=U2=…=Un=…=-1,設a=0.9,貼現值之和為同理,可得局中人B所獲收益的貼現值之和為uB=-10。第二節完全信息對策2/4/202318第五篇-第十五章對策論若A與B不能相互合作,一直選擇坦白策略,同樣可以得到A與B在每一個子對策中所獲收益貼現值之和。由于UA>U'A,UB>U'B,說明雙方進行合作的承諾是可以置信的。在無限重復的囚犯困境對策中,子對策完美納什均衡應為(抵賴,抵賴),達到了個人利益與集體利益同時最優,囚犯困境的特征也隨之消失。
如果重復的對策是有限次,則采用遞推法可以證明,局中人將像一次性對策中那樣,將選擇(坦白,坦白),繼續陷入困境之中。第二節完全信息對策2/4/202319第五篇-第十五章對策論第三節不完全信息對策一、不完全信息靜態對策[例]不完全信息市場進入阻擾模型在前述市場進入阻撓模型中增加假定:(1)在位者成本函數有兩種類型:高成本與低成本;(2)在位者有完全信息,進入者有不完全信息。圖(a)存在兩個納什均衡:(進入,合作)與(不進入,斗爭),其中(不進入,斗爭)應予剔除。圖(b)存在一個納什均衡:(不進入,斗爭)。圖5.15.7市場進入阻撓不完全信息靜態模型2/4/202320第五篇-第十五章對策論如果進入者知道在位者為高成本,選擇進入策略;如果知道在位者為低成本,選擇不進入。若高成本概率為P,低成本概率為(1-P)。
選擇進入的預期收益為U1=P·40+(1-P)·(-10)=50P-10;選擇不進入的預期收益為U2=0·P+0·(1-P)=0。當進入者選擇進入所獲得的預期收益不小于選擇不進入所獲得的預期收益時,才會選擇進入。即U1≥U2或50P-10≥0,也就是說:當P≥20%時,進入者選擇進入策略;當P<20%時,進入者選擇不進入策略。第三節不完全信息對策2/4/202321第五篇-第十五章對策論由于有限理性和信息壁壘,不完全信息常常成為局中人所處的現實環境。局中人并不具備其他局中人策略選擇方面的完全信息,卻具備其概率分布方面的完全信息,這種對策被稱為完全但不完美信息對策。貝葉斯均衡表示這樣一種策略組合:在給定局中人自己的類型及其他局中人類型概率分布的情況下,每位局中人的預期收益或預期效用都達到最大化。第三節不完全信息對策2/4/202322第五篇-第十五章對策論二、不完全信息動態對策[例]蜈蚣對策運用逆推法可得:局中人A在對策開始時將會直接選擇D,結果是A與B各獲得僅為1的收益。
第三節不完全信息對策2/4/202323第五篇-第十五章對策論如果B具有完全信息,A具有不完全信息,對策進程見下圖:第三節不完全信息對策2/4/202324第五篇-第十五章對策論B屬于合作者的概率為P,則他屬于短期利益至上者的概率可表示為(1-P),
P∈[0,1]。局中人A首先選擇策略R時,預期收益為U1=100·P+0·(1-P)=100P。當A首先選擇策略D時,預期收益為U2=1·P+1·(1-P)=1。當U1≥U2或100P≥1時,A首先選擇R所獲得的預期收益不小于選擇D所獲得的預期收益,他會先選擇R。此對策的一個納什均衡是:不管B屬于哪種類型,在前面的子對策階段里,A將選擇R,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論