《第三章傳統博弈理論(1重復博弈)》

上傳人：0*** IP屬地：湖北上傳時間：2023-02-03 格式：PPT 頁數：36 大小：2.78MB 積分：30 舉報 版權申訴

已閱讀5頁，還剩31頁未讀，繼續免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

東北財經大學數學與數量經濟學院劉德海

ldhai2001@163.com

博弈專題講座

（EconomicGameTheory)小作業：求守衛睡覺的混合均衡概率？？作業講解

0，00，S-P，0V，-D偷竊不偷睡覺不睡覺守衛小偷分析：守衛睡覺的均衡概率p*B與小偷被抓體罰P成正比，與看管物品價值V成反比作為數學分析方法，傳統博弈對參與者的“理性”要求非常苛刻：目標理性(主觀理性):追求自身利益最大化(經濟學理性的內涵)過程理性（具有理性能力）：包括兩個推理步驟（1）認知理性（cognitive）——具有對相關環境形成正確信念的能力；

具體要求：了解博弈結構和規則、“共同知識”（遞推歸納法的基礎）、貝葉斯理性等（2）工具理性（instrumental）——具有從既定信念采取相應策略的能力

具體要求：具有計算推理、預見、記憶、分析判斷的能力，不會犯錯誤（顫抖手均衡）等信念采取相應策略最大化目標相關環境認知理性工具理性目標理性課前復習:《第一章博弈論中“理性”概念的內涵》——參考：劉德海.理性概念的內涵及其在博弈論學科體系中的地位.《東北財經大學學報》理論分析實驗檢驗理性主義均衡分析（傳統博弈）演化主義均衡分析機制設計理論、信息經濟學實驗博弈演化博弈非合作博弈合作博弈不完全或不完美信息博弈完全完美信息博弈博弈論的理論體系:實證檢驗均衡合作信息靜態博弈、動態博弈、重復博弈理論建模課前復習:《第一章博弈論的理論框架》5第三章傳統博弈理論的簡介主要內容：第一節傳統博弈理論的研究范式；第二節納什均衡的定義；第三節納什均衡的無效率問題：重復博弈和無名氏定理；第四節納什均衡的無效率問題：相關均衡和信號裝置；第五節納什均衡的多重性問題：靜態博弈和焦點均衡；第六節納什均衡的多重性問題：動態博弈和子博弈完美均衡；第七節不完全不完美信息下的納什均衡存在性：貝葉斯均衡；

6博弈理論的研究對象：參與者互動過程中沖突與合作問題；分析思路：第三章傳統博弈理論的簡介

第一節傳統博弈理論的研究范式大量情緒、直覺、性格、感覺等非理性的主觀心理行為知識的未知狀態、不可預測性和多樣性等造成不同層次的有限理性實際行為方式的無序化為了對人們的互動行為加以模型化分析，必須進行合理的理論抽象博弈論的“完全理性”概念7第三章傳統博弈理論的簡介第一節傳統博弈理論的研究范式傳統博弈理論的研究思路：參與者“完全理性”假設下，通過推理演繹達到均衡化過程→均衡是瞬間實現的。在完全理性假設下，人們行為類似于按照既定程序運行的計算機（即給定博弈的環境和規則，嚴格按照策略執行）。——既沒有沖動、情緒、直覺等非理性的因素，也不會像有限理性那樣犯錯誤。回憶：“完全理性”的內涵信念采取相應策略最大化目標相關環境認知理性工具理性目標理性中國象棋大師許銀川PK浪潮天梭服務器

2006年08月15日，浪潮杯”中國象棋人機大戰再次展開，兩場對決中，均戰成平局。

8第三章傳統博弈理論的簡介第一節傳統博弈理論的研究范式傳統博弈理論的研究內容：納什均衡的存在性（Nash，1951）納什均衡的無效率及其解決途徑：

——重復博弈，無名氏定理（Friedman，1971）；

——靜態博弈，相關均衡（Aumann，1974）；納什均衡的多重性及其解決途徑：

——靜態博弈，焦點均衡（Schelling，1960）；

——動態博弈，子博弈完美均衡（Selten,1965）；在不完全（或不完美）信息下，納什均衡的存在性；

——貝葉斯納什均衡（Harsanyi，1967）9第三章傳統博弈理論的簡介第二節納什均衡的定義和實現途徑納什均衡（NashEquilibrium，簡記NE）的理解：參與者可以直接交換信息并一致同意選擇某一策略，雖然口頭協議無法強制實施，但是每個參與者單獨偏離卻不會帶來更大收益。雙人策略式博弈的納什均衡：策略組合(x1*，x2*)是一個NE，當且僅當x1*是x2*的最佳應對策略，x2*也是x1*的最佳應對策略，雙方都沒有動機偏離，該策略組合是自動實施的（self-enforcing）。舉例：囚徒困境博弈中，雙方都選擇坦白策略是一個NE；師生的上課時間。-8，-80，-10-10，0-1，-1坦白P抵賴NP坦白P抵賴NP囚徒A囚徒B10定義：策略式博弈（X1,…,X

n；u1,…,u

n）的一個策略組合(x1*，…，xn*)是納什均衡，如果下式成立：

u(xi*，x－i*)≥u(xi，x－i*)，所有xi∈Xi都成立如果上式取嚴格不等號，則為強NE。分析方法：離散的策略空間中，采用劃線法。例如囚徒困境中，NE為（P，P）。思考：如果策略空間是連續函數f(x)，如何分析？——求利潤函數f(q)最大值：df(q1，q2)/dq1=0，即古諾模型坦白P抵賴NP坦白P抵賴NP囚徒A囚徒B-8，-80，-10-10，0-1，-1第三章傳統博弈理論的簡介第二節納什均衡的定義和實現途徑2006-3-711第一種實現途徑：博弈前的串謀過程：參與者在博弈前直接的溝通，達成一個沒有約束力的協議，然后開始單獨行動——如果一致同意達到某個結果，那么可以預期這個結果是可以自我實施的（self-enforcing），即NE。舉例：參加齊心協力跑比賽問題：現實條件可能不允許參與者事前進行直接溝通，怎么辦？(1)物質條件不允許直接溝通（參與者人數眾多）；(2)雙方進行對話的基本互信不足（朝鮮核問題六方會談）；(3)博弈規則不允許參與者會面（司馬相如和卓文君私奔）。——通過外部力量進行協調。注：通過事前的串謀實現納什均衡，改變了原博弈的信息集合。第三章傳統博弈理論的簡介第二節納什均衡的定義和實現途徑2006-3-712第二種實現途徑：引入外部實體進行協調回憶：一般均衡理論中市場均衡價格的形成假定市場有一個“瓦爾拉斯”拍賣商假定存在一個虛擬的“納什調節器”（Nashianregulator），博弈前其向每個參與者提供一個均衡的策略組合。例如：朝鮮核問題中國外交穿梭第三章傳統博弈理論的簡介第二節納什均衡的定義和實現途徑2006-3-713[資料夾]朝核問題和六方會談朝鮮指控美國對其國家安全構成最大威脅，美國堅持朝鮮半島無核化。為解決問題，朝鮮一直要求與美國進行直接對話，并多次提議與美國簽訂互不侵犯條約，以圖獲得外交承認；但美國堅持不直接與“流氓國家”接觸，要求朝鮮先行放棄核計劃，并堅持采取多邊對話解決。中國外交穿梭，先2003年4月23日－25日，中、朝、美三方在北京舉行了三方會談，中國作為中間人角色促成朝美雙方進行直接溝通；然后8月份進入六方會談階段。07年3月，美國首席談判代表希爾與朝鮮代表團團長金桂冠在日內瓦就朝鮮核計劃舉行了為期兩天的談判。據美國首席談判代表希爾稱，朝鮮將全面公開其核計劃，并在年底前關閉所有核設施。朝一核反應堆施工現場(02年8月7日)2006-3-714第三種實現途徑：理性主義——參與者“完全理性”假設下，通過推理演繹達到均衡化的過程根據博弈的完全理性假設，尤其是理性的共同知識假設，每個參與者都能利用全部的信息，并且能夠正確理解參與者之間的相互作用，因此做出正確的預期。點評：當博弈規則不允許參與者事先進行溝通，又沒有外部力量進行行動協調時，如果參與者理性程度很高，仍可以實現NE均衡（此時等價于“理性預期均衡”）。第三章傳統博弈理論的簡介第二節納什均衡的定義和實現途徑2006-3-715第四種實現途徑：演化主義——參與者“有限理性”假設下，在歸納學習過程中實現均衡化過程參與者僅具有有限的認知能力和計算能力，但是時間的重復過程彌補了理性的不足。（1）長期機制，如生物學基于基因遺傳和變異的自然選擇過程；（2）中短期機制，如社會中模仿、經驗、慣例、試錯等學習過程。群體參與者中，每個個體觀察對方的行動后，根據各種復制原則進行復制。那些最有效率的策略將被大量復制，并淘汰那些表現不佳的策略，最終達成穩定的分布狀態。

點評：當博弈規則不允許參與者事先進行溝通，又沒有外部力量進行行動協調時，參與者理性程度又很低，只好在不斷的犯錯誤中摸索嘗試。第三章傳統博弈理論的簡介第二節納什均衡的定義和實現途徑納什均衡的存在性（Nash，1951）：每一個有限博弈都至少有一個NE，其中包括混合策略納什均衡。證明：采用不動點定理證明；也可以采用單純形法的初等證明，參見施錫銓著《博弈論》。布勞威爾不動點定理：對于一個拓撲空間中滿足一定條件的連續函數f，存在一個點x0，使得f(x0)=x0。舉例：大商場等地方可以看到平面地圖（相當于一個映射f），上面標有”您在此處”的紅點。這個點x0就是把實際地形映射到地圖的連續函數f(x0)的不動點。第三章傳統博弈理論的簡介第二節納什均衡的定義和實現途徑17第三章傳統博弈理論的簡介第三節納什均衡的無效率問題博弈論揭示出新古典經濟學基本命題存在的問題：“看不見手原理”（亞當·斯密，1776）：“我們的晚餐不是來自屠夫、釀酒的商人或面包師傅的仁慈之心，而是因為他們對自己的利益特別關注。。。每個人都會盡其所能，運用自己的資本爭取最大的利益，。。。但如此一來，他就好象被一只無形的手引領，在不知不覺中對社會改進盡力而為。”

——結論：市場機制下個體理性（自利）達到社會理性。“囚徒困境”PrisonerDilemma（A.W.Tucker，1950）

——結論：個體理性與集體理性的深刻矛盾，在個體理性假設下，可能無法實現資源配置的帕累托狀態。18[資料夾]n人的囚徒困境：公地的悲劇過度放牧，草場退化，缺草，西部的羊互相啃食羊毛，牧民無奈只得給羊穿上衣服，但是裸露在外面的羊毛還是被別的羊啃禿了長江源地區的草場正在退化1968年美國生物學教授哈丁（GarrettHardin）在《公地的悲劇》（TheTragedyoftheCommons）中討論了公共草場的問題：如果草場是公共的，為了增加收入，每個牧民都希望增加自己的牲畜，這將帶來過牧的問題，并導致草場退化，最終給所有的放牧人帶來悲劇。[資料夾]公地的悲劇：來自格魯吉亞的例子

“該國大部分地區，每天供電4小時，入夜后村莊一片漆黑，點煤油燈照明。

“交上來的電費只有1/3，人們向查電表的人行賄，后者會把部分賄金交給上司，上司再依樣層層上交。人們花在煤油燈上的錢比交的電費還多。由于總統的侄子控制著國家的煤油業，實行改革根本不可能。

“人人都知道老老實實地做事最終將一事無成”

其他資料：獨立15年來，格魯吉亞仍處于四分五裂的狀態，腐敗現象十分普遍。該國54%的人生活在貧困線以下，20%的人在國外打工。——資料來源：(英)盧茨·克萊維曼著《新大牌局——亞洲腹地大國角力內幕》，新華出版社，2006年20納什均衡的無效率問題：囚徒困境問題描述：帕累托效率結果為（－1，－1），可是一次性博弈的納什均衡卻陷入了深深的“囚徒困境”中：（－8，－8）合作行為是如何產生的？——20世紀人類未解決的難題思考：在非合作博弈框架內的解決途徑？打虎親兄弟，上陣父子兵

——博弈重復進行的過程中產生合作行為-8，-80，-10-10，0-1，-1坦白P抵賴NP坦白P抵賴NP囚徒A囚徒B第三章傳統博弈理論的簡介第三節納什均衡的無效率問題唯一納什均衡下的有限次重復博弈，能否產生合作行為？

分析思路：參與者具有“共同知識”的預測、分析、推理能力，在博弈開始前能夠從最后階段進行反向歸納，總收益為各階段收益的累加值。結論：當唯一的純策略NE，有限次重復博弈無法擺脫“囚徒困境”解決途徑？無限次重復博弈PNP-1，-1-8，0

0，-8-5，-5PNPPNP-1，-1-8，0

0，-8-5，-5PNP…G1

GTPNP-T，-T-8T，0

0，-8T-5T，-5TPNP累加，得：無限次重復博弈的分析難點：（1）無限期不存在終點，無法反向歸納；（2）任意正收益，無限次加總后總收益都為無窮大，失去比較意義。解決途徑：考慮到時間價值（利率r），人們更為注重近期的收益，引入貼現系數δ＝1/(1＋r)，將未來收益折算到當期，總收益是等比收斂數列加總（有限數）。計算：給定貼現系數δ，每階段收益都為u時，無限次重復博弈總收益的貼現值為：第三章傳統博弈理論的簡介第三節納什均衡的無效率問題23舉例：無限次重復囚徒困境博弈冷酷的觸發策略(cooltriggerstrategy):雙方在第一階段采取合作策略R，如果前（t－1）都合作，那么繼續合作；否則，如果對方背叛，則后續階段一直采取背叛策略L作為懲罰。策略分析：如果一方一直采取合作策略，那么總收益為：U(合作)=4+4×δ+4×δ+…=4/(1-δ)如果一方背叛，那么路徑(L,R),(L,L),(L,L)….總收益：

U(背叛)=5+1×δ+1×δ+…=5+δ/(1-δ)當合作收益大于背叛收益時，求得：δ>0.25結論：貼現因子δ足夠大，表示參與者更看重未來長遠收益，則采取觸發策略可以擺脫囚徒困境。例如：地攤貨不可靠思考：冷酷策略缺點？4，40，55，01，1LRLR第三章傳統博弈理論的簡介第三節納什均衡的無效率問題參與者A參與者B課外閱讀：《TheEvolutionofCooperation》Axelrod和Hamilton(1981)通過重復博弈囚徒困境實驗，結果表明：K期觸發策略最優，具有：清晰、善意、報復性和寬恕性——RobertAxelrod;WilliamD.Hamilton.TheEvolutionofCooperation,Science,Vol.211,No.4489.(Mar.27,1981),pp.1390-1396.無限次重復博弈的無名氏定理（Folktheorem，Friedman，1971）：在無限次重復博弈G（∞,δ）中，如果δ足夠接近于1，那么一定存在一個均衡路徑，實現博弈的可實現收益。前提條件：δ足夠接近于1，即參與者都比較看重未來長期合作的收益，因此避免了短期行為。可實現收益：階段博弈各純策略收益的加權平均，其中權數非負且總合為1（即圖中陰影）。即使原博弈具有唯一的納什均衡時，可以設計可信威脅的觸發策略，擺脫囚徒困境（但是沒有指出具體的策略）。AB0，04，1

1，43，3AB(3,3)(1,4)(1,1)(4,1)(0,0)可實現收益思考：如果雙方的貼現率不相等δ1≠δ2

（1）為啥不相等？（2）出現啥新結果？Whenplayershavedifferentdiscountfactors,possiblyreflectingtheplayers’heterogeneoustimepreferencesordifferentaccesstocapitalmarkets,thefeasiblepayoffsetofarepeatedgameisgenerallylargerthantheconvexhulloftheunderlyingstage-gamepayoffs,becauseunequaldiscountingenablestheplayerstotradepayoffsintertemporallyusingnon-stationarypathsofplay(LehrerandPauzner,1999).ChenandTakahashi(2012)studiesrepeatedgameswithunequaldiscountingandwithmorethantwoplayerstoidentifyasufficientconditionsothatafolktheoremtailoredtotheunequaldiscountingsettingholds.多重均衡下有限次重復博弈階段博弈：純策略均衡為(2,4)和(4,2)，帕累托最優(5，5)。兩階段重復博弈的策略設計：開始選R策略，若對方不合作則改為M策略進行懲罰；如果對方合作，則采取L策略進行獎勵均衡分析：如果不合作，(6,0)中對方收益增加1；但是在第二階段的懲罰(2,4)中收益減少2δ。當δ>0.5時，合作。結論：具有多個均衡的有限次重復博弈，可以把低效率的均衡作為背叛行為的懲罰，高效率均衡作為獎勵，從而實現合作。思考：為什么有限期囚徒困境無法實現合作？——由于懲罰和獎勵策略都是納什均衡，因此是可信的。囚徒困境無法提供可信的獎懲。5,50,00,60,00,04,26,02,40,0LMRLMR參與者A參與者B第三章傳統博弈理論的簡介第三節納什均衡的無效率問題28（1）聲譽效應問題提出：Axelrod(1981)實驗博弈結果表明，有限期仍可達成合作。解決：Kreps，Milgrom，Roberts&Wilson(1982)引入不完全信息解決了這個悖論，建立了KMRW聲譽效應模型。基本思路：參與者的行為類型具有不確定性：很大比例(1-ε)是理性的；很小比例ε是“非理性”的合作，刺激對方采取同樣的回應，獲得更大的長期利益，彌補當前非理性舉動造成的短期損失。（2）互惠模型（3）利他主義行為（選講）其它實現合作的途徑29（4）空間網絡上的演化博弈問題提出：市場交易行為并不是隨機發生的，而是有著固定的關系。Barabasi和Albert（1999）建立了無標度網絡的BA復雜網絡模型以來，研究復雜網絡上合作行為的演化，成為國際研究熱點之一。基本結論：在空間網絡上更容易產生合作行為——參考文獻：（1）NowakM.A.,MayR.M.,Evolutionarygamesandspatialchaos[J],Nature,1992(359):826-829.（2）OhtsukiH.,C.Hauert,E.LiebermanandM.A.Nowak,Asimplerulefortheevolutionofcooperationongraphsandsocialnetworks[J],Nature,2006(441):502–505.（3）Watts,D.J.,Strogatz,S.H.Collectivedynamicsof‘small-world'networks[J].Nature,1998(393):440-442.（4）劉德海，國家自然科學基金青年項目，《復雜網絡下群體性突發事件的演化博弈模型和信息傳播機制研究》，編號：70901016（選講）其它實現合作的途徑案例1：信任問題的重復博弈分析問題提出：法律和信譽是維持市場有序運行的兩個基本機制。（1）與法律相比,信譽機制維持交易秩序的成本更低；（2）法律的判決和執行依賴于當事人對信譽的重視程度。模型：重復博弈，達到（信任，誠實）5+5×δ+5×δ+…=5/(1-δ)原因及其解決：中國企業不重視信譽的原因在于產權不明晰和政府對經濟的任意干預。為了使執法者重視自己的信譽,有必要在司法系統引入競爭機制。——來源文獻：張維迎.法律制度的信譽基礎.《經濟研究》,2002(1):3-13.委托人0,0代理人5,5-5,10不信任信任誠實不誠實案例2：審計公司的聲譽激勵注重聲譽具有促使審計公司履行監督和公證職能的積極作用。在審計評估市場上，通過建立管理人員和審計者之間的兩階段重復博弈模型，考慮到聲譽作為唯一的激勵因素，本文解釋了注重聲譽反而導致審計公司虛假報表因為后一階段的真實匯報，將暴露出

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

《第三章傳統博弈理論(1重復博弈)》

文檔簡介

溫馨提示

最新文檔

評論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

《第三章 傳統博弈理論(1重復博弈)》

文檔簡介

溫馨提示

最新文檔

評論

相關文檔

《第三章傳統博弈理論(1重復博弈)》