




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、博弈是人們的行為之間的交互作用 博弈論的含義博弈論是研究在策略性環境中如何進行策略性決策和采取策略性行動的科學。策略性環境是指,每一個人進行的決策和采取的行動都會對其他人產生影響;策略性決策和策略性行動是指,每個人要根據其他人的可能反應來決定自己的決策和行動。在所有社會,人們經?;印S袝r,互動是合作,其他的時候,互動是競爭。在這兩種情況下,都可以用一個術語,即相互依賴性來表示一個人的行為對另外一個人的福利造成的影響。 相互依賴的情形可稱為策略環境。因為人們為了確定所采取的最優行動,必須考慮他周圍的其他人會怎樣 選擇行動。策略對于社會的運行來說,是非常基本的。我們要學會了解在策略環境下,人們實
2、際上是如何采取行動的,以及他們應該怎樣采取行動。這種系統的研究形成了策略互動的理論。博弈論三要素:博弈的三個基本要素三個基本要素,即參與人、參與人的策略和參與人的支付。所謂參與人(或稱局中人),就是在博弈中進行決策的個體;所謂參與人的策略,指的是一項規則,根據該規則,參與人在博弈的每一時點上選擇如何行動;所謂參與人的支付是指,在所有參與人都選擇了各自的策略且博弈已經完成之后,參與人獲得的效用(或期望效用)。3.博弈的簡單分類根據參與人的數量,可以分為二人博弈和多人博弈;根據參與人的支付情況,可分為零和博弈和非零 和博弈;根據參與人擁有的策略的數量多少,可分為有限博弈和無限博弈;根據參與人在實施
3、策略上是否 有時間的先后,可分為同時博弈和序貫博弈。一些概念:局中人或參與者(Players )規則(rules ):規定博弈各方的行動順序、方式、以及最終的結果等。策略(Strategy ):一整套的行動方案, 規定了各種情況下的行動。比如:敵進我退,敵退我追,敵駐我擾,敵疲我打。相機策略(contingent strategy):僅在不確定事件發生時才會采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。行動:局中人在特定條件下的行為支付(Pay-off ):博弈結束時,各方得到的收益。策略均衡:參與者之間穩定的、可預測的互動行為模式,就是策略均衡。上策均衡與納什均衡上策均衡:我所做的
4、是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的所謂上策,是指這樣一種策略,即不管對手采取什么策略,這種策略都是最優的。而當對局者選擇的都是上策的時候,這種均衡叫做上策均衡。NAS陽衡:我所做的是給定你所做的我所能做的最好的你所做的是給定我所做的你所能做的最好的納什均衡是指在對手策略既定的情況下,各自對局者所選擇的策略都是最好的。在一個納什均衡里,任何一個參與者都不會改變自己的策略,如果其他參與者不改變策略。上策均衡與納什均衡的區別:(1)上策均衡是指不管你選擇什么策略,我所選擇的是最好的;不管我選擇什么策略,你所選擇的是最好 的。 納什均衡是指給定你的策略,我所選擇的是最
5、好的;給定我的策略,你所選擇的是最好的。上策均衡是納什均衡的一種特殊情況,但納什均衡卻不一定是上策均衡。求純策略博弈的納什均衡街解的方法混合策略均衡的情侶博弈,根據支付矩陣計算出博弈雙方的期望得益分析該博弈的納什均衡的概率分布尋找混合策略納什均衡的思路令各博弈方隨機選擇純策略的概率分布,滿足使其他博弈方采用不同策略的期望得益相同,從而計算出各個博弈方隨機選擇各純策略的概率。在猜硬幣博弈中,設蓋硬幣方出正面的概率為 p,出反面的概率為1-p。則猜硬幣方猜正面的期望得益為p -1+(1-p) (-1)=2p-1 ,猜反面的期望得益是 p - (-1)+(1-p)- 1=1-2p,令二者相等,得p=
6、1/2。蓋硬幣方的混合策略是以(1/2,1/2 )的概率隨機選擇正面和反面。類似的,可以計算出猜硬幣方的混合策略。 ,期望支付運用兩個參與人的混合策略組合,可以分別表示出兩個參與人得到的支付。Ea = p1q1A1 + p 1(1 - q1)A12 + (1 - p)qA1 + (1 - p1)(1 -q1)A22-p1q1(A1 -A21)(1 - q1)(A2一A22)q1(A21-A22)A=p A q3 - %)A>2其中,M =q/A1 A1) +(1 qJ(A2 A2)是A勺判別式Eb = pfliE + p1(1 - q002 + (1 - R) q' + (1 -
7、 p)(1-4)民2=plq - B21) (1 -q)( B2 - 一媒艮1 - 民2)B.2= pB q<B21 -B22)%其中,;b = 8B1 -&)(1 -q)(B12 - %)是B勺判別式博弈樹1 .博弈樹的起點“起點”又叫做“初始決策點”,通常只有一個。起點是博弈樹的“根”,是序貫博弈開始的地方, 是博弈的最先行動者進行決策的地方。2 .博弈樹的線段從初始決策點出發,向右伸展兩條線段,分別表示競爭者可以采取的兩個行動或策略。3 .博弈樹的中間點中間點又叫做“中間決策點”,通常至少應有兩個。通常在這些中間決策點的旁邊標上另一參與人,表示中間點是另一參與人做決策的地方
8、。博弈樹的終點第一,終點不是決策點終點是博弈結束的地方。與起點和中間點不同,終點不是決策點:既不是初始決策點,也不是中間決策點。因此,終點不屬于任何的參與人,終點的旁邊沒有標注任何的參與人。第二,終點的兩層含義一是代表博弈的一個策略組合一一從起點開始導向某個終點的所有線段按先后秩序排列的一個組二是代表與某一個策略組合相對應的一個支付組合一一在每一個終點的旁邊,有一對用圓括號圍 住的數字,其中的第一個數字是先行動者的支付,第二個數字是后行動者的支付。逆向歸納法求解子博弈的精煉納什均衡解逆向歸納法的兩個步驟第一步,先從博弈的最后階段的每一個決策點開始,確定相應參與人此時所選擇的策略,并把參與人 所
9、放棄的其他策略刪除,從而得到原博弈的一個簡化博弈;第二步,再對簡化博弈重復步驟一的程序,直到最后,得到原博弈的一個最簡博弈。這個最簡博弈, 就是原博弈的解。簡化之后舉例情侶博弈足身足球女足球足球世普芭蕾 (0,0)足球足理 ( 1+芭蓿女方的選擇完全由男方的選擇所決定:男(足)-女(足);男(芭)-女(芭)男方的最優策略是選足球,女也選足球,即最優策略組合為(足球,足球) 逆向歸納策略總是納什均衡,納什均衡不一定是逆向歸納均衡。先動優勢從情侶博弈的例子中可以看到所謂的“先動優勢”一一先行動者的得益大于后行動者的得益。如男方先動,逆向歸納的結果就是對男方更有利的納什均衡(足球,足球);如改為女方
10、先動,則逆 向歸納的結果就是對女方更有利的納什均衡(芭蕾,芭蕾)。足球芭蕾足球(0. 0)足球也簫(2,1) 該混合策略納什均衡給麗娟帶來的期望得益是:帶斷者睿匕一dI h 4 J血競爭者 網gJ-CO. 5)/壟斷者抵抗co, n裝斷背容忍一一d進入b抵抗y.2)競爭并“不進入、c容想.一一If %5抵疣一to*3 )(1-p)?0 ?1+p?0 ?0+(1-p) ? (1-0 ) ? (-1) +p?(1- 0 ) ?2=0.5 給大海帶來的期望得益是:(1-p)?0 ?2+p?0 ?0+(1-p) ? (1-0 ) ? (-1) +p?(1- 0 ) ?1=0.5麗娟 p為麗娟選擇芭蕾的
11、概率足芭蕾2, 10, 0-1,-11,2逆向遞歸法邏輯基礎:動態博弈中先行動的博弈方,在前面階段選擇行為時必然會考慮后行為博弈方在后面階段的選 擇,只有在博弈最后一個階段選擇的博弈方才能直接作出明確選擇。而當后面階段博弈方的選擇確定后, 前一階段博弈方的行為也就容易確定了。一般方法:從動態博弈的最后一個階段開始分析,每一次確定出所分析階段博弈方的選擇和路徑,然后再 確定前一個階段博弈方的選擇和路徑,逐步向前逆推以求解出動態博弈均衡。子博弈定義:由一個單結信息集開始的與所有該決策結的后續結(包括終點結)組成的能自成一個博弈的原博弈 的一部分。仿冒 不制止X不住冒:(0,10)仿冒心不仿&quo
12、t;仿冒與反仿冒博弈B受:x5:制方/ 不制因他切子博弈精煉納什均衡定義:如果在一個完全信息動態博弈中,各博弈方的策略構成的一個策略組合滿足,在整個博弈及它的所 有子博弈中都構成納什均衡,那么這個策略組合稱為該動態博弈的一個子博弈精煉納什均衡。幻燈片26以法律保障不足的開金礦博弈為例策略組合“乙在第一階段選擇借,第三階段選擇打;甲在第二階段選擇分",即(借, 打),(分),雖然是整個博弈的一個納什均衡,但這個策略組合中乙的策略要求乙在第三階段的 子博弈中選擇的“打”,不是該子博弈的一個納什均衡,因此這個策略組合不是子博弈精煉納什均衡。 而策略組合(不借,不打),(不分)則是該博弈的子
13、博弈精煉納什均衡。因為該策略組合的雙 方策略不僅在整個博弈中構成納什均衡,而且在兩級子博弈中也都構成納什均衡(從而不存在任何不 可信的威脅或承諾)。注意:當博弈方按上述子博弈精煉納什均衡策略組合行動時,實際上不會進行到博弈的第二、三階段,兩博弈方在第二、三階段的行為實際上不會發生。但作為完整策略的表達,在描述子博弈精煉納什均 衡的策略選擇時,必須將其給出。幻燈片28三、子博弈精煉納什均衡求解方法逆向歸納法是求解子博弈精煉納什均衡的最簡便方法。完全信息動態博弈的每一個決策結都是一個單獨的信息集,每一個決策結都開始一個子博弈。這樣, 可以從最后一個子博弈開始(即從最后一個決策結開始)逆推上去,求解子博弈精煉納什均衡?;脽羝?0四、承諾行動與子博弈精煉納什均衡前面已知,有些納什均衡之所以不是精煉均衡,是因為它們包含了不可信威脅。這也意味著,如果參 與人能在博弈之前采取某種措施改變自己的行動空間或支付函數,原來不可信的威脅就可能變得可 信,博弈的均衡就會相應改變。將這些為改變博弈結果而采取的措施稱為“承諾行動”。在許多情況下,承諾行動對當事人是很有價值的。特別的,有時一個參與人通過減少自己的選擇機會 使自己受益,原因在于保證自己不選
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025合作合同范本供參考
- 2025安置房買賣合同書范本
- 2025全國合同范本
- 湖南省郴州市多校聯考2024-2025學年高三下學期4月綜合性模擬考試英語試題(含解析無聽力音頻有聽力原文)
- 廣東省廣州市2024-2025學年高一下學期期中考試英語試題
- 2025年疆維吾爾自治區阿勒泰地區中考二模歷史試題(含答案)
- 湖北省恩施市龍鳳初中2024-2025學年八年級下學期期中道德與法治考試題(無答案)
- 環保設備融資租賃合同協議
- 電子軟件租賃合同協議
- 現價出售房屋合同協議
- 圖書館讀書會服務合同
- 排水工程(下)重點
- 基于STM32單片機的智能停車場車位管理系統的設計與實現
- 《土地管理法解析》課件
- 大數據開發工程師招聘面試題與參考回答(某世界500強集團)2025年
- 養老院查房巡視管理制度
- 按摩店技師免責協議書
- 聲音與情緒管理
- 直播中控轉正述職報告
- 史寧中:義務教育數學課標(2022年版)解讀
- 中華人民共和國統計法
評論
0/150
提交評論