




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第5章演化博弈經濟學與生物學經濟學和生物學的歷史從來就交織在一起。眾所周知,CharlesDarwin的一個核心洞見就來源于ThomasMalthus(1803)。對于Darwin來說,Malthus的人口的增長率傾向于超過產量增長率的論證暗示著不可避免的生存之戰,因此暗示著適者生存的自然選擇。二者研究的都是個體在給定環境下的最優策略。它們包含的內在邏輯相當一致:所有生命體的行為看上去總好像設法使其基因的遺傳頻率最大化,正如企業最大化其利潤一樣。經濟學與生物學經濟學生物學企業物種(或個體)最優化適應策略基因利潤適應性(fitness)擴張繁殖倒閉滅絕創新變異
在經典博弈論中,假設參與人具有使自己支付最大化的主觀意識與對于對手策略的最優反應能力,在實際中,這種假設可能是不現實的。譬如在“象棋”中,棋手不可能在每一步都能夠采取最優的反應行動。自然界中的博弈吸血蝙蝠夜間去大型哺乳動物那里吸血,有些個體偶爾會空腹而歸,此時吸飽血的個體就會吐出胃內的血液喂給饑餓的個體,盡管它們之間并沒有直接血緣關系。吸血蝙蝠更有可能回吐血液給以前曾經回吐過血液的蝙蝠,而騙子(拒絕分享的蝙蝠)將被蝙蝠群體記住,并且被排除在這種協作之外。自然界中的博弈白色念珠菌(Moniliaalbican或canidiaAlbicans),是一種真菌,通常存在于正常人口腔和消化道粘膜中,一般在正常機體中數量少,不引起疾病。當機體免疫功能或一般防御力下降,則本菌大量繁殖并改變生長形式(芽生菌絲相)侵入細胞引起疾病。演化博弈論(evolutionarystablestrategy)整合了理性經濟學與演化生物學的思想,不再將參與人模型化為超級理性的博弈方,認為參與人通常是通過試錯的方法達到博弈均衡的,與生物演化具有共性。在演化博弈中,認為參與人的選擇行為可以依據前人的經驗、學習與模仿他人行為、受遺傳因素的決定等。因而演化博弈把具有主觀選擇行為的參與人擴展為包括動物、植物在內的有機體,動植物參與者的支付可被理解為為某種適應程度。把博弈論的分析與應用從研究人類的競爭行為擴展為研究有機體的策略互動關系。這個領域的開創性工作是由英國生物學家約翰·梅納德·史密斯(JohnMaynardSmith)和G.R.普萊斯(G.R.Price)1973年進行的。演化博弈現在正逐漸被廣泛應用于社會經濟學領域。演化博弈的關注內容演化博弈強調經濟變遷過程中以個體多樣性變異機制和偏好選擇機制為代表的種群研究。它探討種群選擇的策略是否獲得最佳的收益,并消除任何小的突變群體的擾動。演化博弈的假設條件首先我們假定群體中的參與人都是完全相同的,因此以下我們只考慮對稱博弈。其次,我們假定每個參與人只能機械地選擇某種策略(而無法改變自己的策略)。如果某種策略獲得了成功,采用這種策略的參與人將越來越多,反之如果某種策略不成功,采用這種策略的參與人就越來越少。演化穩定策略(ESS)演化穩定策略,是指如果占群體絕大多數的個體選擇演化穩定策略,那么小的突變者群體就不可能侵入到這個群體。或者說,在自然選擇壓力下,突變者要么改變策略而選擇演化穩定策略,要么退出系統而在進化過程中消失。例1:囚徒困境博弈CDC2,20,3D3,01,1C代表合作,D代表背叛。合作是否是一種演化穩定策略?分析:CDC2,20,3D3,01,1假定一個群體由合作者構成,由于基因變異出現了比例為ε的背叛者。此時合作者的收益為:(1-ε)*2+ε*0=2-2ε背叛者的收益為:(1-ε)*3+ε*1=3-2ε由于背叛者的收益高于合作者的收益,背叛者不僅不會消亡,反而會越來越多。因此,合作不是一個演化穩定策略。演化穩定策略是什么呢?CDC2,20,3D3,01,1假定一個群體由背叛者構成,由于基因變異出現了比例為ε的合作者。此時背叛者的收益為:(1-ε)*1+ε*3=1+2ε合作者的收益為:(1-ε)*0+ε*2=2ε由于合作者的收益低于背叛者的收益,合作者會逐漸消亡,因此背叛是一個演化穩定策略。結論:嚴格劣策略不可能是演化穩定策略。例2:ABCA2,20,00,0B0,00,01,1C0,01,10,0問題1:C是否是一個演化穩定策略?結論:一個策略可以入侵別的策略,并不意味著它就是演化穩定策略。問題2:C是否是一個納什均衡?結論:如果一個策略組合(S,S)不構成納什均衡,則S不是演化穩定策略。納什均衡與演化穩定策略ABA1,10,0B0,00,0博弈的納什均衡(A,A)和(B,B)。B是否是一個演化穩定策略?結論:1.納什均衡并不意味著演化穩定策略;2.嚴格納什均衡意味著演化穩定策略。純策略下演化穩定策略的定義1
(MaynardSmith,1972)純策略下演化穩定策略的定義2例3:找出ESSABA1,11,1B1,10,0U(A,A)=U(B,A)U(A,B)>U(B,B)因此A是演化穩定策略例4:ABA10,100,0B0,01,1演化穩定策略:A和CC是一種效率很低的狀態,但社會一旦陷入了這種狀態,就很難走出去。這就是所謂的“路徑依賴”路徑依賴路徑依賴(Path-Dependence),指人類社會中的技術演進或制度變遷均有類似于物理學中的慣性,即一旦進入某一路徑(無論是“好”還是“壞”)就可能對這種路徑產生依賴。一旦人們做了某種選擇,就好比走上了一條不歸之路,慣性的力量會使這一選擇不斷自我強化,并讓你輕易走不出去。有人將5只猴子放在一只籠子里,并在籠子中間吊上一串香蕉,只要有猴子伸手去拿香蕉,就用高壓水教訓所有的猴子,直到沒有一只猴子再敢動手。然后用一只新猴子替換出籠子里的一只猴子,新來的猴子不知這里的“規矩”,竟又伸出上肢去拿香蕉,結果觸怒了原來籠子里的4只猴子,于是它們代替人執行懲罰任務,把新來的猴子暴打一頓,直到它服從這里的“規矩”為止。試驗人員如此不斷地將最初經歷過高壓水懲戒的猴子換出來,最后籠子里的猴子全是新的,但沒有一只猴子再敢去碰香蕉。起初,猴子怕受到“株連”,不允許其他猴子去碰香蕉,這是合理的。但后來人和高壓水都不再介入,而新來的猴子卻固守著“不許拿香蕉”的制度不變,這就是路徑依賴的自我強化效應。路徑依賴的例子路徑依賴的例子一個廣為流傳、引人入勝的例證是:現代鐵路兩條鐵軌之間的標準距離是四英尺又八點五英寸。原來,早期的鐵路是由建電車的人所設計的,而四英尺又八點五英寸正是電車所用的輪距標準。那么,電車的標準又是從哪里來的呢?最先造電車的人以前是造馬車的,所以電車的標準是沿用馬車的輪距標準。馬車又為什么要用這個輪距標準呢?英國馬路轍跡的寬度是四英尺又八點五英寸,所以,如果馬車用其他輪距,它的輪子很快會在英國的老路上撞壞。這些轍跡又是從何而來的呢?從古羅馬人那里來的。因為整個歐洲,包括英國的長途老路都是由羅馬人為它的軍隊所鋪設的,而四英尺又八點五英寸正是羅馬戰車的寬度。任何其他輪寬的戰車在這些路上行駛的話,輪子的壽命都不會很長。可以再問,羅馬人為什么以四英尺又八點五英寸為戰車的輪距寬度呢?原因很簡單,這是牽引一輛戰車的兩匹馬屁股的寬度。故事到此還沒有結束。美國航天飛機燃料箱的兩旁有兩個火箭推進器,因為這路徑依賴些推進器造好之后要用火車運送,路上又要通過一些隧道,而這些隧道的寬度只比火車軌道寬一點,因此火箭助推器的寬度是由鐵軌的寬度所決定的。所以,最后的結論是:路徑依賴導致了美國航天飛機火箭助推器的寬度,竟然是兩千年前便由兩匹馬屁股的寬度所決定的。成功是一種習慣人們關于習慣的一切理論都可以用“路徑依賴”來解釋。它告訴我們,要想路徑依賴的負面效應不發生,那么在最開始的時候就要找準一個正確的方向。每個人都有自己的基本思維模式,這種模式很大程度上會決定你以后的人生道路。而這種模式的基礎,其實是早在童年時期就奠定了的。做好了你的第一次選擇,你就設定了自己的人生。路徑依賴與制度變革對組織而言,一種制度形成后,會形成某個既得利益集團,他們對現在的制度有強烈的要求,只有鞏固和強化現有制度才能保障他們繼續獲得利益,哪怕新制度對全局更有效率。對個人而言,一旦人們做出選擇以后會不斷地投入精力、金錢及各種物資,如果哪天發現自己選擇的道路不合適也不會輕易改變,因為這樣會使得自己在前期的巨大投入變得一文不值,這在經濟學上叫“沉沒成本”。沉沒成本是路徑依賴的主要原因。獵鹿博弈獵鹿博弈源自啟蒙思想家盧梭的著作《論人類不平等的起源和基礎》中的一個故事。古代的村莊有兩個獵人。當地的獵物主要有兩種:鹿和兔子。如果一個獵人單兵作戰,一天最多只能打到4只兔子。只有兩個一起去才能獵獲一只鹿。從填飽肚子的角度來說,4只兔子能保證一個人4天不挨餓,而一只鹿卻能讓兩個人吃上10天。改變收益矩陣的獵鹿博弈33044044另一個例子
問題1:此博弈對應現實生活中的什么情況
問題2:此博弈是否存在演化穩定策略ABA0,02,1B1,20,0混合策略下演化穩定策略的定義找出以下博弈的混合策略ESSABA0,02,1B1,20,0(1)找出博弈的混合策略納什均衡。 由于博弈的對稱性,雙方的混合策略納什均衡必然是相同的,設為(p,1-p) 給定局中人1的策略(p,1-p) 局中人2選擇A的收益:p*0+(1-p)*2=2-2p 局中人2選擇B的收益:p*1+(1-p)*0=p 根據2-p=p,解出p=2/3(2)(2/3,1/3)是否是一個嚴格納什均衡?(3)(2/3,1/3)是否是ESS?象海豹的生存策略鷹鴿博弈HDH(v-c)/2,(v-c)/2v,0D0,vv/2,v/2博弈的演化穩定策略是什么?當v>c時,(H,H)是嚴格納什均衡,因此H是演化穩定策略。當v=c時,(H,H)是弱納什均衡,因為U(H,D)>U(D,D),因此H是演化穩定策略當v<c時,不存在純策略演化穩定策略。此時是否存在混合策略ESS?首先找出混合策略納什均衡(v/c,1-v/c),其次驗證其是否為ESS。石頭剪刀布RSPR1,1V,00,VS0,V1,1V,0PV,00,V1,11<V<2易證,博弈中唯一的混合策略納什均衡是p=(1/3,1/3,1/3)驗證其是否為ESS,設p‘=(p,q,1-p-q)U(p,p')=(1+V)/3U(p',p')=1U(p,p')<U(p',p')因此博弈中不存在ESS蜥蜴的生存策略動態演化復制者(replicator)能夠大致精確地復制自身的個體。例如基因、生物體或是彌母(meme)動態演化的復制者系統不同復制者的所占比例隨時間的變化過程,其中不同策略復制的速度與他們的收益呈正相關。復制者的策略考慮一個n人演化博弈(i=1,2,...n),博弈在每個時間點t上進行(t=1,2,...).設pit為在t期中采用策略si的局中人的比例,此時si的收益為πit=πi(pt),其中p=(p1,...,pn)。不妨設π1t≤π2t≤…≤πnt假定在每個時期dt,每個個體i都以αdt的概率發現某個隨機個體j的收益,如果i發現j的收益比自己高,就以pijt的概率轉變為j的策略。此時在t+dt期使用si策略的局中人所占比例的期望值Epit+dt為:如果個體數量很多,則Epit+dt≈pit+dt這個式子稱為復制者動態(replicatordynamic)方程復制者動態方程的應用鷹鴿鷹u-1,u
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆山東省中學聯盟(普高文化)高三開學考-語文試題(含答案)
- 購買電纜線合同協議
- 2025幼兒園數學難易結合考試試題及答案
- 2022年全國中學生數學奧林匹克競賽(預賽)暨 2022年全國高中數學聯合競賽(B1卷)參考答案及評分標準
- 商標托管合同協議
- 正規回遷房合同協議
- 商家入駐意向合同協議
- 品牌廣告施工合同協議
- 商場購物停車協議合同協議
- 咖啡車攤位租賃合同協議
- 2025年五級應急救援員資格理論考試題庫(含答案)
- 2025年廣東省深圳市南山實驗教育集團中考一模英語試題(含答案)
- 統編版道德與法治四年級下冊第9課《生活離不開他們》精美課件
- 2025-2030中國汽車線控底盤行業市場現狀分析及競爭格局與投資發展研究報告
- 中華農耕文化歷史與現實知到課后答案智慧樹章節測試答案2025年春中國農業大學
- 中考語文試卷名著專題匯編《駱駝祥子》看圖題(含答案)(截至2024年)
- 設備采購方案投標文件(技術方案)
- 信息技術必修2信息系統與社會3.2《數據庫的構建》教學設計
- 氫能源項目融資計劃書
- 2025年丹江口水力發電廠招聘筆試參考題庫含答案解析
- 住宅室內裝飾裝修管理辦法
評論
0/150
提交評論