博弈論復習題及答案_第1頁
博弈論復習題及答案_第2頁
博弈論復習題及答案_第3頁
博弈論復習題及答案_第4頁
博弈論復習題及答案_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優質文檔-傾情為你奉上一、名詞解釋(每題7分,共28分)1、逆向選擇:逆向選擇源于事前的信息不對稱,經典例子就是“檸檬市場”二手車市場,它使得市場資源逐漸流向低質量的產品或要素,最后形成劣貨驅逐良貨的局面,這種現象稱之為“逆向選擇”。2、策略互動:所謂策略互動,就是參與人之間的策略相互影響、相互作用和相互制約。用策略性思維來分析問題,從中找出合理策略,實現目標最優。3、納什均衡:對于博弈方而言,互為最優的策略選擇就是納什均衡。4、信號發送:是指信息優勢方不斷發出信息的行為,就叫信號發送。5、博弈論:研究人們如何進行決策,以及這種決策如何達到均衡(合理策略)的問題。每個博弈者在決定采取何種行

2、動時,不但要根據自身的利益和目的行事,還必須考慮到他的決策行為對其他人的可能影響,以及其他人的反應行為的可能后果,通過選擇最佳行動計劃,來尋求收益或效用的最大化。二、簡要回答問題(每題10分,共40分)1、博弈的基本要素有哪些?基本特點是什么?答:博弈的基本要素有:參與人、策略、行動順序、信息、收益等五個要素。博弈的基本特點則是需盡可能考慮到博弈對方的決策選擇以及對自身的影響,并從中選擇出對自身最有利的方案決策,從而達到收益和效用最大化。2、什么是性別戰博弈?請求出其中的納什均衡?答:性別戰博弈是不可調和的博弈,雙方只有一方選擇滿足另外一方的要求才能達成均衡,也就是混合策略納什均衡;故性別戰博

3、弈的納什均衡會有兩種情況,分別是:男生陪女生看電影以及女生陪男生看足球的兩種選擇。3、獵鹿博弈反映的基本思想是什么?答:反應的基本思想是需要溝通和互相協調,因為只有合作才能獵到所需獵物。4、什么是道德風險?有什么辦法可以解決道德風險問題?答:道德風險是指委托-代理框架中,由于委托人無法直接觀察代理人行動,造成信息不對稱,從而出現代理人選擇不利于委托人的行為的一種現象;解決道德風險的方法可以用簽訂合同、派人監督,以及采用激勵等方式來進行解決,約束和激勵機制。三、計算題(16分)1、求解下列博弈中的納什均衡(包括混合策略納什均衡)。 NF2B2HF15,20,0B10,02,4答:根據上方的矩陣圖

4、,我們可得出其博弈中存在兩種策略的納什均衡:分別是H選擇F1和N選擇F2,以及H選擇B1和N選擇B22、A、B兩者博弈:A首先行動,可以選擇“左”或者“右”的行動;B后行動,有“L”和“R”的行動,其收益如下:當A選左,B選L時,A的收益為2 ,B的收益為3;當A選左,B選R時,A的收益為1 ,B的收益為4;當A選右,B選L時,A的收益為3 ,B的收益為1;當A選右,B選R時,A的收益為0 ,B的收益為2。請畫出該博弈的博弈樹,并求出該博弈的均衡解。四、論述題(16分)1、請結合你的工作或生活,談談對行動的可信性的理解,有什么方法可以建立可信的策略行動。答:每一種策略性行動都面臨著可信性的問題

5、,人們不一定相信策略性行動的提出者會實施其行動。因此提出者必須做一些輔助工作讓人相信他會在第二階段實施他已宣布的事。比如,工作中管理者對員工上班時間玩游戲的態度有所不同。一些管理者對員工很寬容,并不懲罰玩游戲的員工。另一些管理者則十分嚴厲,會處罰玩游戲的員工。一些管理者雖然說了會處罰的承諾,但禁不住員工的好話及其它員工的求情,就原諒了員工。從博弈論角度分析,假設三種管理者手下的員工各方面都相同,哪一種管理者將得到最高的支付呢?管理者對玩游戲的態度可以是“處罰”或“原諒”,員工可以“玩游戲”或“不玩游戲”,如下表所示:員工玩游戲不玩游戲管理者處罰1,13,2原諒2,44,3管理者并不希望自己不近

6、人情,故他們最好的結果就是(4,3),最不好的結果就是(1,1);余下的兩個策略,因管理者希望員工不玩游戲,故(3,2)好于(2,4)。員工最喜歡(4,3),最不好的結果也是(1,1),余下的,員工(2,4)好于(3,2)。在此博弈中,若同時行動,或者是管理者后行動,與處罰帶來的1和3的支付相比,原諒能帶來2和4,是占優策略。此時,員工則會選擇玩游戲。最終,均衡的結果是(2,4)。而如果管理者一開始就承諾“處罰”的話,員工會發現不玩游戲會更好,于是管理者得到了支付3。但是如果有員工曾被管理者原諒,可能他就會認為管理者心軟,不相信管理者做出的“處罰”承諾,從而玩游戲。此時,就會得到一個最壞的結果

7、,即(處罰,玩游戲),其支付僅為(1,1)。通過采取某種行動,改變博弈以得到更好的結果,這就是策略行動。策略行動分:承諾、威脅及許諾。這三種策略性行動最重要的,是必須讓博弈的其他參與人相信策略性行動的提出者在第二階段中確實會做其在第一階段中宣布的事。而在此每一種策略行動都面臨著可信性的問題,人們不一定相信策略行動的提出者會實施其行動。因此僅僅宣布是不夠的。在第一階段,提出者必須做一些輔助工作讓人相信其會在第二階段做已宣布的事。上述博弈中涉及的是管理者對玩游戲員工“處罰”態度的承諾。在這個事件中,管理者為了從策略行動中獲得好處,他所做的承諾不能和同時行動博弈的均衡策略一樣,因此管理者選擇了“處罰

8、”的承諾,這個策略行動改變了員工的期望和行動。一旦員工相信這種承諾,則他們會不玩游戲,從而得到(3,2)的支付。如果員工們嘗試玩一次游戲,管理者可能會原諒他們,理由是“只此一次”,這里就存在了使策略性行動不付諸實踐的誘惑, 使得承諾的可信性下降。如果最終員工不再相信“處罰”的承諾,則他們會玩游戲,從而最終管理者和員工只得到(1,1)的支付,雙方利益均受損。這就是管理者鐵石心腸的原因。因為他清楚破例原諒員工一次的危險性。因此,管理者需要做一些事情來確立他策略行動的可信性,即讓其他參與人相信他們的行動如違背你的承諾,你將一定會付諸實踐,而不會因人情等引誘而放棄。避免危險的辦法通常只有一個,那就是絕

9、不越雷池半步。并且管理者們需要找到某些方法使其的拒絕合理可信,同時提高其策略行動的可信性。第一、通過減少未來行動的自由,排除引誘行動,只能實施策略行動中所確定的行動。例如,管理者可以拿規章制度或工作紀律做擋箭牌,這些制度紀律一旦制定則個別管理者就不能在任何特殊情況下破例。這樣做,就等于將“原諒”行動從他們的選擇組合中剔除了,因此他只能實施“處罰”的承諾。規則的存在讓員工相信管理者不可能再改變想法,所以此時管理者“處罰”的承諾就是可信的了。第二、改變未來的支付, 減少引誘行動的支付使實施策略行動成為最佳行動。管理者可以通過幾次毫不讓步的處罰建立起嚴厲的聲譽,雖然毫不讓步的處罰可能不是一件愉快的事

10、,也可能違背管理者的本意,但這在漫長的工作生涯中是有好處的。因為如果一個管理者被認為非常嚴厲,就沒有員工想用借口搪塞他,而他也就減少了拒絕員工的不愉快。如果管理者在一個博弈里未能兌現他的承諾,他的聲譽將受到損害,這也就導致他在其他的博弈里得到低的支付。由此觀之,提高策略行動的可信性將有助于提高策略性博弈中獲得的支付。因此,學會運用堅守原則、提高聲譽等方法增強自己行為的可信性,能幫助我們在今后的生活中選擇最佳行為,獲得更高的收益。2、中國的外交政策一貫堅持和平外交,因此,中國一直不斷裁軍,但中國同時也擁有一定數量的核武器。請用所學的博弈理論分析這一現象。答:以博弈論著名的案例“囚徒困境”為例:警

11、察抓到兩個縱火案犯罪嫌疑人,然后將它們隔離關押起來,并要求他們坦白交代。假定:如果兩人都承認縱火,每人將被判刑3年;如果都不承認,每人將被判刑1年;如果一個不承認而另一個坦白并作證,那么抵賴者將被判刑5年,坦白者將被釋放。這兩個囚徒將做出怎樣的選擇呢?顯然,在以上假定中,最好的結果是雙方都選擇抵賴,結果是大家都只被判刑1年。但是,由于兩個囚徒在理論上都是從利已的目的出發進行決策的所謂“理性行為者”,在無法獲取對方的完全信息并給予對方充分信任的情況下,每一個人大概都會選擇似乎對自己最有利的策略,即選擇坦白。出現了個體理性(都選擇坦白,各被判3年)與集體理性(都不承認,各被判1年)的沖突。國與國之

12、間的擴軍、裁軍也是這樣一種“囚徒困境”,在雙方信息溝通不暢的情況下,就會導致雙方不能達成合作,一國的個體理性導致了國與國之間的集體非理性,沒有實現相互之間的利益最大化。我國一貫堅持和平外交,同時擁有一定數量的核武器,并且承諾不首先使用核武器,這就避免為了達到先發制人的目的,而不得不投巨資花大錢在軍備上以確保己方克敵制勝的能力。我國這樣的核戰略,一方面降低了我國在其他核大國眼中威脅,另一方面保證我們可以把更多的錢用在社會經濟建設和綜合國力提升上。有了最低限度核威懾戰略(一報還一報的最優策略)的保障,再通過充分的信息溝通,就可以打破國與國之間在軍備競賽中的囚徒困境。以中美、中俄為例,我們主動釋放善

13、意,不斷裁軍,同時,著力提升我國綜合國力,加大中美、中俄雙邊經濟、社會、文化、軍事方面的交流溝通,使得博弈雙方認識到博弈的各種可能結果,從而超越“你死我活”的“零和對局”,而實現“雙贏”乃至于“多贏”,進而實現集體理性。3、我們經常在報紙上看到很多企業(比如家電企業)經常希望建立價格聯盟,但往往是無功而返。即使價格聯盟成立了,也很快就破裂了。請用囚徒困境的思想進行解釋。有什么辦法可以讓聯盟達成。答:假設兩囚徒被指控是一宗罪案的同案犯。他們被分別關在不同的牢房無法互通信息。各囚徒都被要求坦白罪行。如果兩囚徒都坦白,各將被判入獄5年;如果兩人都不坦白,兩囚徒可以期望被從輕發落入獄2年;如果一個囚徒

14、坦白而另一個囚徒不坦白,坦白的這個囚徒就只需入獄1年,而不坦白的囚徒將被判入獄10年。囚徒困境的策略矩陣表。每個囚徒都有兩種策略:坦白或不坦白。通過劃線法可知:在囚徒困境這個模型中,納什均衡就是雙方都“坦白”。給定甲坦白的情況下,乙的最優策略是坦白;給定乙坦白的情況下,甲的最優策略也是坦白。這里雙方都坦白不僅是納什均衡,而且是一個上策均衡,即不論對方如何選擇,個人的最優選擇是坦白。其結果是雙方都坦白。市場上的價格戰也是一場囚徒博弈,在國內的家電大戰中,雖然不是兩個對手之間的博弈,但由于在眾多對手當中每一方的都很大,每一個主體人的行為后果受對手行為的影響都很大,因此,其情景大概也是如此。如果清楚這種前景,雙方勾結或合作起來,都制定比較高的價格,那么雙方都可以因為避免價格大戰而獲得較高的利潤。但是往往這些聯盟處于利益驅動的“囚徒困境”,各個廠商為了追求自身的市場份額,都有背叛價格聯盟和針對它的競爭者削價的動機,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論