




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、決策實際與方法Decision Making Theory and Methods 第九章 競爭型決策方法學習目的 了解競爭型決策的根本概念,了解競爭型決策的根本實際,掌握競爭型決策的研討方法,最終在現實生活中可以熟練運用。 本講內容9.1 競爭型決策概述9.2 完全信息靜態競爭型決策9.3 完全信息動態競爭型決策9.4 不完全信息靜態競爭型決策9.5 不完全信息動態競爭型決策 本章第1節從競爭型決策的景象、競爭型決策的要素、競爭型決策的分類三個方面對競爭型決策的根本概念進展引見,2-5節詳細研討完全信息靜態競爭型決策、完全信息動態競爭型決策、不完全信息靜態競爭型決策、不完全信息動態競爭型決策
2、這4種競爭型決策方法。 經過本章的引見可以讓讀者對競爭型決策有一個全面的了解,并可以在現實生活中運用競爭型決策的實際和方法。9.1 競爭型決策概述 競爭型決策是研討理性的決策者如何在競爭的情況下做出決策的實際,詳細講就是研討當決策主體的行為在發生直接的相互作用時,人們如何進展決策以及這種決策的平衡問題。 競爭型決策問題,不是僅僅局限于站在某個決策方的立場上去找針對其他方的決策,而是從廣義的角度分析在決策過程中決策主體之間相互制約、相互作用的規律,用以指點各決策方的合理決策。 此外,競爭型決策研討的決策問題是包括開場、過程和結果的整個決策過程。 1.“囚徒姿態 “囚徒姿態講的是警方拘捕兩個同案犯
3、罪嫌疑人囚徒后,為防其相互間串供,而將兩人分別拘押、隔離審問時,兩疑犯所面臨的認罪戰略選擇的問題。擺在兩疑犯面前的選擇有兩種:坦率或不坦率。 按照通常的政策,坦率從寬,抗拒從嚴。 所以,假設兩人均坦率,那么可從輕處置,分別判刑5年;假設兩人中有一人坦率而另一人拒不坦率,那么坦率者可免于處分,而拒不坦率者,將從重懲罰被判10年;當然,假設兩人均不交代,而警方手中又無足夠的證據可以指控犯罪嫌疑人,那么他們只能夠被按妨礙公務罪被判被判1年。 9.1 競爭型決策概述9.1.1 競爭型決策的景象 假設用-1,-5,-10分別表示犯罪嫌疑人被判1年、5年、10年的收益,用0表示犯罪嫌疑人被釋放的收益,那么
4、可以用一個矩陣將這個競爭型決策問題表示出來,如圖9-1-1。9.1 競爭型決策概述 圖9-1-1中囚徒1、囚徒2代表本競爭型決策中的兩個競爭參與者,由于這兩個囚徒被隔分開,其中任何一人在選擇戰略時都不能夠知道另一人的選擇,因此可以把他們的決策看作是同時進展的。 矩陣中的每個元素都是由兩個數字組成的數組,表示在所處行、列代表的兩個競爭方所選戰略的組合下雙方各自的收益,其中第一個數字為囚徒1 的收益,第二個數字為囚徒2的收益。對兩個競爭方來講,各自都有兩種可選擇的戰略,但各方的收益不僅取決于本人的戰略選擇,也取決于另一方的對應選擇。因此,各競爭方雖然無法知道另一方的選擇,但是他必需先權衡對方的不同
5、戰略選擇對本人利益的不同影響,然后,做出本人的最正確選擇。9.1 競爭型決策概述 可以看出:兩囚徒決策時都以本人的最大利益為目的,結果是無法實現最大利益甚至較大利益。因此囚徒姿態反映了一個很深化的問題,即個體理性與集體理性之間的矛盾,即從個體利益出發的行為往往不能實現集體的最大利益;用經濟學的術語講,該競爭中存在帕累托改良的時機,而個體理性選擇的結果并非帕累托最優,不符合集體理性的要求,囚徒因此墮入了理性的姿態。這個問題在社會經濟活動中具有很大的普遍性。比如,在市場經濟體制下,每個人或組織僅思索本身利益最大化的結果不一定是資源配置效果的帕累托最優,存在著參與者利益都改良的能夠性卻無法利用,通常
6、稱這種情況為“市場失靈。9.1 競爭型決策概述2.“田忌賽馬 春秋戰國時期齊威王經常約手下大將田忌與他賽馬。賽馬的規那么是這樣的:每次雙方各出三匹馬,一對一競賽三場,每一場的敗者要輸一千金給勝者。齊威王的三匹馬和田忌的三匹馬按實力都可分為上 中、下三等。由于齊威王的上、中、下三匹馬都分別比田忌的上、中、下三匹馬略勝一籌,因此田忌每次都是連輸三場,要輸掉三千金。后來田忌的謀士孫臏知道這一情況后,給田忌出了個主意,即讓田忌不要用本人的上馬去對抗齊威王的上馬,而是用下馬對抗齊威王的上馬,上馬那么去對抗齊威王的中馬,中馬去對抗齊威王的下馬。這樣,雖然第一場田忌必敗無疑,但后兩場田忌卻都能取勝,二勝一負
7、,田忌反而能贏齊威王一千金。 9.1 競爭型決策概述 假設這個故事到這里就終了了,那它還只是一個一方面運用戰略的較為簡單的問題,由于在賽馬的齊威王和田忌兩方中,只需田忌一方認識到戰略的重要性,在安排馬的出場次序方面運用戰略,而齊威王一方卻沒有充分運用戰略來應對田忌的戰略,顯然還構不成一個雙人競爭的問題。這里為闡明問題,無妨假設齊威王覺察田忌在運用計謀,明白了本人為什么輸金的緣由而及時地調整了本人的對策。這樣,齊威王與田忌的賽馬也就成了一個具有戰略依存特征的決策競賽,構成了一個典型的競爭型決策問題。這個重新設定的齊威王與田忌賽馬的競爭型決策問題可以用競爭型決策的術語表示如下: 1該競爭型決策中有
8、兩個競爭參與者,即齊威王和田忌。9.1 競爭型決策概述2兩競爭參與者可選擇的戰略即為各自馬的出場次序,由于三匹馬的陳列次序共有6種,因此雙方各有6種可選擇的戰略,如圖9-1-2。9.1 競爭型決策概述 3根據前面的討論,假設雙方在決策之前都不能預先知道對方的決策,因此可以看作是同時選擇戰略的,而且決策選擇沒有先后次序的關系。 4假設把贏一千金記成收益為1,輸一千金記成收益為-1,那么兩競爭參與者在各種戰略組合下的收益如圖9-1-2收益矩陣中數組元素所示,每個數組表示兩競爭參與者在對應行列代表的雙方戰略下各自的收益,其中前一個數字表示齊威王的收益,后一個數字表示田忌的收益。 由圖9-1-2可以看
9、到,假設按照嚴厲的競爭型決策問題的假設來重新安排這一游戲的話,齊威王只需把從戰略集合中選擇戰略的順序不斷改動,不讓田忌掌握戰略規律,齊威王的勝率顯然要高于田忌。9.1 競爭型決策概述9.1 競爭型決策概述9.1.2 競爭型決策的要素 一個正式的競爭型決策包括以下幾個要素:競爭的參與者、各競爭方可選擇的全部行為或戰略的集合、競爭的支付、競爭方的信息、競爭的次序、結果和平衡等。 1.競爭型決策的參與者 競爭型決策的參與者是指競爭中獨立決策、獨立承當結果的決策主體,他們能夠是自然人,也能夠是各種社會組織。參與者的劃分規范是看他們能否一致決策、一致行動、一致承當結果等,即通常將利益一致的參與者作為一個
10、競爭方,而不是看數量的多寡抑或規模的大小。普通地,記競爭方為 ,即共有n個競爭方。9.1 競爭型決策概述2.戰略的集合 戰略是指每個競爭方在進展決策時同時或先后,一次或多次可以選擇的方法、做法等。戰略有純戰略和混合戰略之分。純戰略是指每個競爭方在競爭中可以選擇采用的行動方案。混合戰略是在純戰略空間上的一種概率分布,表示競爭方實踐競爭時根據這種概率分布在純戰略空間隨機選擇并加以實施的戰略。 9.1 競爭型決策概述 記競爭方 的戰略為 , 為競爭方 可選擇的戰略組成的戰略集合,又稱戰略空間,那么 。如囚徒姿態中,兩競爭方的戰略空間均為 坦率,不坦率。N個局中人各選擇一個戰略構成的向量 ,稱為戰略組
11、合,囚徒姿態中s=坦率,坦率為囚徒1、2的戰略組合。9.1 競爭型決策概述3.競爭方的支付 競爭方的支付即每個競爭方從各種戰略組合中獲得的收益的成效,它是戰略組合s的函數,所以也被稱為支付函數。記競爭方 的支付函數為 。如囚徒姿態中的囚徒1、2對應s=坦率,坦率的支付為 。4.競爭方的信息 信息是競爭方有關競爭的知識,如有關其他競爭方的戰略、收益等知識。競爭中競爭方掌握信息的多少是影響其戰略選擇的一個重要要素,直接關系到決策的準確性。競爭方應盡能夠多地搜集有關競爭的信息,從而在采取戰略進展決策時掌握自動。9.1 競爭型決策概述5.競爭的次序 規定一個競爭型決策就必需規定其中的次序,不同的次序必
12、然是不同的競爭型決策,即使其他方面都一樣。6.結果和平衡 結果指競爭型決策中競爭方的行動所產生的每一能夠情形。而平衡是指一切競爭方的最優戰略的組合,記為 其中, 為第 個競爭方在平衡的情況下的最優戰略,即第個競爭方在思索其他競爭方戰略選擇的情況下,有針對性地選擇最大化本人支付的戰略。9.1 競爭型決策概述9.1.3 競爭型決策的分類 按競爭型決策中參與人數目的多少,將競爭型決策分為單人競爭型決策、兩人競爭型決策和多人競爭型決策。根據各競爭方可選戰略數量的多少,將競爭型決策分為有限競爭型決策和無限競爭型決策。按參與競爭型決策的各個競爭方從競爭中所獲得的利益的總和,可將競爭型決謀劃分為零和競爭型決
13、策、常和競爭型決策和變和競爭型決策。9.1 競爭型決策概述 按參與人行動的先后順序,競爭型決策可以分為靜態競爭型決策和動態競爭型決策。根據參與人所掌握的信息可以把競爭型決策分為完全信息競爭型決策和不完全信息競爭型決策。把參與人行動順序和掌握的信息結合起來劃分,可以得到四種類型的競爭型決策,即:完全信息靜態競爭型決策、完全信息動態競爭型決策、不完全信息靜態競爭型決策、不完全信息動態競爭型決策。 9.2 完全信息靜態競爭型決策9.2.1 競爭型決策的規范式表述 完全信息靜態競爭型決策是指各競爭方同時決策,且一切競爭方對各方支付都了解的競爭型決策。在競爭型決策論中從靜態中籠統出的最根本要素構成的模型
14、描畫就是規范型。在競爭型決策的規范式表述中,普通包括如下根本要素: 競爭型決策的參與者; 競爭方可選擇的全部行為或戰略的集合; 針對一切參與者能夠選擇的戰略組合,每一個參與者獲得的收益。9.2 完全信息靜態競爭型決策 對各競爭方從1到n排序,設其中任一個參與者的序號為 ,令 代表參與者 的戰略空間,其中任一特定的戰略記為 ,那么 。令 表示每一個參與者選定一個戰略構成的戰略組合,令 表示第 參與者的收益。綜合上述內容,對競爭型決策進展如下定義。 9.2 完全信息靜態競爭型決策 定義9.2.1 在一個n人競爭型決策的規范式表述中,參與者的戰略空間分別為 ,收益函數分別為,那么表示此競爭型決策。
15、9.2 完全信息靜態競爭型決策9.2.2 納什平衡 納什平衡指的是一種戰略組合,這種戰略組合由一切參與人的最優戰略組成,也就是說,在給定他人戰略的情況下,沒有任何單個參與人有積極性選擇其他戰略,從而沒有任何人有積極性突破這種平衡。9.2 完全信息靜態競爭型決策定義9.2.2 在競爭型決策 中,假設戰略組合 中任一競爭方 的戰略 都是對其他競爭方的戰略組合 的最正確對策,也即 對恣意 都成立,那么稱 為 的一個“納什平衡。 納什平衡有強弱之分,以上是弱納什平衡,也是最常用的納什平衡概念。強納什平衡是指每個競爭方對于對手的戰略有獨一的最正確反響,即 為嚴厲納什平衡,當且僅當對一切 ,一切其他 ,均
16、有9.2 完全信息靜態競爭型決策9.2 完全信息靜態競爭型決策 納什平衡的意義在于,它是關于競爭型決策結局的一致性預測假設一切競爭方預測一個特定的納什平衡會出現,那么這種平衡就會出現,預測之間沒有矛盾,不會由于有競爭方以為不符合本人的利益要求而失敗只需納什平衡才干使每個競爭方均認可這種結局,而且他們均知道其他競爭方也認可這種結局,而非納什平衡的結局并非一致性預測。 9.2 完全信息靜態競爭型決策9.2.3 兩人有限零和競爭型決策 1. 兩人有限零和競爭型決策模型 假設用 和 表示兩人有限零和競爭的兩個劇中人,并設他們的戰略集分別為 和 ,由于在任一局勢中兩個局中人得失之和總是等于零,也就是說假
17、設對于局勢 ,局中人 的收入為 ,那么局中人 的收入為 ,局中人 的支付矩陣可記作9.2 完全信息靜態競爭型決策 根據局中人 的支付矩陣 ,結合競爭型決策的普通式表述 ,我們可將這種競爭型決策記作 。9.2 完全信息靜態競爭型決策2. 最優純戰略與納什平衡 定義9.2.3 對于競爭型決策 ,假設應的 分別為局中人 的最優純戰略,稱 那么稱支付元素 對 為競爭型決策 的鞍點,稱 為競爭型決策 的競爭型決策值。9.2 完全信息靜態競爭型決策 不難驗證鞍點 是競爭型決策 的納什平衡,鞍點又稱純戰略納什平衡。兩人有限零和競爭型決策存在鞍點的充要條件是支付矩陣中存在一個元素 使對一切 ,總有。9.2 完
18、全信息靜態競爭型決策3. 最優混合戰略與納什平衡 設競爭型決策 ,令 分別為局中人 在各自的戰略集 中選擇戰略的概率,那么稱分別為局中人 的一個混合戰略9.2 完全信息靜態競爭型決策 為局中人 的期望所得, 為 的期望所得, 而 的競爭型決策的混合局勢 又記 分別為局中人 的混合戰略集合。9.2 完全信息靜態競爭型決策定義9.2.4 假設 那么稱 分別為局中人 的最優混合戰略,稱 為 的最優混合局勢,稱 為競爭方 的期望所得。 9.2 完全信息靜態競爭型決策4. 最優混合戰略的求解方法 競爭型決策 有混合意義下的解的充要條件是:存在 及數滿足以下兩個不等式組:9.2 完全信息靜態競爭型決策 設
19、 否那么令 ,那么 一定可大于零。令 ,那么不等式組等價于下面的線性規劃:9.2 完全信息靜態競爭型決策 同理,令 ,問題2就變為線性規劃4:9.2 完全信息靜態競爭型決策9.2.4 運用舉例 例9-2-3 市場進入阻遏競爭型決策。一種市場上存在一個壟斷企業,另一個企業希望進入這一市場,壟斷者為了堅持本人的位置需求對進入者進展阻遏。在這種競爭型決策中,進入者有兩種戰略可以選擇:“進入與“不進入;壟斷者也有兩種戰略:“容忍與“還擊。他們的支付函數用以下雙變量矩陣表示,如圖9-2-2。9.2 完全信息靜態競爭型決策9.2 完全信息靜態競爭型決策例9-2- 4 產量決策的古諾模型 消費同質產品的兩個
20、企業同時選擇各自的產量 ,單位本錢均為常數市場需求決議價錢 為了求解其中的納什平衡,需求求得每個局中人對另一個局中人戰略的最優反響對于局中人I來說,他的利潤為 對 求導可得到利潤最大化的一階條件為9.2 完全信息靜態競爭型決策 這一函數決議了面對局中人2的每種戰略時局中人1的最優反響,稱之為局中人1的最優反響函數。類似地,可得到局中人2利潤最大化的一階條件聯立兩式,求解得到納什平衡9.2 完全信息靜態競爭型決策 假設市場上存在n個廠商,每個廠商的單位本錢都是常數c,市場需求為 ,那么經過同樣推理可知,局中人對其他局中人戰略組合的最優反響函數可表示為這里對n個最優反響函數聯立求解就可以得到納什平
21、衡 對 有9.2 完全信息靜態競爭型決策 例9-2-5 假設有n個人共同擁有的一個公共牧場,每個人要決議本人放牧羊的數目 ,總的羊數因此為 。購買和照看1只羊的本錢為常數c。設每只羊的價值為 ,隨著羊的添加,草地會越來越擁堵,食物也會更緊張,因此會呵斥羊的價值下降。另一方面,羊的供應添加也會呵斥羊的價值下降,所以有 。 在這種設定下,局中人的利潤函數為9.2 完全信息靜態競爭型決策最優化的一階條件為 納什平衡總羊數 需求滿足的條件社會最優的放牧程度 為使總利潤 最大的羊數,滿足9.3 完全信息動態競爭型決策9.3.1 競爭型決策的擴展式表述 競爭型決策的擴展式表述包括以下要素:1參與人集合:i
22、=1,n,此外,我們將用N代表虛擬參與人“自然;2參與人的行動次序:誰在什么時候行動;3參與人的行動空間:在每次行動時,參與人有些什么選擇;4參與人的信息集:每次行動時,參與人知道些 什么;5參與人的支付函數:在行動終了之后,每個參與人得到些什么支付是一切行動的函數;6外惹事件即自然的選擇的概率分布。9.3 完全信息動態競爭型決策9.3.2 擴展式競爭型決策的納什平衡1. 戰略與行為戰略 記 為局中人 信息集的集合,局中人 全部可選行動構成的集合為 。這樣,局中人 的純戰略可定義為映射 ,對一切 有 。局中人 的純戰略空間 為這樣的 的集合,也就相當于各個處的行動空間的笛卡爾乘積,即 。擴展型
23、競爭型決策中的納什平衡為這樣的戰略組合 ,其中每個局中人 的戰略 是在它的對手的戰略 給定的情況下最大化本人的期望支付。 9.3 完全信息動態競爭型決策 行為戰略的正式定義為:記 為 上的概率分布,局中人 的行為戰略 的笛卡爾乘積 的元素。這樣,行為戰略在每一個 處的行動上確定了一種概率分布,而且各信息集對應的各個概率分布彼此獨立。行為戰略組合 構成在結局上的概率分布,從而可以得到每個局中人的期望支付函數,這樣,就可以按照以上純戰略情形中一樣的方式定義行為戰略納什平衡。9.3 完全信息動態競爭型決策2. 擴展型競爭型決策和戰略型競爭型決策的關系 將擴展型競爭型決策用戰略型競爭型決策的方式表現,
24、如圖9-3-1。圖9-3-1中局中人2的純戰略由局中人2的兩個節點處的行動選擇組合而成由左至右。9.3 完全信息動態競爭型決策9.3.3 子競爭型決策完美平衡 1. 子競爭型決策完美平衡的定義 定義9.3.1 擴展型競爭型決策 的子競爭型決策 由 中的一個決策節點與它的一切后續節點組成,具有性質:假設 子競爭型決策的信息集與支付函數均來自于原競爭型決策,即 中 的屬于同一信息集,當且僅當它們在原競爭型決策中屬于同一信息集,子競爭型決策的支付函數就是原競爭型決策支付函數適用于子競爭型決策的部分。9.3 完全信息動態競爭型決策定義9.3.2 擴展型競爭型決策的行為戰略組合 為子競爭型決策完美平衡的
25、條件是,它在任何子競爭型決策上都給出納什平衡。9.3 完全信息動態競爭型決策2. 用逆向歸納法求解子競爭型決策完美平衡 從以位置在最后的決策節點為起點的子競爭型決策開場,求出對應的局中人的最正確選擇,然后在這種選擇給定的情況下,倒推至該節點的前一個節點求出相應局中人的最正確選擇,然后再向前倒推,直至初始節點。 9.3 完全信息動態競爭型決策 例9-3-1 斯特克爾伯格競爭 消費同質產品的兩個企業同時選擇各自的產量 ,單位本錢均為常數 市場需求價錢 。不過如今假設局中人1先行動,局中人2察看到1的產量再決議本人的選擇。9.3 完全信息動態競爭型決策 從局中人1選定任何一種產量后開場的子競爭型決策
26、中獨一的局中人是局中人2,因此納什平衡就退化為局中人2此時的最優選擇。 得到局中人1需求思索的是以下的最大化問題: 9.3 完全信息動態競爭型決策 此時最優戰略顯然是 ,由此得到局中人2的最優選擇為 ,這就是子競爭型決策完美平衡。相應的平衡支付為 , ,局中人1獲得了比古諾競爭中更高的利潤,這完全是由于先行動帶來的益處,也就是先行優勢。9.4 不完全信息靜態競爭型決策 9.4.1 概念 不完全信息競爭型決策實際中的不完全信息專指一種競爭型決策局勢中局中人對其他局中人與該種競爭型決策局勢有關的事前信息了解不充分,而不是競爭型決策中產生的與局中人實踐戰略選擇有關的信息。 豪爾紹尼將這種由不完全信息
27、引發的復雜判別問題稱為“遞階期望,從初始的判別出發會構成越來越高階的判別問題。為理處理這種怪圈,需求引入一種特定的分析機制,以思想上可以接受而且技術上可以處置的方式對不完全信息帶來的競爭型決策問題進展描畫與處置,這就是豪爾紹尼轉換。9.4 不完全信息靜態競爭型決策例9-4-1 市場進入競爭型決策 一個行業有兩個相關企業,一個是壟斷者局中人1,有一個是潛在的進入者局中人2。局中人1決議能否建立一個新工廠,而同時局中人2決議能否進入這一行業。其中存在著不完全信息,劇中人2不知道局中人1的建廠本錢是3還是1,而局中人1知道本人的本錢。這樣構成的不完全信息競爭型決策局勢如圖9-4-19.4 不完全信息
28、靜態競爭型決策9.4 不完全信息靜態競爭型決策9.4.2 豪爾紹尼轉換 在例9-4-1局中人1具有兩種能夠類型,“高建廠本錢與“低建廠本錢,而局中人2沒有私有信息。假設概率模型為,局中人1類型為“高本錢的概率為0.4,為“低本錢的概率為0.6.那么原來的不完全信息競爭型決策轉換如圖9-4-2所示的不完美信息的完全信息競爭型決策。9.4 不完全信息靜態競爭型決策 在圖9-4-2中 表示“進入戰略, 表示不進入戰略自然局中人首先根據概率機制決議局中人1建廠本錢是高還是9.4 不完全信息靜態競爭型決策 低,局中人1知道這一信息,也就是說知道本人的實踐類型,然后局中人2在不知道局中人1實踐類型也不知道
29、局中人1戰略選擇的情況下決議能否進入市場,這是一種特殊的不完美信息競爭型決策。 在豪爾紹尼轉換將不完全信息競爭型決策轉化為不完美信息的完全信息競爭型決策后,就可以利用完全信息競爭型決策的處置方法,得到的平衡概念為納什平衡在不完全信息下的推行貝葉斯平衡。9.4 不完全信息靜態競爭型決策9.4.3 貝葉斯平衡 定義9.4.1 局中人具有類型 ,戰略 及支付函數 ,類型上先驗分布為 的不完全信息競爭型決策中的純戰略貝葉斯平衡是一種“擴展競爭型決策的納什平衡,這種擴展競爭型決策中每個局中人的純戰略空間是由 到 的映射的集合 。9.4 不完全信息靜態競爭型決策 另一種等價方式的定義方式為:貝葉斯平衡是一
30、種與類型有關的戰略組合 ,其中 每個局中人在給定本人類型 和其他局中人戰略 的情況下最大化本人的期望成效函數,即9.4 不完全信息靜態競爭型決策9.4.4 貝葉斯平衡實例 例9-4-2 不完全信息古諾競爭 將根本古諾競爭模型擴展到不完全信息情形。假設企業2對企業1的消費本錢不完全了解,僅知道一半能夠為高本錢 ,一半能夠為低本錢 ,企業2的單位本錢為 。根據貝葉斯轉換方式,假設這一概率判別為公共信息。 局中人1知道本人的真實類型,因此他的最優反響函數為:9.4 不完全信息靜態競爭型決策高本錢時 低本錢時局中人2的期望利潤為: 使之最大化的一階條件給出局中人2的反響函數:9.4 不完全信息靜態競爭
31、型決策聯立求解可得貝葉斯平衡為: 顯然,當 時,貝葉斯平衡退化為完全信息時的納什平衡。 9.5 不完全信息動態競爭型決策定義9.5.1 信號競爭型決策的完美貝葉斯平衡為一種戰略組合 和后驗信心 ,滿足:假設 那么 為 上的恣意概率分布。9.5 不完全信息動態競爭型決策9.5.2 完美貝葉斯平衡 設有個 局中人,局中人 的類型為 為局中人 關于其他局中人類型的先驗信心。局中人 的純戰略為 為信息集 上局中人 觀測到的其他局中人的行動組合,為由 限定的對應行動組合, 為觀測到 時構成的對其他局中人類型的后驗信心, 為局中人 為類型 時得到的支付。9.5 不完全信息動態競爭型決策定義9.5.2 完美
32、貝葉斯平衡 貝葉斯平衡是一種戰略組合 與一種后驗概率組合 ,滿足:P對于一切的局中人 ,在每個信息集 ,B 由先驗概率 、所觀測的 和最優戰略 經過貝葉斯法那么構成。9.5 不完全信息動態競爭型決策 9.5.3 完美貝葉斯平衡舉例 聲明競爭型決策主要研討在有私人信息、信息不對稱的情況下,人們經過口頭或書面的聲明傳送信息的問題。聲明競爭型決策普通是不完全信息競爭型決策,也就是動態貝葉斯競爭型決策。 1. 聲明競爭型決策 設競爭型決策中的聲明方有兩種能夠的類型 ,行為方有兩種能夠的行為 ,并且知對于兩種不同類型的聲明方,行為方采取兩種不同行為時雙方的得益如圖9-5-1。9.5 不完全信息動態競爭型
33、決策 從雙方的得益可以看出: 類型的聲明方和 類型的聲明方偏好行為方的不同行為。 類型的偏好類型的偏好 類型的偏好 。行為方在聲明方是 類型和 類型時也分別偏好 和 。因此兩個競爭方的偏好具有完全的一致性 , 。9.5 不完全信息動態競爭型決策 假設模型中的得益情況發生某種變化,例如變成圖9-5-2中的情況。 在不同類型聲明方的偏好一樣,而行為方在聲明方的類型不同時偏好不同的競爭型決策中,聲明是不能夠有效傳送信息的。9.5 不完全信息動態競爭型決策 在聲明競爭型決策中聲明能有效傳送信息的三個必要條件:1不同類型的聲明方必需偏好行為方的不同行為。2對應聲明方的不同類型,行為方必需偏好不同的行為。3行為方的偏好必需與聲明方的偏好具有一致性。9.5 不完全信息動態競爭型決策2. 離散型聲明競爭型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海市靜安區、青浦區2024-2025學年高三下學期入學考試題生物試題文試題含解析
- 吉林省五地六市聯盟2025屆高三下學期第二次高考模擬語文試題含解析
- 江西省撫州市臨川2024-2025學年初三下學期一模考試數學試題含解析
- 吉林省白城市洮北區第一中學2025屆高考診斷性測試物理試題含解析
- 溫州市蒼南縣重點中學2024-2025學年初三第五次調研考試語文試題含解析
- 云南省昆明市晉寧縣2025屆數學四下期末預測試題含解析
- 山東省臨沂市蘭山區2025屆初三第二次教學質量檢測試題語文試題含解析
- 米蘭家居全屋定制合同范本
- 吉林省通化市梅河口五中2025屆高三上學期12月月考-物理試題(含答案)
- 員工股權激勵合同
- [水穩層]旁站監理記錄表(范本)√
- 小學四年級上冊數學課后訓練題:《數字編碼》
- 長城牌通用潤滑油、脂替代其他品牌產品清單
- 沈萍微生物學第七章
- API-682密封系統-中英文對照版
- 電動葫蘆出廠檢驗報告
- 挖機大中斗油封資料,液壓泵資料
- 技術開發部個人技能矩陣圖
- Hillstone設備密碼與配置恢復方法
- 二年級下冊語文教案第六單元部編版
- 廢氣處理工程施工方案模板
評論
0/150
提交評論