不完全信息動態博弈-new_第1頁
不完全信息動態博弈-new_第2頁
不完全信息動態博弈-new_第3頁
不完全信息動態博弈-new_第4頁
不完全信息動態博弈-new_第5頁
已閱讀5頁,還剩29頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、不完全信息動態博弈一、不完全信息動態博弈舉例二、海薩尼轉換三、貝葉斯法則四、精煉貝葉斯納什均衡一、不完全信息動態博弈舉例去過古玩市場的人,通常最深刻的感受莫過于古玩的價格非常玄乎,簡直讓人琢磨不透。古玩交易讓人疑惑和不放心的根本原因,不是由于古玩的價格昂貴,而是其性質和價值基礎比較特殊。古玩屬于奢侈品而不是生活必需品,其效用和價值基礎的主觀程度高,客觀程度較低。因此對古玩價值的評價非常困難,而且相互之間很難了解對方的評價。由于雙方都無法知道對方的估價,因此相互對對方的得益都不可能完全清楚,這是不完全信息的博弈問題。古玩市場由于古玩市場的交易一般是賣方先開價,然后買方再還價,直至達成一個雙方都接

2、受的價格或放棄交易,因此古玩交易通常是動態博弈問題。二、海薩尼轉換1967年,海薩尼提出了“海薩尼轉換”來處理不完全信息的博弈。基本思路是:引入一個虛擬的參與人“自然”,“自然”首先行動選定參與人的某種類型,各參與人知道自己的類型,但其他參與人不知道。不過,“自然”以怎樣的概率來選擇各參與人的類型,此概率分布卻是共同知識。以對參與人類型的概率的分析代替對參與人確切行動的分析,這樣的轉換就是“海薩尼轉換”。通過海薩尼轉換,博弈開始時,所有參與人有關“自然”的行動有一致的信念,即都知道所有人類型的概率分布,此即“海薩尼公理”。海薩尼轉換后的市場進入博弈NP1-P進入者進入者不進進不進進(0,300

3、)在位者打擊打擊在位者(40,50)(-10,0)(0,400)(30,80)(-10,100)三、貝葉斯法則在不完全信息開始之前,“自然”首先行動,選擇各參與人的類型。各參與人除了知道自己的類型以外,對“自然”的行動都有著一致的信念,稱之為先驗信念。之后,參與人先后行動,后行動者能觀察到先行動者的行動,但觀察不到先行動者的類型。但是,因為參與人的行動是依賴于其類型的,每個參與人的行動都傳遞著有關自己類型的某種信息,后行動者可以通過觀察先行動者的行動來修正對其各種類型判斷的先驗信念(概率分布),然后選擇自己的最優行動。先行動者預測到自己的行動將被后行動者所利用,也就會設法傳遞對自己有利的信息,

4、避免傳遞對自己不利的信息。因此,不完全信息動態博弈不僅是參與人選擇行動的過程,更是參與人不斷修正信念的過程。例 所羅門判子 所羅門王是古代以色列國的一位以智慧著稱的君主。一次,兩個婦人為爭奪一個嬰兒爭扯到所羅門王殿前,她們都說嬰兒是自己的,請所羅門王作主。所羅門王稍加思考后作出決定:將嬰兒一刀劈為兩段,兩位婦人各得一半。這時,其中一位婦人立即要求所羅門王將嬰兒判給對方,并說嬰兒不是自己的,應完整歸還給另一位婦人,千萬別將嬰兒劈成兩半。聽罷這位婦人的求訴,所羅門王立即作出最終裁決嬰兒是這位請求不殺嬰兒的婦人的,應歸于她。這個故事講的道理是,盡管所羅門王不知道兩位婦人中誰是嬰兒的母親,但他知道嬰兒

5、真正的母親是寧愿失去孩子也不會讓孩子被劈成兩半的。所羅門王正是利用這一點,一下就識別出誰是嬰兒的真正的母親了。例 黔之驢 黔無驢,有好事者船載以入。至則無可用,放之山下。虎見之,龐然大物也,以為神。蔽林間窺之,稍出近之,憖憖然莫相知。 他日,驢一鳴,虎大駭,遠遁,以為且噬已也,甚恐。然往來視之,覺無異能者,益習其聲,又近出前后,終不敢搏。稍近,益狎,蕩倚沖冒,驢不勝怒,蹄之。虎因喜,計之曰:“技止此耳!”因跳踉大,斷其喉,盡其肉,乃去。 噫!形之龐也類有德,聲之友也類有能,向不出其技,虎雖猛,疑畏卒不敢取;今若是焉,悲夫!概率論中貝葉斯公式貝葉斯法則 是先驗概率, 是類型, 是一特定行動。問題

6、是假如觀測到了 ,則屬于 類型的概率,即后驗概率 。貝葉斯法則例 對人的判斷把所有的人劃分為好人GP和壞人BP兩類,所有的事劃分為好事GT和壞事BT兩類。那么一個人干好事的概率是 。如果觀測到一個人干了件好事,那么這個人是好人的后驗概率是 更具體點,假定認為這個人是好人的先驗概率為1/2,那么在觀測到他干了好事之后,如何修正先驗概率依賴于我們認為這件好事好到什么程度。第一種情況,這是一件非常好的好事,好人一定干,壞人絕不可能干。第二種情況,這是一件非常一般的好事,好人會干,壞人也會干第三種情況,好人肯定會干,壞人可能干也可能不干可以看到,我們如何改變對一個人的看法不僅依賴于我們認為他是好人或壞

7、人的先驗概率,而且依賴于我們如何“認為”好人干好事和壞人干好事的條件概率。不能任意地“認為”。當認為壞人干好事的概率為 時,那么,在給定信息情況下,如果這個人確實是壞人,則 是他的最優選擇。這對于理解精煉貝葉斯納什均衡是非常重要的。例 二手車市場認為車子是好的先驗概率為 ,認為車子是不好的先驗概率為 。當賣(sell)這個行動發生后,車子是好的后驗概率是 貝葉斯法則不是一個技術性法則,而是人們修正信念的唯一合理方法。四、精煉貝葉斯納什均衡1RLM(p)(1-P)22UDUD(2,1)(0,0)(0,0)(0,1)精煉貝葉斯納什均衡是 :L,U;p=1(1,3)(純策略納什均衡是 :(L,U)(

8、R,D))第一,在每一個信息集上,決策者必須有一個定義在屬于該信息集的所有決策結上的一個概率分布(信念);第二,給定該信息集上的概率分布和其他參與人的后續策略,參與人在該信息集處的行動必須是最優的(后續策略指的是從給定信息集開始的后續博弈上的行動規則);第三,每個參與人根據均衡策略和貝葉斯法則做出判斷和修正,得到后驗概率。滿足上述要求的博弈均衡就稱為“精煉貝葉斯均衡”。練習精煉貝葉斯納什均衡:(F,L,D),以及博弈方3的判斷p=1。1BF(2,0,0)2L(p)R(1-p)33UDUD(1,2,1)(3,3,3)(0,1,2)(0,1,1)信號傳遞博弈信號傳遞博弈是一類比較簡單但有廣泛應用意

9、義的不完全信息動態博弈,許多博弈問題都可以歸結為此類型的博弈。如市場進入與遏制、委托-代理關系、拍賣機制的設計等。在信號傳遞博弈中有兩個參與人,先后各行動一次;參與人1有多個類型,先行動;參與人2后行動,他不知道參與人1的具體類型,但可以觀察到先行動一方的行動并從中獲得部分信息。先行動的一方行動對后行動者來說好像是某種反映其類型信息的信號,因此該博弈被稱為“信號傳遞博弈”。一般稱先行動的參與人1為信號發送者,記為S;后行動的參與人2稱為信號接收者,記為R。孫子曰:兵者,詭道也。故能而示之不能,用而示之不用,近而示之遠,遠而示之近。利而誘之,亂而取之,實而備之,強而避之,怒而撓之,卑而驕之,佚而

10、勞之,親而離之,攻其無備,出其不意。此兵家之勝,不可先傳也。 例 壟斷廠商的低價銷售:信號傳遞博弈 有許多壟斷廠商并未如人們所料想的那樣給商品定出一個很高的價格,而是以較低的價格長期銷售某種產品。譬如,發達國家的私營鐵路、航空、海運碼頭等的價格都遠低于按照其壟斷定價方法定出的價格。這是什么原因呢? 現在,我們用這個“信號傳遞博弈”的原理,來解釋為何一些壟斷廠商長期在低價格水平上經營。如果這個壟斷廠商是一個低生產成本的廠商,當其它較高生產成本廠商也進入這個廠商所經營的行業與之進行競爭時,原先的那個壟斷廠商可以通過降價將進入者趕出這個行業,從而繼續維持壟斷經營。 由于壟斷廠商有更低的生產成本,所以

11、,它能夠將產品價格降到比進入廠商的生產成本還要低的水平上,這就造成進入者或者高價格經營導致顧客流失,或者同樣也降價但價格低于成本,兩種情形進入者都會虧損,最后不得不退出行業。 但是,這種“打斗”行為盡管可以擊退進入者,但由于一段時間的降價經營可能對壟斷者帶來較大損失。壟斷者為了避免這種損失,可以向外宣布它是低成本的,別的廠商休想進來與它競爭。但僅憑口頭宣布人家是不會相信的,因為即使壟斷者不是低成本的廠商,它也會如此宣布。 一種方法就是,壟斷者向外發送一個信號,向外界傳遞它真是低成本的信息。它可以長期在一個較低價格水平上經營。如果它的價格足夠低,高成本廠商不敢模仿,行內廠商會據此判定它確是低成本

12、的。同時,它的價格也不能太低,以致于較之與進入者進行降價競爭,其損失為小一些。這樣,壟斷者才會采取如此策略。潛在的高成本進入者不敢 進入,壟斷者得以保持長期的壟斷地位。 例 為什么有的商品廣告既無商品的價格信息又無售貨地點信息,只有明星的表演? 通常認為,商業廣告的功能是向消費者提供必要的購貨信息,如散布商品的價格,質量功能,出售地點等信息。再者,人們還認為有些廣告可能是為了引導消費,特別是新產品出現時,消費者還不知道、不熟悉它,商業廣告中通過一些電影明星使用新產品的圖象,利用公眾的“追星”心理打造市場。這種關于新產品市場引導的廣告在國外的電視廣告中特別常見,通常是一位當紅明星在電視上用新產品

13、表演一番,既無價格,也無售貨地點的介紹,除了顯示一下商標外,完全沒有對產品性能的說明。不過,對于這類廣告,博弈論還有一種“信號傳遞”的解釋呢。 假設有一家企業(記為企業A)開發出一種很有市場潛力的飲料,該產品飲后對人的健康確實有好處。但同時,另一家生產假冒偽劣產品的企業(記為企業B)也準備向市場推出一種偽劣產品飲料。兩個企業都會向公眾宣布其產品是上乘的,如何如何的好。但公眾是理性的,不會僅憑商業宣傳就相信它們。但是,如果產品真的好,隨著時間的推移,消費者能夠識別出來。所以,生產好飲料的的企業A對自己的市場有信心,它相信隨著時間的推移,企業B生產的偽劣產品終究會被消費者識破,顧客會跑到自己這里來

14、,從而自己的市場會不斷擴大,銷售收入及利潤會不斷增長。 而企業B開始可以蒙騙一部分消費者,但時間一長,產品的問題會暴露出來,市場會不斷縮小,收入及未來利潤都不會有企業A的大。這樣一來,企業A的未來預期收入遠大于企業B。因此,如果企業A請一位當紅明星打廣告,由于是當紅明星,他們打廣告有很高的市場價格,就可以使企業B不敢模仿。譬如,假定企業A的預期收入為3千萬元,企業B的預期收入為1千萬元。當紅明星打廣告的市場價格為2千萬元,那么,企業A可以請明星打廣告但企業B就請不起。 消費者也明白這個道理,從而會在一開始就識別出不能請當紅明星打廣告的企業B是生產偽劣產品的。這樣,企業B一開始就沒有市場。當企業

15、A請了當紅明星打廣告時,企業B發現這位明星的市場價格太高,自己難以模仿企業A,開始就會放棄生產偽劣產品的計劃。所以,企業A通過請當紅明星打廣告而清除掉了潛在的市場模仿者,它向公眾傳遞自己是生產好產品的信號,這種信號的價值在于其所請來的當紅明星有著較高的出場價格,而不在乎明星在廣告節目中說了什么,表演了什么,當然更無所謂廣告節目是否介紹產品價格等信息了。企業A請當紅明星打廣告就為公眾傳遞了它是生產好產品的企業的一個信號。 例為什么許多實力雄厚的公司還要向銀行借很多錢? 在國外,一些資金實力雄厚的公司通常也會向銀行貸款。更加令人感到奇怪的是,一些好的公司,一方面自己借錢給別的公司,同時,另一方面又

16、向銀行借錢。博弈論運用“信號傳遞”原理可以對此現象作出解釋。 對于一家公司來說,負債增加會增大公司破產的可能性;但是,對于實力雄厚的公司,在同樣負債比例下,其破產可能性要小一些。每個公司都會向社會吹噓自己是好的公司,實力雄厚,但公眾不會僅憑口頭宣傳就相信的。于是,真正好的公司通過向銀行借錢來增大自己破產的可能性,令其它實際上不好的公司難以模仿。這種負債比例的增加要做到恰到好處,它既可令其它實力稍弱的公司難以模仿,又使自己能夠承受。 這樣,公眾就能識別出誰是好的公司,從而競相購買好的公司的股票,導致公司股票價格上漲,結果這家負債公司會因其股價上漲而獲資本增值,破產的可能性反而下降了。 當然,公司

17、通過增加負債來向投資者傳遞公司信息的代價可能太高,因而有時公司十分樂意向投資者直接披露內部信息,只要這種信息足以使投資者相信其真實性,就會為公司減少信息傳遞成本。例 飛機、輪船等設立頭等艙、經濟艙的道理是什么? 無論是買票乘飛機、火車還是輪船,不同的人所愿意支付的價格實際上是不一樣的。有的人收入高一些,或對花錢看得比較松一些,就可以支付較高的價格,相反,收入低的人或對花錢看得比較緊一些的人,就只愿支付較低的價格。但是,如果你問他們愿意支付什么樣的價格,他們都必定說愿支付較低的價格,因為既使有錢人也會在同樣服務下以低價購買。當飛機或輪船的艙位條件和價格完全一樣時,不同支付意愿的人都會以最低價格買票,不會有人愿支付比別人更多的錢去買相同的艙位的票。于是,航空公司或輪船公司將艙位分成頭等艙、二等艙,等等,價格稍有不同,當然服務也不同,就將不同支付意愿的顧客區分開了。 頭等艙比其它較低等級艙位的價格高許多并不主要是因為它的服務要比其它艙位的服務好許多(當然還是要好一些),而是因為那些坐頭等艙的人的支付能力比其它艙位的旅客的支付能力要強許多,說白了,就是坐頭等艙的人比坐其它艙位的人更有錢或更能花錢而已!但是,如果航空公司或輪船公司不對艙位作如此區分,即使是有錢人也不會愿意坐同樣的艙位而支付比別人支付的更高的價格。 這里,支付能力是旅客的類型,選擇艙位等級是他們的選擇。支付能力無法觀察,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論