




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
博弈論與生活中的經濟學蒲勇健中央電視臺《百家論壇》重慶大學·蒲勇健博弈論與生活中的經濟學蒲勇健中央電視臺《百家論壇》重慶大學1
博弈論(gametheory)是由美國數學家馮·諾依曼(Von.Neumann)和經濟學家摩根斯坦(Morgenstern)于1944年創立的帶有方法論性質的學科,它被廣泛應用于經濟學、人工智能、生物學、火箭工程技術、軍事及政治科學等。1994年,三位博弈論專家即數學家納什(Nash,他的故事被好萊塢拍成電影《美麗心靈》,該影片獲得了2002年奧斯卡金像獎的四項大獎)、經濟學家海薩尼(Harsanyi)和澤爾滕(Selten)因在博弈論及其在經濟學中的應用研究上所作出巨大貢獻而獲得諾貝爾經濟學獎。重慶大學·蒲勇健博弈論(gameth2
1996年,兩位將博弈論應用于不對稱信息下機制設計的經濟學家莫里斯(Mirrlees)和維克里(Vickrey)、以及2001年三位經濟學家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運用博弈論研究信息經濟學所取得的成就而成為這兩個年度的諾貝爾經濟學獎得主。專家預計,近幾年還會有更多的博弈論專家可能獲得諾貝爾經濟學獎。重慶大學·蒲勇健1996年,兩位將博弈論應用于不對3
為什么博弈論在經濟學領域會產生如此大的影響呢?這是因為博弈論從一個獨特的視角幫助我們更加深刻地理解和把握經濟現象,并指導更加有效的經濟政策制訂。重慶大學·蒲勇健為什么博弈論在經濟學領域會產生如此4
博弈論是一門十分有趣但理論上又是十分艱深的學問,我今天打算用一些大家能夠憑直觀或簡單分析就能把握的例子為大家介紹博弈論的基本概念及應用,以引起大家對這門目前已成為熱門科學的興趣和獲得初步的了解。這些例子也是我們在日常生活中經常所遇到的問題或觀察到的現象,通過博弈論,我們能夠更加深刻地理解它們。重慶大學·蒲勇健博弈論是一門十分有趣但理論上又是十分5
1.囚徒困境兩個小偷甲和乙聯手作案,私入民宅被警方逮住但未獲證據。警方將兩人分別置于兩間房間分開審訊,政策是若一人招供但另一人未招,則招者立即被釋放,未招者判入獄10年;若二人都招則兩人各判刑8年;若兩人都不招則未獲證據但因私入民宅各拘留1年。一、什么是博弈論:從“囚徒困境”談起重慶大學·蒲勇健1.囚徒困境一、什么是博弈論:從“囚徒困境”談起重6表1囚徒困境博弈
乙
招不招招甲不招(問題1:甲、乙如何選擇?)
-8,-80,-10-10,0-1,-1重慶大學·蒲勇健表1囚徒困境博弈-8,-80,-10-10,0-1,-17
盡管甲不知乙是否招供,但他認為自己選“招”最好,因而甲會選擇“招”,乙也同樣會選擇“招”,結果各判8年;但若兩人都不招,結果是兩人只被判1年,但這種結果是不會出現的。我們可以運用“剔除劣戰略”的方法來獲得這樣的結果。
重慶大學·蒲勇健盡管甲不知乙是否招供,但他認為自8甲或乙可以作出的選擇被稱為“戰略”,如“招”或“不招”都是戰略。
重慶大學·蒲勇健甲或乙可以作出的選擇被稱為“戰略”,如“9
對甲來說,盡管他不知道乙是選擇了“招”還是“不招”,他發現他自己選擇“招”都是比選擇“不招”為好的。因此,“不招”是相對于“招”的劣戰略,他不會選擇劣戰略。所以,甲會選擇“招”。同樣,根據對稱性,乙也會選擇“招”,結果是甲乙兩人都“招”。重慶大學·蒲勇健
10
甲和乙是參與博弈的人,稱為“局中人”。表1中每一個小方格內的數字被稱為局中人的支付,其中左邊的數字代表甲的支付,右邊的是乙的支付。表1中的雙變量矩陣稱為博弈支付矩陣。局中人所選擇的戰略構成的組合(招,招)被稱為博弈均衡。這個組合中前后兩個戰略分別表示甲和乙所選擇的戰略。重慶大學·蒲勇健甲和乙是參與博弈的人,稱為“局中人”11表1囚徒困境博弈
乙
招不招招甲不招-8,-80,-10-10,0-1,-1重慶大學·蒲勇健表1囚徒困境博弈-8,-80,-10-10,0-1,-112
甲和乙都不會選擇劣戰略“不招”,稱為“剔除劣戰略的占優戰略均衡”。其中“招”是占優于(優于)“不招”的占優戰略。
我們可以利用這個道理來分析日常生活中的許多不合作現象。重慶大學·蒲勇健甲和乙都不會選擇劣戰略“不招”,稱為13
2.生活中的“囚徒困境”例子
例子1商家價格戰
出售同類產品的商家之間本來可以通過共同將價格維持在高位而獲利,但實際上卻是相互殺價,結果都賺不到錢。當一些商家共謀將價格抬高,消費者實際上不用著急,因為商家聯合維持高價的壟斷行為一般不會持久,可以等待壟斷的自身崩潰,價格就會掉下來。重慶大學·蒲勇健2.生活中的“囚徒困境”例子例子1商家價格戰重慶14
譬如,2000年我國幾家生產彩電的大廠商合謀將彩電價格維持高位,他們搞了一個“彩電廠家價格自律聯盟”,并在深圳舉行了由多家彩電廠商首腦參加的“彩電廠商自律聯盟高峰會議”。當時,國家有關部門還未出臺相關的反壟斷法律,對于這種在發達國家明顯屬于違法行為的所謂“自律聯盟”,國家在法律上暫時還是無能為力的。寡頭廠商在光天化日之下進行價格合謀,并且還通過媒體大肆炒作,這在發達國家是不可思議的。重慶大學·蒲勇健譬如,2000年我國幾家生產彩電的大廠商15
但是,盡管政府當時無力制止這種事情,公眾也不必擔心彩電價格會上漲。這是因為,“彩電廠商自律聯盟”只不過是一種“囚徒困境”,彩電價格不會上漲。在高峰會議之后不到二周,國內彩電價格不是上漲而是一路下跌。這是因為廠商們都有這樣一種心態:無論其他廠商是否降價,我自己降價是有利于自己的市場份額擴大的。
重慶大學·蒲勇健但是,盡管政府當時無力制止這種事情,公眾也16例子2為什么政府要負責修建公共設施,因為私人沒有積極性出資修建公共設施
設想有兩戶相居為鄰的農家,十分需要有一條好路從居住地通往公路。修一條路的成本為4,每個農家從修好的好路上獲得的好處為3。如果兩戶居民共同出資聯合修路,并平均分攤修路成本,則每戶居民獲得凈的好處(支付)為3-4/2=1;當只有一戶人家單獨出資修路時,修路的居民獲得的支付為3-4=-1(虧損),“搭便車”不出資但仍然可以使用修好的路的另一戶人家獲得支付3-0=3,見表2。重慶大學·蒲勇健例子2為什么政府要負責修建公共設施,因為私17表2修路博弈
乙修不修修甲不修
1,1-1,33,-10,0重慶大學·蒲勇健表2修路博弈1,1-1,33,-10,0重慶大學·蒲18
我們看到,對甲和乙兩家居民來說,“修路”都是劣戰略,因而他們都不會出資修路。這里,為了解決這條新路的建設問題,需要政府強制性地分別向每家征稅2單位,然后投入4單位資金修好這條對大家都有好處的路,并使兩家居民的生活水平都得到改善。
重慶大學·蒲勇健我們看到,對甲和乙兩家居19
這就是我們看到的為什么大多數路、橋等公共設施都是由政府出資修建的原因。同樣的道理,國防、教育、社會保障,環境衛生等都由政府承擔資金投入,私人一般沒有積極性承擔這方面服務的積極性和能力。重慶大學·蒲勇健這就是我們看到的為什么大多數路、橋等20例子3蘇格蘭的草地為什么消失了?公共資源經常被過度利用的原因。
在18世紀以前,英國蘇格蘭地區有大量的草地,其產權沒有界定,屬公共資源,大家都可以自由地在那里放牧。草地屬于“可再生資源”,如果限制放牧的數量,沒有被牛羊吃掉的剩余草皮還會重新長出大面積草場,但如果不限制放牧規模,過多的牛羊將草吃得一光二凈,則今后不會再有新草生長出來,草場就會消失。重慶大學·蒲勇健例子3蘇格蘭的草地為什么消失了?公共資源經常被過21
由于草地的產權沒有界定,政府也沒有對放牧作出規模限制,每家牧民都會如此盤算:如果其他牧民不約束自己的放牧規模,讓自己的牛羊過多地到草地上吃草,那么,我自己一家約束自己的放牧規模規模對保護草場的貢獻是微乎其微的,不會使草場免于破壞;相反,我也加入過度放牧的行列,至少在草場消失之前還會獲得一部分短期的收益。重慶大學·蒲勇健由于草地的產權沒有界定,政府也沒有對22
如果其他牧民約束放牧規模,我單獨一家人過度放牧不會破壞廣褒的牧場,但自己卻獲得了高額的收益。因此,任何一位牧民的結論都會是:無論其他牧民是否過度放牧,我選擇“約束自己的放牧規?!倍际橇討鹇?,從而被剔除。大家最終都會選擇過度放牧,結果導致草地消失,生態破壞。
重慶大學·蒲勇健如果其他牧民約束放牧規模,我單獨一家23類似的例子還有:
渤海中的魚愈來愈少了,工業化中的大氣及河流污染,森林植被的破壞等。解決公共資源過度利用的出路是政府制訂相應的規制政策加強管理,如我國政府規定海洋捕魚中,每年有一段時間的“休漁期”,此時禁止捕魚,讓小魚苗安安靜靜地生長,大魚好好地產卵,并對魚網的網眼大小作出規定,禁用過小網眼的捕網打魚,保護幼魚的生存。又如在三峽庫區,為了保護庫區水體環境,關閉了前些年泛濫成災的許多小造紙廠等。重慶大學·蒲勇健類似的例子還有:重慶大學·蒲勇健24例子4為什么在城市中心道路上禁止汽車鳴喇叭?
禁鳴喇叭一方面是為了控制城市噪聲污染,另一方面是基于以下的博弈論原因。見表3,當汽車司機可以鳴喇叭時,可能為汽車超速搶行提供條件。但當大家都搶行時,城市交通擁擠加重,反而都難以順利通行,獲得低支付(2,2)。重慶大學·蒲勇健例子4為什么在城市中心道路上禁止汽車鳴25表3交通博弈
司機2緩行搶行緩行司機1搶行
8,81,99,12,2重慶大學·蒲勇健表3交通博弈8,81,99,12,2重慶大學·蒲26
但當對方緩行時,自己搶行會占便宜,獲得支付9。這個博弈中,“緩行”是劣戰略,剔除后得到“剔除劣戰略后的占優戰略均衡”(搶行,搶行),這不是一個好的均衡。當禁止鳴喇叭時,司機為了避免造成交通事故,只得緩行,從而得到好的結果(緩行,緩行)。重慶大學·蒲勇健但當對方緩行時,自己搶行會占便宜,獲得支付9。27例子5為什么要加入WTO?
WTO是一個自愿性申請加入的自由貿易聯盟,即WTO成員國之間實現低關稅或零關稅的相互間自由貿易。為什么需要一個組織來協調國家之間的自由貿易呢?這是因為,如果沒有一個協調組織,國與國之間的貿易就不會呈現低關稅或零關稅的自由貿易局面,因為這時國與國之間的貿易是一個“囚徒困境”。給定一個國家對另一個國家的貨物實行低關稅,另一個國家反過來對這個國家的貨物實行高關稅是占優于實行低關稅的戰略的。重慶大學·蒲勇健例子5為什么要加入WTO?重慶大學·蒲勇健28
1.智豬博弈
豬圈中有一頭大豬和一頭小豬,在豬圈的一端設有一個按鈕,每按一下,位于豬圈另一端的食槽中就會有10單位的豬食進槽,但每按一下按鈕會耗去相當于2單位豬食的成本。如果大豬先到食槽,則大豬吃到9單位食物,小豬僅能吃到1單位食物;如果兩豬同時到食槽,則大豬吃7單位,小豬吃3單位食物;如果小豬先到,大豬吃6單位而小豬吃4單位食物。表4給出這個博弈的支付矩陣。二、智豬博弈:對諸多經濟現象的解釋重慶大學·蒲勇健1.智豬博弈二、智豬博弈:對諸多經濟現象的解釋重慶29表4智豬博弈
小豬按等待按大豬等待
5,14,49,-10,0重慶大學·蒲勇健表4智豬博弈5,14,49,-10,0重慶大學·蒲30
這個博弈沒有“剔除劣戰略均衡”,因為大豬沒有劣戰略。但是,小豬有一個劣戰略“按”,因為無論大豬作何選擇,小豬選擇“等待”是比選擇“按”更好一些的戰略。所以,小豬會剔除“按”,而選擇“等待”;大豬知道小豬會選擇“等待”,從而自己選擇“按”,所以,可以預料博弈的結果是(按,等待)。這稱為“重復剔除劣戰略的占優戰略均衡”,其中小豬的戰略“等待”占優于戰略“按”,而給定小豬剔除了劣戰略“按”后,大豬的戰略“按”又占優于戰略“等待”。重慶大學·蒲勇健這個博弈沒有“剔除劣戰略均衡”,因為大豬沒有31
2.例子
在經濟生活中,有許多“智豬博弈”的例子。
例子6股市博弈在股票市場上,大戶是大豬,他們要進行技術分析,收集信息、預測股價走勢,但大量散戶就是小豬。他們不會花成本去進行技術分析,而是跟著大戶的投資戰略進行股票買賣,即所謂“散戶跟大戶”的現象。
重慶大學·蒲勇健2.例子在經濟生活中,有32例子7為何股份公司中的大股東才有投票權?
在股份公司中,大股東是大豬,他們要收集信息監督經理,因而擁有決定經理任免的投票權,而小股東是小豬,不會直接花精力去監督經理,因而沒有投票權。重慶大學·蒲勇健例子7為何股份公司中的大股東才有投票權?重慶大學·蒲33例子8為什么中小企業不會花錢去開發新產品?
在技術創新市場上,大企業是大豬,它們投入大量資金進行技術創新,開發新產品,而中小企業是小豬,不會進行大規模技術創新,而是等待大企業的新產品形成新的市場后生產模仿大企業的新產品的產品去銷售。重慶大學·蒲勇健例子8為什么中小企業不會花錢去開發新產品?重慶大學34例子9為什么只有大企業才會花巨額金錢打廣告?
大企業是大豬,中小企業是小豬。大企業投入大量資金為產品打廣告,中小企業等大企業的廣告為產品打開銷路形成市場后才生產類似產品進行銷售。
重慶大學·蒲勇健例子9為什么只有大企業才會花巨額金重慶大學·蒲35
表5給出的博弈中,甲和乙都沒有劣戰略,所以,不能通過重復剔除劣戰略獲得博弈結果。三、納什均衡與商業中心區的形成重慶大學·蒲勇健表5給出的博弈中,甲和乙都沒有劣戰略36表5存在納什均衡的博弈
乙
LMRU甲D(問題2:甲和乙分別會選擇什么戰略?)
1,14,21,32,31,22,1重慶大學·蒲勇健表5存在納什均衡的博弈1,14,21,32,31,22,37
當甲選“U”時,乙會選“R”;而當乙選“R”時,甲應該選“D”而不是“U”;但當甲選“D”時,乙會選“L”;給定乙選“L”,甲選“D”是最好的選擇,他不會改變選擇“D”;給定甲不改變選“D”,乙也不會改變其選擇“L”。所以,可以預期(D,L)是甲乙最終完成的穩定的選擇。重慶大學·蒲勇健當甲選“U”時,乙會選“R”;而當乙38
稱(D,L)為“納什均衡”。納什均衡是局中人戰略選擇上構成的一種“僵局”,給定其他局中人的選擇不變,任何一個局中人的選擇是最好的,他也不會改變其戰略選擇。剔除劣戰略的占優戰略均衡和重復剔除劣戰略的占優戰略均衡是納什均衡,但相反的結論不成立。重慶大學·蒲勇健稱(D,L)為“納什均衡”。納什均衡是局39
在城市街道上,我們常見到一些地段上的商店十分擁擠,構成一個繁榮的商業中心區,但另一些地段卻十分冷僻,沒什么商店。對于這種現象,我們可以運用納什均衡的概念來加以解釋。甲乙1/2
圖1商業位置博弈
··重慶大學·蒲勇健在城市街道上,我們常見到一些地段上的商店十分擁40
見圖1,有一個長度為1單位的街道,在街道兩邊均勻地分布著居民。現有兩家商店決定在街道上確定經營位置。如果甲在街道中間位置1/2處設店,則乙的最好選擇是緊靠甲的左邊或右邊設店。重慶大學·蒲勇健見圖1,有一個長度為1單位的街道,在街道兩邊均41當乙在甲的右邊緊靠甲設店時,其右邊街道上的顧客都是乙的顧客;如果乙不是緊靠甲而是遠離甲設店,則其顧客只是其右邊街道的居民,不如它緊靠甲設店時多,因而在遠離甲的位置設店是劣戰略。所以給定甲在1/2處設店,乙在緊靠甲的左邊或右邊設店是最優的。反過來,給定乙在接近1/2處設店,甲的最優選擇也是在1/2附近設店。這樣,甲和乙擠在1/2處設店就是納什均衡,這就是商業中心區的形成原理。重慶大學·蒲勇健當乙在甲的右邊緊靠甲設店時,其右邊街道上的顧42
如果局中人在進行行動選擇時有先后順序之分,這種博弈就被稱為“動態博弈”。在圖2中,有兩個房地產開發商A和B分別決定在同一地段上開發一棟寫字樓。由于市場需求有限,如果他們都開發,則在同一地段會有兩棟寫字樓,超過了市場對寫字樓的需求,難以完全出售,空置房太多導致各自虧損1百萬。
四、動態博弈與承諾行動重慶大學·蒲勇健如果局中人在進行行動選擇時有先43
當只有一家開發商在這個地段開發一棟寫字樓時,它可以全部售出,賺得利潤1百萬。假定A先決策,B在看見A的決策后再決策是否開發寫字樓。在圖2中,用“博弈樹”表示博弈過程。
重慶大學·蒲勇健當只有一家開發商在這個地段開發一棟寫44
圖2房地產開發博弈A不開發開發BB開發不開發開發不開發(-1,-1)(1,0)(0,1)(0,0)重慶大學·蒲勇健A不開發開發BB開發不開發開發不開發(-1,-1)(1,0)45
在其中每一條“路徑”的末端用向量給出A和B的支付,稱為支付向量。下面用“逆向歸納法”可以求解這個博弈。在B進行決策的2個“決策結”上,B在左邊的決策結上選擇“不開發”;而在右邊的決策結上選擇“開發”。即給定A開發,B就不開發;給定A不開發,B就開發。B應避免同時與A都選擇開發而蒙受損失。重慶大學·蒲勇健在其中每一條“路徑”的末端用向量給出A和B46
在這種情況下,A在自己的決策結上當然選擇“開發”,因為他預計當自己選擇“開發”后,B會選擇“不開發”,自己就凈賺一百萬。當B威脅A說:“不管你是否開發,我都會在這里開發寫字樓?!碧热鬉將B的話當了真,A就不敢開發,讓B單獨開發寫字樓占便宜。但是,B的威脅是“不可置信”的。當A不理會B的威脅而果斷地開發出一棟寫字樓時,B其實不會將事前的威脅付諸實施。因為“識時務者為俊杰”,在A已開發的情況下,B的最優決策是“不開發”而不是“開發”。重慶大學·蒲勇健在這種情況下,A在自己的決策結上當然選擇“開47
但是,如果B在向A發出威脅的同時又當著A的面與第三者C打賭一定要在該地段上開發出一棟寫字樓,否則輸給C2百萬元。B與C為此簽定合同并加以公證有效。這時,博弈變成圖3所示的動態博弈。重慶大學·蒲勇健但是,如果B在向A發出威脅的同時又48圖3承諾行動后房地產開發博弈A不開發開發BB開發不開發開發不開發(-1,-1)(1,-2)(0,1)(0,-2)重慶大學·蒲勇健A不開發開發BB開發不開發開發不開發(-1,-1)(1,-249
稱B的這種行動為“承諾行動”,它使原來不可置信的威脅變為可以置信。這時,A就不得不相信B一定要開發寫字樓的威脅了,于是放棄開發寫字樓的計劃,讓B如愿以償單獨開發寫字樓。B不僅未向C支付2百萬元,反而凈賺1百萬。我們可以運用“承諾行動”的原理來分析許多經濟及軍事現象。重慶大學·蒲勇健稱B的這種行動為“承諾行動”,它使原來不可置50
例子10項羽的“破釜沉舟”。例子11韓信趙國之戰,“置之死地而后生”。例子12歐共體在空中客車與波音公司的競爭中對空中客車公司的戰略性補貼。
歐共體為了打破美國波音公司對全球民航業的壟斷,曾放棄歐洲傳統的自由競爭精神而對與波音公司進行競爭的空中客車公司進行補貼。重慶大學·蒲勇健例子10項羽的“破釜沉舟”。重慶大學·蒲勇健51
當雙方都未獲得政府的補貼時,兩個公司都開發新型飛機會因市場飽和而虧損,但若一家公司開發而另一家公司不開發時,則開發的那家公司會獲巨額利潤,見表6。重慶大學·蒲勇健當雙方都未獲得政府的補貼時,兩個公司52表6未補貼時的博弈
空中客車開發不開發開發波音不開發
-10,-10100,00,1000,0重慶大學·蒲勇健表6未補貼時的博弈-10,-10100,00,100053
此時有兩個納什均衡,即一家開發而另一家不開發。下面,考慮歐共體對空中客車進行補貼20個單位的情況。此時,當兩家都開發時,空中客車仍然盈利10單位而不是虧損,博弈矩陣見表7。重慶大學·蒲勇健此時有兩個納什均衡,即一家開發而另一家不開發。54表7有補貼時的博弈
空中客車開發不開發開發波音不開發
-10,10100,00,1200,0重慶大學·蒲勇健表7有補貼時的博弈-10,10100,00,1200,55這時只有一個納什均衡,即波音公司不開發和空中客車公司開發的均衡(不開發,開發),這有利于空中客車。在這里,歐共體對空中客車的補貼就是使空中客車一定要開發(無論波音是否開發)的威脅變得可置信的一種“承諾行動”。重慶大學·蒲勇健這時只有一個納什均衡,即波音公司不56例子13為什么大人物、大公司要聘請常年律師?
大人物、大公司對聲譽十分看重,因而為一些不良人物或公司通過誹謗大人物、大公司企圖迫使大人物、大公司花錢“私了”而獲利。這是因為,盡管對于一些無端的指控,大人物、大公司可望通過法律手段(打官司)而出清了結,但打官司請律師會增加他們額外的成本。如果能花稍少一些錢“私了”,則既使自己清白又省錢,同時誹謗者也獲得收入。重慶大學·蒲勇健例子13為什么大人物、大公司要聘請常年律師?57大人物、大公司為了避免這種無端的損失,干脆花錢請常年律師,律師費用已經一次性支付,打官司不會帶來額外的花費。這是一個承諾行動,它告訴潛在的誹謗者,大人物、大公司一旦受到無端誹謗必定會讓他們吃官司。這樣,大人物、大公司因此承諾行動而使自己得到保護,避免了許多無端指控的發生。重慶大學·蒲勇健大人物、大公司為了避免這種無端的損失58例子14如何以弱敵強在戰爭史上,以弱勝強的例子是很多的。在商業競爭中,以弱敵強也是經常會遇到的情形。在二戰中的諾曼底登陸戰的謀略策劃中,盟軍就面臨以弱敵強的問題。盟軍有兩個可以選擇的登陸目標地,一是多佛,二是諾曼底。德國守軍在人數上超過了盟軍,并且就軍事進攻而言,在人數相同的情況下,攻方與守方相比會處于不利的情形。重慶大學·蒲勇健例子14如何以弱敵強在戰爭史上,59下面,將這種情形模型化。有一支軍隊準備進攻一座城市,它有軍力兩個師。守城軍隊有三個師。通往城市有甲、乙兩條道路或方向。兩軍相遇時,人數居多的一方取勝,當兩方人數相等時,守方獲勝。假定軍隊只能整師調動。
重慶大學·蒲勇健下面,將這種情形模型化。有一支軍隊準60
攻方戰略:a=兩個師集中沿甲方向進攻b=兵分兩路,一個師沿甲方向進攻,另一個師沿乙方向進攻c=兩個師集中沿乙方向進攻重慶大學·蒲勇健重慶大學·蒲勇健61守方戰略:
A=三個師集中守甲方向B=兩個師守甲方向,一個師守乙方向C=一個師守甲方向,兩個師守乙方向D=三個師集中守乙方向重慶大學·蒲勇健重慶大學·蒲勇健62用“+”、“-”,分別表示勝和敗,見下表
守方ABCDa進攻方bc表1以弱敵強博弈-,+-,++,-+,-+,--,+-,++,-+,-+,--,+-,+重慶大學·蒲勇健用“+”、“-”,分別表示勝和敗,見下表63
用“重復剔除劣戰略”分析:進攻方無劣戰略,但守方有劣戰略,A劣于B,D劣于C,故守方不會采用戰略B和C,剔除后的博弈變為:
守方BCa進攻方bc表2守方剔除劣戰略后的博弈
-,++,--,+-,++,--,+重慶大學·蒲勇健用“重復剔除劣戰略”分析:-,++,--,+-64
攻方知道守方不會選A和D,他由此知道博弈變成上圖所示。此時,攻方就有一個劣戰略b,他剔除b后得到新的博弈,見下表:守方a進攻方b表3攻方剔除劣戰略后的博弈-,++,-+,--,+重慶大學·蒲勇健攻方知道守方不會選A和D,他由此知道65
此時,兩方的形勢是相同的,即攻方盡管開始在軍力上劣于守方,但實際上它只要運用計謀,其獲勝的可能與守方是相同的。重慶大學·蒲勇健此時,兩方的形勢是相同的,即攻方盡66
博弈論作為經濟學研究的有力工具,真正大行其道是在70年代不對稱信息下經濟行為分析的興起。不對稱信息指一些局中人擁有別的局中人不擁有的“私人信息”,也就是說一些局中人知道別的局中人不知道的某些情況。下面用一些例子說明這種情形下的博弈行為。
五、不對稱信息下的博弈重慶大學·蒲勇健博弈論作為經濟學研究的有力工具,真正大行其道是67例子15二手車市場為什么難以建立?在發達國家,二手車(舊車)的價格往往比新車差一大截,即使舊車本身沒有什么質量問題,一旦舊車進入二手車市場,其價格就會與新車相比差得老遠。在我國許多城市,二手車市場甚至難以建立起來,原因是進入市場的買車人太少。這是為什么呢?二手車市場的博弈理論為我們解答了這個謎語。重慶大學·蒲勇健例子15二手車市場為什么難以建立?68在二手車市場上,賣車人比買車人更多地知道車的質量情況,但賣車人不會將舊車的質量問題老老實實地告訴買車人。買車人也知道這種情形,因此,買車人在開出價格時會考慮到車的質量問題。假定沒有問題的好車價值20萬元,有問題的壞車只值10萬元,并且設買車人認為市場上出現好車和壞車的可能性各占一半。這時,買車人開出的價格不會高于1/2×20+1/2×10=15萬元。這樣,如果賣車人的車果真是好車,他就不會出售,好車退出市場,但當賣車人的車是壞車時,他會十分積極地將只值10萬元的車按15萬元賣給他。重慶大學·蒲勇健在二手車市場上,賣車人比買車人更多69
但買車人知道愿意按15萬元賣的車一定是壞車,從而認定市場上全是壞車。所以,除非他愿意買一輛壞車,否則他會退出市場。當他愿買壞車時,他只開出10萬元的價。于是,舊車市場或者建立不起來,沒有買主,或者充斥著壞車,真正的好車退出市場,而壞車在不斷成交,但價格很低。類似現象廣泛存在如人才市場、信貸市場等。如一個公司往往流走的是能力強的人,因為公司不能正確評價一個能力強的員工的能力,給予的薪水低于其市場價值。重慶大學·蒲勇健但買車人知道愿意按15萬元賣的車一定70
例子16維克里拍賣法
如果有一件古董需要拍賣,有許多人參加競爭性拍賣。這件古董在每個買主心中有一個價值評價。但是,賣主不知道買主的評價,買主也不會老實將其對古董的評價告訴賣主。不同買主之間也不知道其他人的價值評價。
重慶大學·蒲勇健例子16維克里拍賣法重慶大學·蒲勇健71
如果采用“英式拍賣法”,買主們輪流出價,直到開出最高價的買主拿走古董并支付所開出的最高價格。按這種拍賣方法,古董并不能按買主心中的最高評價價值賣出。壁如,當買主中的最高評價為100萬元,第二高評價為90萬元時,當評價最高的買主開出91萬元時,就可買走其評價為100萬元的古董但只支付了91萬元。由于這是公開競價,會出現圍標問題,即買主們合謀壓價。重慶大學·蒲勇健如果采用“英式拍賣法”,買主們輪流出價,直到開72
另一種方法是:“一級密封價格拍賣法”。買主每人將其開出的價格寫入一個信封,密封后交給賣主。賣主拆開所有信封,將古董賣給信封中出價最高的買主,并要求支付最高的價格。這種方法可避免圍標,但不能將古董按買主中最高的評價價值賣出。因為買主不會按心中的評價老老實實地將價格寫為其價值評價。如果該買主認為古董值100萬元,他不會寫出價格為100萬元,因為當他開出比100萬更低一些的價格時,有可能贏得古董但凈賺一個價值與價格的差額。如當他開出90萬元時,有可能成交并凈賺10萬元。相反,當他開出100萬元時,即使成交也無賺頭。所以,大家都不會老老實實報出心中的價值。重慶大學·蒲勇健另一種方法是:“一級密封價格拍賣法73
經濟學家維克里發明的“二級密封價格拍賣法”(又稱維克里拍賣法或維克里招標法),既可避免圍標,又可誘使買主們老老實實地開出心中的真實評價。維克里拍賣法要求每個買主寫入信封一個出價,密封后交給賣主,賣主拆開信封后宣布將古董賣給出價最高的人,但只需支付開出的第二高的價格。譬如,出價最高的為100萬元,第二高的為90萬元,古董就賣給開出100萬元的人,但他只需支付給賣主90萬元。重慶大學·蒲勇健經濟學家維克里發明的“二級密封價格拍賣法”(又74
對每個買主來說,他不知道其他買主的評價,但給定其他買主的評價(盡管他不知道),他一旦獲勝,支付的第二高的價格是固定的,不會隨他開出的價格而變;但他開出的價格愈高,獲勝的可能就愈大;但是,他不能開出比他的價值評價更高的價格。因為一旦存在別的人開出的價格比他的價值評價還要高,當他獲勝時,就必須以高出他的價值評價的價格購買古董,對他來說是得不償失的。重慶大學·蒲勇健對每個買主來說,他不知道其他買主的評75所以,每個人都會老老實實在按心中的評價開出價格。如果所有人的評價是一樣的,古董就以真實的最高價值賣出。維克里拍賣法可以誘使買主說出真話。70年代美國聯邦政府運用維克里招標法進行公共工程招標,為聯邦政府節省了大筆開支。重慶大學·蒲勇健所以,每個人都會老老實實在按心中的評76
例子17壟斷廠商的低價銷售:信號傳遞博弈
有許多壟斷廠商并未如人們所料想的那樣給商品定出一個很高的價格,而是以較低的價格長期銷售某種產品。譬如,發達國家的私營鐵路、航空、海運碼頭等的價格都遠低于按照其壟斷定價方法定出的價格。這是什么原因呢?
重慶大學·蒲勇健例子17壟斷廠商的低價銷售:信號傳遞博弈重慶大學·77
記得有一個電視劇,其中有一個情節是一位武林豪杰在交通要道邊開了一個酒館。生產十分興隆,引起另一位武林高手的垂涎。這位武林高手決定打敗那位豪杰然后霸占酒館。兩強相遇,武林豪杰和武林高手相互之間不知對方底細,于是來一番比試。本來,他們倆可以通過打斗來解決問題,但打斗一場雙方都會有所損傷,不如通過其他方式比較武功高低。豪杰拿來5塊磚,一掌將其擊碎,高手也不示弱,照樣擊碎5塊磚。于是,豪杰又拿來十塊磚,同樣是一掌擊個粉碎,高手見之,心中沒底,于是明白自己武功較豪杰還差一截。于是,這位武林高手甘拜下風,放棄了原來的計劃,棄劍而去。重慶大學·蒲勇健記得有一個電視劇,其中有一個情節是78
這個電視劇情節在博弈論中被稱為“信號傳遞博弈”。豪杰身懷絕技、天下無敵。但其他人不一定會相信他是武林第一高手,除非親自與之交手并敗于他。交戰雖然可以決出高下,但對雙方都會有損失,打個頭破血流對誰都不是好事。當然,豪杰可以對外宣布他的武功非凡,其他人不是他的對手,但即使豪杰沒有什么本事,也可以如此對外宣布。所以,僅憑口頭宣布是難以令人信服的。重慶大學·蒲勇健這個電視劇情節在博弈論中被稱為“信號傳遞79俗話說,是騾子是馬,拉出去蹓蹓。豪杰用過人武功劈掉別人難以模仿的十塊磚,就向別人發出一個信號。這個信號向外傳遞的信息是:我的武功高強,你們不可匹敵。這樣,不用打斗就決出高下,避免了打斗帶來的更大損失。現在,我們用這個“信號傳遞博弈”的原理,來解釋為何一些壟斷廠商長期在低價格水平上經營。如果這個壟斷廠商是一個低生產成本的廠商,當其它較高生產成本廠商也進入這個廠商所經營的行業與之進行競爭時,原先的那個壟斷廠商可以通過降價將進入者趕出這個行業,從而繼續維持壟斷經營。重慶大學·蒲勇健俗話說,是騾子是馬,拉出去蹓蹓。豪80
由于壟斷廠商有更低的生產成本,所以,它能夠將產品價格降到比進入廠商的生產成本還要低的水平上,這就造成進入者或者高價格經營導致顧客流失,或者同樣也降價但價格低于成本,兩種情形進入者都會虧損,最后不得不退出行業。但是,這種“打斗”行為盡管可以擊退進入者,但由于一段時間的降價經營可能對壟斷者帶來較大損失。壟斷者為了避免這種損失,可以向外宣布它是低成本的,別的廠商休想進來與它競爭。但僅憑口頭宣布人家是不會相信的,因為即使壟斷者不是低成本的廠商,它也會如此宣布。重慶大學·蒲勇健由于壟斷廠商有更低的生產成本,所以81
一種方法就是,正如電視劇中的故事那樣,壟斷者向外發送一個信號,向外界傳遞它真是低成本的信息。它可以長期在一個較低價格水平上經營。如果它的價格足夠低,高成本廠商不敢模仿,行內廠商會據此判定它確是低成本的。同時,它的價格也不能太低,以致于較之與進入者進行降價競爭,其損失為小一些。這樣,壟斷者才會采取如此策略。潛在的高成本進入者不敢進入,壟斷者得以保持長期的壟斷地位。重慶大學·蒲勇健一種方法就是,正如電視劇中的故事那樣82
例子18為什么有的商品廣告既無商品的價格信息又無售貨地點信息,只有明星的表演?
通常認為,商業廣告的功能是向消費者提供必要的購貨信息,如散布商品的價格,質量功能,出售地點等信息。再者,人們還認為有些廣告可能是為了引導消費,特別是新產品出現時,消費者還不知道不熟悉它,商業廣告中通過一些電影明星使用新產品的圖象,利用公眾的“追星”心理打造市場。這種關于新產品市場引導的廣告在國外的電視廣告中特別常見,通常是一位當紅明星在電視上用新產品表演一番,既無價格,也無售貨地點的介紹,除了顯示一下商標外,完全沒有對產品性能的說明。不過,對于這類廣告,博弈論還有一種“信號傳遞”的解釋呢?重慶大學·蒲勇健例子18為什么有的商品廣告既無商品的價格信息又83
假設有一家企業(記為企業A)開發出一種很有市場潛力的飲料,該產品飲后對人的健康確實有好處。但同時,另一家生產假冒偽劣產品的企業(記為企業B)也準備向市場推出一種偽劣產品飲料。兩個企業都會向公眾宣布其產品是上乘的,如何如何的好。但公眾是理性的,不會僅憑商業宣傳就相信它們。但是,如果產品真的好,隨著時間的推移,消費者能夠識別出來。所以,生產好飲料的的企業A對自己的市場有信心,它相信隨著時間的推移,企業B生產的偽劣產品終究會被消費者識破,重慶大學·蒲勇健假設有一家企業(記為企業A)開發出84
顧客會跑到自己這里來,從而自己的市場會不斷擴大,銷售收入及利潤會不斷增長,而企業B開始可以蒙騙一部分消費者,但時間一長,產品的問題會暴露出來,市場會不斷縮小,收入及未來利潤都不會有企業A的大。這樣一來,企業A的未來預期收入遠大于企業B。因此,如果企業A請一位當紅明星打廣告,由于是當紅明星,他們打廣告有很高的市場價格,就可以使企業B不敢模仿。譬如,假定企業A的預期收入為3千萬元,企業B的預期收入為1千萬元。當紅明星打廣告的市場價格為2千萬元,那么,企業A可以請明星打廣告但企業B就請不起。重慶大學·蒲勇健顧客會跑到自己這里來,從而自己的市85
消費者也明白這個道理,從而會在一開始就識別出不能請當紅明星打廣告的企業B是生產偽劣產品的。這樣,企業B一開始就沒有市場。當企業A請了當紅明星打廣告時,企業B發現這位明星的市場價格太高,自己難以模仿企業A,開始就會放棄生產偽劣產品的計劃。所以,企業A通過請當紅明星打廣告而清除掉了潛在的市場模仿者,它向公眾傳遞自己是生產好產品的信號,這種信號的價值在于其所請來的當紅明星有著較高的出場價格,而不在乎明星在廣告節目中說了什么,表演了什么,當然更無所謂廣告節目是否介紹產品價格等信息了。企業A請當紅明星打廣告就為公眾傳遞了它是生產好產品的企業的一個信號。重慶大學·蒲勇健消費者也明白這個道理,從而會在一開86
例子19為什么許多實力雄厚的公司還要向銀行借很多錢?
在國外,一些資金實力雄厚的公司通常也會向銀行貸款。更加令人感到奇怪的是,一些好的公司,一方面自己借錢給別的公司,同時,另一方面又向銀行借錢。博弈論運用“信號傳遞”原理可以對此現象作出解釋。重慶大學·蒲勇健例子19為什么許多實力雄厚的公司還要向銀行借很多87
對于一家公司來說,負債增加會增大公司破產的可能性;但是,對于實力雄厚的公司,在同樣負債比例下,其破產可能性要小一些。每個公司都會向社會吹噓自己是好的公司,實力雄厚,但公眾不會僅憑口頭宣傳就相信的。于是,真正好的公司通過向銀行借錢來增大自己破產的可能性,令其它實際上不好的公司難以模仿。這種負債比例的增加要做到恰到好處,它既可令其它實力稍弱的公司難以模仿,又使自己能夠承受。重慶大學·蒲勇健對于一家公司來說,負債增加會增大公司88
這樣,公眾就能識別出誰是好的公司,從而競相購買好的公司的股票,導致公司股票價格上漲,結果這家負債公司會因其股價上漲而獲資本增值,破產的可能性反而下降了。當然,公司通過增加負債來向投資者傳遞公司信息的代價可能太高,因而有時公司十分樂意向投資者直接披露內部信息,只要這種信息足以使投資者相信其真實性,就會為公司減少信息傳遞成本。
(問題3:在中國是否負債比例高的公司就是好的公司?)重慶大學·蒲勇健這樣,公眾就能識別出誰是好的公司,從89
例子20飛機、輪船等設立頭等艙、經濟艙的道理是什么?
無論是買票乘飛機、火車還是輪船,不同的人所愿意支付的價格實際上是不一樣的。有的人收入高一些,或對花錢看得比較松一些,就可以支付較高的價格,相反,收入低的人或對花錢看得比較緊一些的人,就只愿支付較低的價格。但是,如果你問他們愿意支付什么樣的價格,他們都必定說愿支付較低的價格,因為既使有錢人有也會在同樣服務下以低價購買劃算一些。重慶大學·蒲勇健例子20飛機、輪船等設立頭等艙、經濟艙的道理90
飛機或輪船公司為了將這些在經濟學中被稱為具有不同支付意愿的人區分開來,讓能支付較高價格的人支付較高價格,就設計了一種“信息甄別”的機制,這種機制就是設立頭等艙、二等艙、三等艙,……,等等。這種機制發揮作用的道理是這樣的,我們可以用著名的“所羅門王斷案”的故事來說明。所羅門王是古代以色列國的一位以智慧著稱的君主。重慶大學·蒲勇健飛機或輪船公司為了將這些在經濟學中被稱91一次,兩個女人為爭奪一個嬰兒爭扯到所羅門王殿前,她們都說嬰兒是自己的,請所羅門王作主。所羅門王稍加思考后作出決定:將嬰兒一刀劈為兩段,兩位婦人各得一半。這時,其中一位婦人立即要求所羅門王將嬰兒判給對方,并說嬰兒不是自己的,應完整歸還給另一位婦人,千萬別將嬰兒劈成兩半。聽罷這位婦人的求訴,所羅門王立即作出最終裁決——嬰兒是這位請求不殺嬰兒的婦人的,應歸于她。重慶大學·蒲勇健
92
這個故事講的道理是,盡管所羅門王不知道兩位婦人中誰是嬰兒的母親,但他知道嬰兒真正的母親是寧愿失去孩子也不會讓孩子被劈成兩半的。所羅門王正是利用這一點,一下就識別出誰是嬰兒的真正的母親了。所羅門王的這種方法在博弈論中被稱為“機制設計”,即設計一套博弈的規則,令不同類型的人作出不同的選擇,盡管每個人的類型可能是隱藏的,別人觀察不到,但他們所作出的不同選擇卻是可以觀察到的。觀察者可以通過觀察不同人的選擇而反過來推演出他們的真實類型。重慶大學·蒲勇健這個故事講的道理是,盡管所羅門王不93
當飛機或輪船的艙位條件和價格完全一樣時,不同支付意愿的人都會以最低價格買票,不會有人愿支付比別人更多的錢去買相同的艙位的票。于是,航空公司或輪船公司將艙位分成頭等艙、二等艙,……,等等,價格稍有不同,當然服務也不同,就將不同支付意愿的顧客區分開了。重慶大學·蒲勇健當飛機或輪船的艙位條件和價格完全一樣94
頭等艙比其它較低等級艙位的價格高許多并不主要是因為它的服務要比其它艙位的服務好許多(當然還是要好一些),而是因為那些坐頭等艙的人的支付能力比其它艙位的旅客的支付能力要強許多,說白了,就是坐頭等艙的人比坐其它艙位的人更有錢或更能花錢而已!但是,如果航空公司或輪船公司不對艙位作如此區分,即使是有錢人也不會愿意坐同樣的艙位而支付比別人支付的更高的價格。重慶大學·蒲勇健頭等艙比其它較低等級艙位的價95
這里,支付能力是旅客的類型,選擇艙位等級是他們的選擇。支付能力無法觀察,但買什么艙位的票卻能夠觀察,航空或輪船公司因此而識別出可以支付更高價格的顧客而賺取更多利潤。譬如,有兩位旅客甲和乙乘飛機。甲的最高支付能力為1000元,乙的最高支付能力為1500元。經濟艙的服務成本為800元,頭等艙的服務成本為1200元。
重慶大學·蒲勇健這里,支付能力是旅客的類型,選擇96經濟艙帶給甲和乙的消費滿足感(經濟學中稱為效用)為1000元,頭等艙帶給甲和乙的效用為1800元。如果沒有頭等艙,航空公司最多把票價定到1000元,利潤為2×(1000-800)=400元。因為票價一旦高于1000元,甲和乙就不會買票了。但當設立頭等艙后,航空公司將經濟艙票價定為1000元,將頭等艙票價定為1500元。此時,甲以1000元買經濟艙。重慶大學·蒲勇健經濟艙帶給甲和乙的消費滿足感(經濟學97
乙如果買經濟艙,則其凈效用(經濟學稱為消費者剩余)為1000-1000=0,但當乙買頭等艙票時的消費者剩余為1800-1500=300元,所以乙會買頭等艙。甲的支付能力只有1000元,所以甲只有買經濟艙。這時,航空公司的利潤增大為(1000-800)+(1500-1200)=500元>400元。通過機制設計增大了公司利潤。重慶大學·蒲勇健乙如果買經濟艙,則其凈效用(經濟學稱98
類似的還有,酒店的星級分類,五星級、四星級、三星級,……酒店,冰棍的不同品種與價格,影劇院的不同座位價格表等等,都是實現信息甄別的機制設計。重慶大學·蒲勇健類似的還有,酒店的星級分類,五星級99
例子21大智若愚中的智慧:聰明過頭沒好處
美國19世紀有一個頗有成就的政治家,其幼年時是流浪街頭的孤兒。他經常在大街上向行人討錢,但當有人讓他在一塊錢和兩塊錢之間選擇時,他選擇了一塊錢。于是,許多人都為了親眼驗證關于他的“犯傻”行為的傳聞,專門來找他并讓他在一塊錢和兩塊錢之間選擇。他仍然依然故我地只選擇一塊錢,于是來找他的人愈來愈多。重慶大學·蒲勇健例子21大智若愚中的智慧:聰明過頭沒好處100
終于有一天,有一位女士問他:難道你不知道兩塊錢比一塊錢更多一些錢嗎?他如此回答道:如果我有一次選擇了兩塊錢,就不會有人來找我讓我在一塊錢與兩塊錢之間選擇了,我也討不到錢了。這個故事告訴我們有時候“扮傻”也許是有好處的。下面再來看一個例子,這是一個動態博弈,局中人A有兩次決策機會,一次在局中人B決策之前,另一次在B決策之后。重慶大學·蒲勇健終于有一天,有一位女士問他:難道你不101圖4一個動態博弈
運用“逆向歸納法”,A在第二次決策時會選擇,B選擇L;給定這些結果,A在開始會選擇U,納什均衡是((U,),L)。(2,0)(1,1)(3,0)(0,2)DBRAULA重慶大學·蒲勇健(2,0)(1,1)(3,0)(0,2)DBRAULA重慶大102
但是,如果局中人A開始“裝傻”,選擇D而不是U,當B認為A是傻子時,B會以為當他選R后A會選,而這正是B所樂意看到的結果。于是,當A開始裝傻后,造成B對A的類型的誤解,B以為A是傻子,從而預期當他自己選R后A還會“犯傻”選。于是B就選R而不是均衡中的L。但是,當B選了R后,A不再“裝傻”而一舉選達到最大支付3。這就是A通過“裝傻”騙過B使A獲利。重慶大學·蒲勇健但是,如果局中人A開始“裝傻”,選擇D103
第二種情形是,局中人B“裝傻”,并使A相信他是傻子。這樣,A會認為當他選D時B會選R。于是,A開始就選D,但一旦A選了D,B就不再“裝傻”,一舉選L。這是B騙過A的情形。下面的一個例子是當所有局中人都“裝傻”時,所有人都受益的情形。重慶大學·蒲勇健第二種情形是,局中人B“裝傻”,并使A104圖5所有人都“裝傻”使所有人都受益的博弈由逆向歸納法,博弈均衡是所有人都選擇D,即(D,…,D)。結果是博弈在一開始就結束了,每個局中人都獲得支付1。AUBDDBDAUDBDAUDU(100,100)(1,1)(0,3)(98,98)(97,100)(99,99)(98,101)……重慶大學·蒲勇健AUBDDBDAUDBDAUDU(100,100)(1,1)105如果A開始就裝傻,選U而不是D,B也裝傻,選U不選D,則博弈到最后結束時每個局中人得到支付100。相反,下面用一個例子說明當所有人都“聰明過頭”時,所有人都受損失的道理。有這樣一個故事,稱為“旅行者困境”,說的是有兩個旅行者甲和乙從一個以出產花瓶的著名旅游勝地回來時,他們都買了花瓶。重慶大學·蒲勇健如果A開始就裝傻,選U而不是D,B也裝106
提取行查時,發現花瓶被碰破了。他們向航空公司索賠。航空公司估計花瓶的價格在80或90元的價位左右,但不知道這兩位旅客購買的準確價格。航空公司要求兩位旅客在100元以內自己寫下花瓶價格。若兩人寫的相同,說明他們說了真話,就照他們寫的數額賠償;如果兩人寫的不一樣,那就認定寫得低的旅客講的是真話,按這個低的價格賠償,但是對講真話的旅客獎勵2元錢,對講假話的旅客罰款2元。重慶大學·蒲勇健提取行查時,發現花瓶被碰破了。他們向航107
如果兩人都寫100元,他們都會獲得100元。但是,給定乙寫100元,甲改寫99元,則他會獲得101元。乙又想,若甲寫99元,他自己寫98元,比寫100元好,因為這樣他獲100元,而寫100元當甲寫99元時自己卻只獲97元。而給定乙寫98元,甲又會寫97元,……,這樣,最后落得每人都只寫1、2元的境地。
所以,還是古人說得好,有時“大智若愚”可能還是上策呢?重慶大學·蒲勇健如果兩人都寫100元,他們都會獲得10108
小孩玩的游戲“石頭,剪子,布”,也是一種博弈。但是,這個博弈有一種有趣的特征,即給定一方的任何選擇,另一方都有制勝對方的戰略,所以,給定一方任何一個戰略,對方都有制勝這個戰略的戰略,因而這個戰略不是最優的。任何“純戰略”都不是最優的,純戰略是“石頭,剪子,布”中的任何一個。
六、混合戰略博弈重慶大學·蒲勇健小孩玩的游戲“石頭,剪子,布”,也是109
但是,我們知道,玩這個游戲是總是以對方不易猜出的隨機方式出招。事實上,可以通過數學證明,當雙方都以每個戰略按1/3的概率出招時,達成一種雙方都不愿改變這種概率分布的局面。這被稱為“混合戰略納什均衡”,而這種以隨機方式選擇純戰略的博弈被稱為“混合戰略博弈”。以混合戰略博弈的概念,我們來看下面幾個例子。重慶大學·蒲勇健但是,我們知道,玩這個游戲是總是以對110
例子22為什么一般人總是小錯不斷,大錯不犯;偷稅漏稅的一般是中小企業,大企業會老老實實地交稅?
稅務部門不會對所有企業的交稅情況每一次都去檢查,因為這樣做的成本太高,得不償失。所以,稅務部門總是隨機地對企業的交稅情況進行檢查。重慶大學·蒲勇健例子22為什么一般人總是小錯不斷,大錯不犯;偷稅111
企業也是隨機地在交稅與偷漏稅之間進行選擇。稅收部門與企業間進行的是混合戰略博弈。因為如果企業總是交稅,稅務部門就最好不檢查;但給定不檢查,企業就會偷漏稅。所以,兩者只有在隨機地檢查與不檢查,企業隨機地在偷漏稅與交稅之間選擇,才會達成均衡。
重慶大學·蒲勇健企業也是隨機地在交稅與偷漏稅之間進行選112
對于大企業,因一旦偷稅就數目巨大,所以,稅務部門在隨機檢查時放在大企業上的可能性就大一些;而給定稅務部門檢查大企業的可能性較大,大企業偷漏稅的行為就較少,否則就容易被逮個正著。所以,偷漏稅較多的就是一些中小企業,大企業納稅的積極性較高。同樣,大人物或有錢人納稅的積極性應較高,至于我國在過去一段時期有錢人反而不交稅的現象主要源于制度不健全或已有的制度得不到貫徹所致。同樣的道理,在犯罪或對錯誤的監督懲罰博弈中,也是混合博弈,人們可能總是大錯不犯小錯不斷。重慶大學·蒲勇健對于大企業,因一旦偷稅就數目巨大,113
例子23田忌賽馬新編
春秋戰國時期,齊威王常與旗下大將田忌賽馬。規則是:每次賽三局,每一局齊威王與田忌各出一匹馬比賽奔跑速度。每一局中的勝者贏敗方一千斤銅。田忌有上、中、下三匹馬,而齊威王也有上、中、下三匹馬。每次比賽,第一局田忌出上馬,齊威王也出上馬;第二局田忌出中馬,齊威王也出中馬;第三局,田忌出下馬,齊威王也出下馬。齊威王的上馬比田忌的上馬好,齊威王的中馬也比田忌的中馬好,齊威王的下馬還是比田忌的下馬好。于是,每次比賽的結果都是田忌連輸三局。重慶大學·蒲勇健例子23田忌賽馬新編重慶大學·蒲勇健114
田忌的謀士孫臏了解了田忌的困境后,就打聽到這樣一個消息:盡管齊威王的上、中、下三匹馬都要比田忌的對應上、中、下三匹馬好,但碰巧的是田忌的上馬可勝齊威王的中馬,田忌的中馬可勝齊威王的下馬。于是,孫臏為田忌獻計:下一次比賽中第一局時田忌出下馬對齊威王的上馬輸一局,第二局田忌出上馬對齊威王的中馬,第三局田忌出中馬對齊威王的下馬,這樣可連贏兩局,最后凈勝一千斤銅。田忌依計而行,果真贏回一千斤銅。重慶大學·蒲勇健田忌的謀士孫臏了解了115
這個故事曾經被很多人當作博弈論的例子來演繹,但實際上這個故事與博弈論無關。博弈論會假定所有局中人都是理性的,不能假定一些局中人聰明而另一些局中人卻是傻子。當田忌出下馬時,齊威王最好的選擇是出下馬而不是上馬。孫臏的計謀中假定齊威王是傻子,當田忌出下、上、中馬時,他仍然按上、中、下馬出,當然要輸了。事實上,當田忌出下馬時,齊威王應出下馬,但齊威王出下馬時,田忌不應出下馬而是出中馬,但此時齊威王又應出中馬而不是下馬了,……。這樣,博弈不會有純戰略的均衡。重慶大學·蒲勇健這個故事曾經被很多人當作博弈論的例子116
兩人只能玩混合戰略博弈,齊威王分別以1/6隨機的概率選擇出上、中、下馬的任一排列,田忌也如此。由于齊威王存在絕對優勢,他平均看來仍然會贏田忌一千斤銅。
重慶大學·蒲勇健兩人只能玩混合戰略博弈,齊威王分別以1117
例子24如果曹操與諸葛亮一樣聰明:三國演義中的華容道博弈
在《三國演義》中,曹操在赤壁大戰中一敗涂地,率殘兵敗將向許都方向逃竄。諸葛亮命關羽率兵在途中阻截曹軍。當時,第一批攔截大軍是趙云率領的,第二批攔截大軍是張飛帶隊的,第三批才是關羽率部伏擊。由于曹軍兵多將廣,前二批伏擊軍不能逮住曹操,只是搶劫一些軍械馬匹之類。重慶大學·蒲勇健例子24如果曹操與諸葛亮一樣聰明:三國演義中的華容118
待曹軍沖過趙云、張飛兩道關后,進入關羽的伏擊地帶。但是,當時關羽與曹操相遇的地方有兩條道,一條是華容道,除此外還有另一條道。諸葛亮令關羽伏兵于華容道,并且要求關羽在華容道上點燃樹枝冒出煙霧引曹操到來。當時關羽不解,問諸葛亮,“如果在伏兵之處點火,豈不令曹兵看見而改走另一條道逃脫?”諸荀亮叫關羽不要再問,只如此照辦即可。重慶大學·蒲勇健待曹軍沖過趙云、張飛兩道關后,進入關119
當曹操沖破趙云、張飛的阻截后,來到華容道前,看見華容道上靜悄悄的,但有煙火縈繞。曹操大笑道:“孔明以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物質能源在建筑材料的研發與應用考核試卷
- 影視錄放設備的D打印技術應用考核試卷
- 初中數學聽課記錄
- 小學一年級下冊數學100以內口算綜合集錦
- 臨床肝膽胰脾影像診斷
- 上海紐約大學《亞洲地理及歷史》2023-2024學年第二學期期末試卷
- 四川省攀枝花市鹽邊縣2024-2025學年三下數學期末教學質量檢測模擬試題含解析
- 湘南學院《錄音藝術與聲音剪輯》2023-2024學年第一學期期末試卷
- 石家莊幼兒師范高等專科學校《工程分析程序設計》2023-2024學年第二學期期末試卷
- 山西省太原市2024-2025學年五下數學期末經典試題含答案
- 碳管理系統平臺解決方案
- 第36講 第二次世界大戰與戰后國際秩序的形成
- 紡織創新材料的應用
- 北師版小學六年級下學期《數 學 好 玩》教案
- 醫院培訓課件:《靜脈中等長度導管臨床應用專家共識》
- 新生兒科護理文書
- 奇特的視覺圖形 課件 -2023--2024學年浙教版初中美術八年級下冊
- 《公路橋梁施工監控技術規程》(JTGT3650-01-2022)
- 人教版高中地理必修第二冊第二章鄉村和城鎮
- 花籃拉桿式懸挑式腳手架施工施工工藝技術
- 廣西壯族自治區貴港市覃塘區2023-2024學年七年級下學期7月期末歷史試題(無答案)
評論
0/150
提交評論