博弈論與領導干部決策思維(ppt 131頁).ppt_第1頁
博弈論與領導干部決策思維(ppt 131頁).ppt_第2頁
博弈論與領導干部決策思維(ppt 131頁).ppt_第3頁
博弈論與領導干部決策思維(ppt 131頁).ppt_第4頁
博弈論與領導干部決策思維(ppt 131頁).ppt_第5頁
已閱讀5頁,還剩125頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

張泰城 博弈論與領導干部決策思維 引言 20世紀90年代至2003年 諾貝爾經濟學獎三次 1994 1996 2001 授予了與博弈論相關的研究領域 總共有八位經濟學家獲獎 是獲獎人數最多的領域 排在第二位的是金融 博弈論研究的最大特點一般決策研究 數學表達 Y f x1 x2 xn 博弈論的決策研究 數學表達 Y f x1 x2 xn z z為他人行為 特點 決策者目標函數的自變量中包含他人行為 嚴格地講 博弈論是一種方法 應用范圍不僅包括經濟學 政治學 軍事 外交 國際關系 公共選擇 還有犯罪學 都涉及到博弈論 實際上 不少人把博弈論看成是數學的一個分支 納什1951年的奠基性文章就是發表在數學雜志上 夏普里1953年的文章本身也是一篇數學手稿 一 博弈論基礎知識 1 博弈論的基本概念 博弈論 譯自英文 GameTheory 直譯 游戲理論 游戲有下列特征 1 都有規則 2 都有結果 贏 輸 平 結果能折算成數值 3 都有策略或者說計謀 選擇不同的策略或計謀往往帶來不同的結果 4 策略和利益有相互依存性 即每一個游戲者所得結果的好壞 不僅取決于自身的策略選擇 也取決于其他參加者的策略選擇 策略本身常常沒有絕對的好壞之分 只有相對于他方策略的相對好壞 博弈論也稱為 對策論 其實并不是很恰當 因為 對策 在實際中常被用來表示具體的針對性反應方案 或站在某個決策方的立場上找針對其他方的對策 博弈論所研究的決策問題卻是有開始 有次序 有結果的整個過程 博弈 的通俗含意不過是弈棋 賭勝 但由于它是帶有文言性質的詞 因而顯得學術味濃一些 既能反映這門學科的特點和實質 又給人一種高深莫測的感覺 博弈的簡明定義 博弈即一些個人或其他組織 面對一定的環境條件 在一定的規則下 同時或先后 一次或多次 從各自允許選擇的行為或策略中進行選擇并加以實施 各自取得相應結果的過程 博弈論 是研究決策主體的行為發生直接相互作用時候的決策以及這種決策的均衡問題 博弈論研究的對象是理性的參與者如何選擇策略或如何作出行動的決定 使自己的目標最大化 2 構成一個博弈的基本要素 博弈的七要素參與人 行動 信息 戰略 支付函數 結果 均衡 參與人是博弈中選擇行動以最大化自己效用的決策主體 可以是個人 團體等 行動是參與人的決策變量 戰略是參與人選擇行動的規則 它告訴參與人在什么時候選擇什么行動 信息指的是參與人在博弈中的知識 特別是有關其他參與人 對手 的特征和行動的知識 支付函數是參與人從博弈中獲得的效用水平 是每個參與人真正關心的東西 結果是指博弈分析者感興趣的要素的集合 均衡是所有參與人的最優戰略或行動的組合 博弈的三要素1 博弈的參加者2 博弈方各自可選擇的全部策略或行動的集合3 博弈方的得益 3 博弈的表述形式 1 標準形式 策略形式 守城 棄城 攻城 退兵 諸葛亮 司馬懿 華容道 大路 華容道 大路 諸葛亮 曹操 2 擴展形式 博弈樹 3 聯盟形式 特殊函數形式 4 博弈的類別 博弈分類可依不同的判據進行 博弈人數 單人博弈 兩人博弈 多人博弈 策略的數量 有限博弈 無限博弈 得益情況 零和博弈 常和博弈 變和博弈 博弈過程 靜態博弈 動態博弈 重復博弈 信息結構 完全信息博弈 靜 動態 不完全信息博弈 靜 動態 完美信息動態博弈 不完美信息動態博弈 博弈方的理性和行為邏輯 完全理性博弈 有限理性博弈 合作博弈 非合作博弈 常見的博弈分類 從這個角度 博弈可以分為靜態博弈和動態博弈 靜態博弈指的是博弈參與人同時行動 或雖非同時但后行動者不知道前行動者采取了什么具體行動 動態博弈指的是參與人的行動有先后順序 且后行動者能觀察到先行動者所選擇的行動 1 參與人行動的先后順序 2 參與人的信息 從這個角度 博弈可以分為完全信息博弈和不完全信息博弈 完全信息指的是每一個參與人對所有其他參與人 對手 的特征 戰略空間及支付函數有準確的知識 否則 就是不完全信息 將上述兩個角度的劃分結合起來 共有四種不同類型的博弈 即 完全信息靜態博弈 完全信息動態博弈 不完全信息靜態博弈 不完全信息動態博弈 博弈的分類表 二 博弈論中的經典分析及啟示 1 囚徒困境 囚徒困境 博弈是1950年圖克 Tucker 提出的 它非常簡單 卻反映了博弈的根本特征 是闡釋眾多經濟社會問題的經典范式 警察抓住兩個罪犯 分別關押 并與罪犯講清 如果一人坦白 一人抗拒 坦白者立即釋放 抗拒者判刑8年 若兩人都坦白 按律從輕各判5年 罪犯知道 他們若抗拒 警察掌握的證據只能各判1年 最后的結果會怎樣 乙 抗拒 坦白 甲 抗拒 坦白 博弈 完全信息 分析方法 上策均衡 嚴格下策反復消去法 畫線法 箭頭法等 乙 抗拒 坦白 甲 抗拒 坦白 此博弈的 均衡 為 坦白 坦白 該均衡就是大名鼎鼎的 納什均衡 納什均衡 在對方策略確定的情況下 每個參與者的策略都是最好的 沒有人愿意先改變自己的策略 假如博弈中的所有參與人事先達成一項協議 這個協議是否可以自動實施 若當事人都會自覺遵守這個協議 這個協議就構成納什均衡 沒有人有積極性偏離協議 換句話說 如果一個協議不構成納什均衡 它就不可能自動實施 因為至少有一個參與人會違背這個協議 結論 一種制度安排要生效 必須是納什均衡 不滿足納什均衡要求的制度沒有意義 類似囚徒困境應試教育公共產品供給不足 修路 公寓樓道的路燈 卡特爾的內在不穩定性產量限制 價格限制 商業誠信 此博弈的納什均衡為 3 3 乙誠信欺詐 誠信甲欺詐 交通規則 乙守規違規 守規甲違規 啟示 個人理性與集體理性的矛盾 冤假錯案是怎樣產生的 個人的最優決策不一定帶來集體的最優結果 集體的最優結果未必來源于個人的最優決策 領導的政績 改變博弈結果的根本方法是改變博弈的支付矩陣 囚徒困境的解脫 有這樣一個博弈 此時 兩者的納什均衡為 不合作 不合作 獎勵 假如對采取 合作 策略的博弈方獎勵3 獎勵矩陣為 最終結果為上述兩個矩陣相加 博弈的納什均衡為 合作 合作 解開了囚徒困境 懲罰 思拉恩 埃格特森在 新制度經濟學 中舉的例子 非洲努埃爾人部落間有兩個大家庭X Y 每家擁有同樣的武力潛能和侵犯傾向 每家擁有相當于10頭牛的財產 每家都擁有兩種策略 侵犯對方 不侵犯對方 博弈表述為 納什均衡為 侵犯 侵犯 雙方的收益為 4 4 通過聯姻 努埃爾人引入了一個懲罰矩陣 由于親戚關系 侵犯者遭受成本 包括心理成本 的損失 此時 X Y就由非合作均衡變為合作均衡 上述方陣變為 2 賭勝博弈 賭勝博弈屬于 零和博弈 的范疇 是具有某種對稱性的零和博弈 猜硬幣博弈 正面反面 拋硬幣方 正面反面 猜硬幣方 石頭 剪子 布博弈 石頭剪子布 博弈方1 石頭剪子布 博弈方2 齊威王 田忌賽馬 齊威王 上中下 田忌 上下中 中上下 中下上 下上中 下中上 上中下 下中上 上下中 中上下 中下上 下上中 以上三個博弈是零和博弈 沒有純策略納什均衡 純策略 單一的確定的策略 石頭剪子布 博弈方1 石頭剪子布 博弈方2 取勝原則 保密 不泄漏自己的策略 避免自己的決策有傾向性 讓對方琢磨不透 混合策略 以一定的概率分布在備選策略中隨機選取 啟示 當博弈是零和博弈時 只有混合策略均衡 什么樣的決策是科學決策 隨機決策 當面對零和博弈時 科學嗎 3 警衛與小偷 案例1兩地巡邏 警衛負責A B兩地保安 A地財產2萬元 B地1萬元 警衛一次只能在一個地方巡邏 小偷一次也只能去一個地方 警衛在某地巡邏 小偷也去了該地 便不會失竊 小偷去了警衛沒去的地方 則偷盜成功 警衛怎么巡邏效果最好 巡邏A地 巡邏B地 盜竊A地 盜竊B地 警衛 小偷 這個博弈是零和博弈 沒有純策略納什均衡點 但有混合策略均衡點 當警衛去A地巡邏時 小偷有的機會去A地 的機會去B地 此時 A的得益為 3 2 萬元 當警衛去B地時 同樣小偷有的機會去A地 的機會去B地 此時 B的得益為 1 3 萬元 警衛總的得益為 萬元 同理 我們可得小偷的總的得益為萬元 警衛的最優策略是 擲骰子決定去A地還是B地巡邏 擲l 4點去A地 擲5 6兩點去B地 這樣警衛有2 3的機會去A地 1 3的機會去B地 警衛的期望得益是 7 3大于2 小偷的最優策略是 同樣擲骰子決定去A地還是B地偷盜 擲到1 4點去B地 擲5 6兩點去A地 即小偷有l 3的機會去A地 2 3的機會去B地 期望收益為2 3萬元 啟示 當博弈是零和博弈時 即一方所得是另外一方的所失時 只有混合策略均衡 博弈方的策略應當是隨機的 不能讓對方知道自己的策略 哪怕是 傾向性 的策略 如果對方知道你出其中一個策略的 可能性 大 你失敗的可能性就大 案例2小偷和守衛 此案例為塞爾頓 1994年諾貝爾經濟學獎得主 1996年3月在上海講演中舉的例子 有一倉庫 小偷行竊時守衛睡覺 可獲價值V的財物 小偷行竊時守衛沒睡覺 則被抓 被抓后要坐牢 效用為 P 守衛睡覺而未遭偷竊有S的效用 因睡覺被竊遭解雇 得益為 D 小偷不偷 守衛無得也無失 守衛不睡 出一份力掙一份錢 也無得失 小偷 不偷 偷 守衛 睡 不睡 分析 這個博弈不存在純策略納什均衡 小偷的策略 D Pt Pt S 0 守衛得益 睡 小偷偷的概率 1 小偷有 偷 與 不偷 兩種策略 圖中橫軸表示小偷選擇 偷 的概率Pt 不偷 的概率等于1 Pt 守衛的策略 P Pg Pg S 0 小偷得益 偷 守衛睡的概率 1 V 守衛有 睡 與 不睡 的策略 其概率分布也可用圖表示 激勵悖論 政策目標和政策結果的意外關系 P Pg Pg S 0 小偷得益 偷 守衛睡的概率 1 V Pg P 加重對小偷的懲罰 相當于 P向下移動到 P 短期內小偷會停止 偷 竊 但長期中 小偷減少 偷 竊會使守衛更多地選擇 睡 覺 加重對小偷懲罰的主要作用是守衛可以更多地偷懶 D Pt Pt S 0 守衛得益 睡 小偷偷的概率 1 Pt D 加重對失職守衛的處罰 意味著D增大到D 短期效果是守衛更加盡職 長期中的真正作用 恰恰是會降低盜竊發生的概率 啟示 怎樣避免激勵悖論 4 情侶博弈 性別戰 一對情侶 男的愛看足球 女的愛看芭蕾 都愿共度周末 其博弈表述為 有兩個納什均衡 足球 足球 芭蕾 芭蕾 究竟哪一個會發生 不知道 男 足球 芭蕾 足球 芭蕾 女 啟示 先動優勢 后動優勢 甲有先動優勢 先選B策略 穩得10 乙有后動優勢 最好讓A先選 樂得100 甲 A B C D 乙 斗雞博弈 兩只斗雞相遇 或進或退 雙方都前進 兩敗俱傷 一方前進 一方后退 前進者勝利 后退者丟面子 都后退 都丟面子 博弈表述為 雞甲 前進 后退 前進 后退 雞乙 此博弈有兩個納什均衡 一方前進 一方后退 結果無法預測 例子 20世紀60年代的古巴導彈危機夫妻矛盾 5 智豬博弈 豬圈里有一大一小兩頭豬 食槽在一頭 按鈕在另一頭 按一次有10個單位食品進入食槽 但按者要支付2個單位 若同時按 同時跑向食槽 各支付2個單位 大豬吃7個單位 小豬吃3個單位 大豬按 小豬坐吃 大豬吃6個單位 支付2個單位 小豬吃4個單位 小豬按 大豬坐吃 大豬吃9 小豬吃1 支付2個單位 都坐等 都沒吃 小豬 等 按 大豬 等 按 智豬博弈 扣除支付 此博弈的納什均衡 大豬按 小豬坐吃 4 4 啟示 多勞并不多得 要推動工作 就要想辦法找到 大豬 若你是 大豬 做了好不僅不要想得好 還要能受委屈 大德無名 6 海灘占位博弈 霍特林模型 有一海灘日光浴場 均勻地散布著許多日光浴者 有A與B兩個小販 以同樣的價格 質量向日光浴者提供同一品牌的礦泉水 在直線狀的海灘上他們會如何選擇自己的攤位點呢 海灘占位 設海灘的長度為l 圖中 0 1 線段表示海灘 號代表日光浴者 由于日光浴者總是到距自己最近的攤位購買礦泉水 理想的攤位點如下 A在1 4處 B在3 4處 這樣既方便了日光浴者 A B兩人又平分市場 可謂皆大歡喜 然而 理性的小販A會想 如果我將攤位往B那兒挪動至A 位置 那么從0至A 范圍內的人顯然是我的顧客 而A 與B之間的中點將從原來的1 2處移至1 2右邊的C處 從A 至C范圍內的人也將成為我的顧客 即從B那兒 奪 走了一部分生意 這當然是個好主意 B也是一個理性的商人 A的想法也是B想法 0 1 A B A C 雙方 斗智斗勇 博弈 的結果 A B的攤位都定在海灘中點 1 2處 相安無事地做買賣 西方大國為什么都是兩黨政治 為什么第三個政黨難成氣候 兩黨政治的穩定性和欺騙性 西方兩黨政治的博弈論解讀 保守黨 7 先來后到博弈 廠商A先占領了一個容量有限的市場 廠商B也想進入該市場 廠商B知道一旦自己進入 廠商A可能采取降價等競爭手段打擊他 如果廠商A采取打擊行動 廠商B肯定會虧損 那么 廠商B要不要進入這個市場 如果廠商B真的進入 廠商A是否真會打擊 先來后到博弈 完全信息 分析 假設A獨占市場時利潤為10 與B分享市場則各得5 如B進入市場A打擊 則B虧損2 A的利潤降為3 我們可以用擴展形表示該動態博弈 高成本 低成本 在位者的類型有高成本 低成本之分 高成本的最優策略是默許 低成本則是打擊 在位者知道自己的真實類型 進入者雖不知在位者的真實類型 但知道各種可能類型的概率分布 設 高成本的可能性為x 低成本的可能性則為 1 X 進入者不進入的期望利潤為0 進入的期望利潤為 4x 1 1 x 即 x 0 2時 進入的期望利潤大于不進入的期望利潤 先來后到博弈 不完全信息 啟示 怎樣的威脅和承諾是可信的 言語博弈 信號博弈 高等教育的功能 8 求愛博弈 有人向你求愛 接受還是拒絕 若求愛者品德優良 你接受 若求愛者品德惡劣 則拒絕 但你并不準確知道求愛者的品德 你接受與否就取決于你對求愛者品德類型的概率判斷 即你在多大程度上相信他是一個品德優良的人 求愛博弈 品德優良 求愛者 求愛 不求愛 接受 拒絕 你 求愛博弈 品德惡劣 求愛者 求愛 不求愛 接受 拒絕 你 假如你認為求愛者品德優良的概率為X 不接受求愛的期望效用為0 接受則為100X 100 1 X 解之 當X 1 2時 接受求愛 啟示 信息不完全帶來決策風險 諸葛亮和司馬懿相互知道類型 公共知識 空城計 9 財產分配博弈 你的權力有多大 權力指數 有A B C三人委員會 A有兩票 B C各一票 表決采取 多數 原則 一項議案獲得3票及3票以上則通過 他們各自的權力有多大 權力是什么 決策者的權力體現在他在形成 獲勝聯盟 中是否 關鍵加入者 若決策者作為 關鍵加入者 出現 權力就大 反之則小 決策者作為 關鍵加入者 的個數即為 權力指數 三人委員會的獲勝聯盟有 AB AC ABC A在AB AC和ABC中均是關鍵加入者 A的權力指數是3 B是聯盟AB的關鍵加入者 B的權力指數為l C與B一樣只是聯盟AC的關鍵加入者 權力指數是1 A B C的權力指數之比是3 1 l 群體中可能的權力結構有多少 A B兩人的群體 邏輯上有16種決策結構 以下4種最常見或在現實中有意義 F A 2 F B 3 F A B 4 F AB 1 2 表示A B說了算 3 4 中A B權力相等 但在 3 中 一人同意就行 在 4 中 要A B兩人同時同意才行 夫婦間的決策無非是這4種方式 3個人組成的群體 邏輯上可能的權力結構有256種之多 但現實中的權力結構 不含 邏輯非 為13種 當人數超過3人或者人數很多時 可能的權力結構非常多 很難列舉 這就是為什么社會形態多種多樣 權爭總是無止無息 三人財產分配 案例 在三人之間分配100萬元財產 A有50 的票 B有40 的票 C有10 的票 規定超過50 的票認可某種方案時 才能分配整個財產 分析 任何單獨一個人的票都不超過50 從而不能單獨決定財產的分配要超過50 的票必須結成聯盟 若按票力分配 即A B C的財產分配為 50 40 10 C可以提這樣的方案 A 70 B 0 C 30 這個方案能被A C接受 盡管B被排除 但是A C的票構成大多數 60 B會提出新方案 A 80 B 20 C 0 此時A和B所得增加 C一無所有 A B的票力總和為 90 這樣的過程可以一直進行下去 夏普里 L S Shapley 1955年提出了一種計算權力的度量 根據他的理論求得的聯盟者的實力稱為Shapley值 夏普里值 夏普里值是 在各種可能的聯盟次序下 參與者對聯盟的邊際貢獻 聯盟的 關鍵加入者 之和除以各種可能的聯盟組合 如果說納什均衡是非合作博弈中的核心概念的話 夏普里值 shapleyvalue 是合作博弈 或聯盟博弈 中的最重要的概念 財產分配中各種排列下的關鍵加入者 由此得A B C的夏普里值分別為 A 4 6 B 1 6 C 1 6按照夏普里值 可將財產 100萬元 分給A 4 6 66 7 B 1 6 16 67 C 1 6 16 67 啟示 權力指數和票數不是一回事 票數指標是虛假的實力表示 在設計投票制度時 票數的分配要考慮權力指數 票數的分配要與權力指數和人數成大致相同的比例 S國的權力分配 S國有六個省 A B C D E F 實行代議民主政治 所有立法決策由這些省的代表投票實施 各省按人口比例分配的票數為 A 10 B 9 C 7 D 3 E 1 F 1 總票數為31 該國法律規定 一項決議擁有半數以上票 16票或16票以上 即獲得通過 總統選舉 兩位候選人 也一樣 獲半數以上票即當選 該國的體制

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論