




已閱讀5頁,還剩155頁未讀, 繼續免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
正 大 光 明 公 正 無 私 1 博 弈 論 the Theory of Games css 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 2 主要內容 一、博弈現象及基本概念 二、完全信息靜態博弈 三、完全信息動態博弈 四、不完全信息靜態博弈 五、不完全信息動態博弈 六、不完全信息專題 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 3 主要參考書 (1) 姚國慶: 博弈論 , 高等教育出版社 , 2007. (2) 羅云峰: 博弈論教程 , 清華大學出版社 、 北京交通大學出版社 。 (3) 張維迎: 博弈論與信息經濟學 , 上海三聯書店 , 上海人民出版社 , 2004。 (4) 施錫銓 , 博弈論 , 上海財經大學出版社 ,2002。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 4 (5) 張守一 , 現代經濟對策論 , 高等教育出版社 ,1998。 (6) 錢頌迪 , 運籌學 , 清華大學出版社 , 1996。 (7) 美 艾里克 .拉斯繆森: 博弈與信息 , 北京大學出版社 , 2003。 (8) 美 弗登博格: 博弈論 , 中國人民大學出版社 , 2002。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 5 第一講 博弈現象與基本概念 1博弈現象 2. 博弈概念 3. 博弈描述 4. 博弈練習 5. 關于博弈論 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 6 1博弈現象 田忌賽馬: 正確的策略可以反敗為勝 。 囚徒困境: 認罪 不認罪 認罪 ( -5,-5) ( 0,-10) 不認罪 ( -10,0) ( -1,-1) 甲 乙 理性的人是自私自利的; 理性選擇不是全局最優。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 7 經濟合作: 合作 欺騙 合作 ( 2,2) ( -2,4) 欺騙 ( 4,-2) ( 0,0) 甲 乙 誠信的價值; 一報還一報策略; 人類生存環境啟示。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 8 長街上的超市 ( 海灘占位模型 ) 0 1/2 3/4 1 1/4 A O 資源浪費還是理性的必然? 其它相似情形: 旅行社的熱門路線;黃金時間的電視節目;總統競選。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 9 狩獵與投資 狩獵: 兩個獵人圍住一頭鹿 , 各卡住兩個關口中的一個 , 齊心協力即可成功獲得并平分獵物 。 此時有一群兔子跑過 , 任何一人去抓兔子必可成功 ,但鹿會跑掉 。 他們會堅持獵鹿還是去抓兔子 ? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 10 共同投資: 雙方共同投資一個大項目 , 可期望有較大收益 。 此時如某方抽出資金去進行小項目投資 ,必可成功獲小利 , 但會使共同項目陷入困境 ,使對方蒙受損失 。 投資者會如何選擇 ? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 11 旅行者困境 兩個旅行者花瓶被摔壞 , 向航空公司索賠 。航空公司知道價格約為八九十元 , 但不知道確切價格 。 于是請兩位旅客在 100元以內自己寫下花瓶的價格 。 如兩人寫的一樣 , 就認為他們講真話 , 并按所寫數額賠償;如果兩人寫的不一樣 , 就認定低者講真話 , 并照此價格賠償 。 同時 , 對講真話的旅客獎勵 2元錢 , 對講假話的旅客罰款 2元 。 理性原則下 , 他們會寫多少價格呢 ? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 12 什么是博弈: 個人或團體間在依存和對抗、合作和沖突中的決策問題。 博弈論研究博弈過程中的理性行為。 2. 博弈概念 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 13 如何理解理性行為: 自身利益最大; 持續地有意圖的行動; 不對動機妄加猜測; 不考慮道德問題; 只研究合法問題; 盈利函數有多重標準。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 14 博弈三要素 局中人 (參與人) players: 決策主體 ; 自然人、團體或“虛擬局中人”; 有可供選擇的策略和明確定義的利益函數; 分為兩人和多人 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 15 策略(戰略) strategies: 采取行動的規則; 可以是一次行動也可以是一個行動序列; 可以是純策略也可以是混合策略; 分為有限和無限。 支付(盈利函數) payoff: 對應于某策略組合的局中人利益或損失; 確定的或是期望的; 分為零和和非零和。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 16 擴展術語: 信息: 信息集; 完全信息 ( complete) ; 完美信息 ( perfect) 。 共同知識: 雙方可能獲取的相同信息; 彼此都能算清楚 。 博弈結果: 均衡策略組合;均衡行動組合 。 均衡: 所有局中人最優策略的組合 。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 17 博弈的策略型 ( 標準型 、 正則型 ) 表述: 指定 n個局中人 , 以及他們各自的純策略空間 和這些局中人各自的支付 ( 盈利 ) 函數 我們將該博弈表示為: niS i ,2,1, niSSSu ni ,2,1),( 21 3. 博弈描述 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 18 例:寡頭競爭問題 ),(),(;0,0 21221121 qqqqqqG 策略型表述多適用于靜態博弈 。 另一種表述方式是擴展式表述 , 兩種表述形式幾乎是完全等價的 , 但是擴展式表述更適合于討論動態博弈 。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 19 房地產開發實例 雙方: A, B 策略: 開發投資 1億元;不開發 , 投資 0 售價: 高需: 1.4億元 (兩棟 ), 1.8億元 (一棟 ); 低需: 0.7億元 (兩棟 ), 1.1億元 (一棟 )。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 20 結果: 高需 , (開 , 不開 ), (0.8, 0) 高需 , (不開 , 開 ), (0, 0.8) 高需 , (開 , 開 ), (0.4, 0.4) 高需 , (不開 , 不開 ), (0, 0) 低需 , (開 , 不開 ), (0.1, 0) 低需 , (不開 , 開 ), (0, 0.1) 低需 , (開 , 開 ), (-0.3, -0.3) 低需 , (不開 , 不開 ), (0, 0) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 21 策略型表述: ( 兩人有限博弈;矩陣形式) 開發 不開發 開發 ( 0.4,0.4) ( 0.8,0) 不開發 ( 0,0.8) ( 0,0) A B 高需求情況 低需求情況? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 22 房地產博弈分析 假設: 同時決策;市場需求雙方已知 若市場需求大,雙方開發,各得 0.4萬元。 若市場需求小,依賴于對方行動。 若市場不確定,依賴對市場的判斷及對方行動。 例: P 0.5,最壞情況期望盈利 500萬元,開發。 P 0.3,對方開發概率 31/40時,開發;否則,不開發。(?) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 23 關鍵問題: 對自然狀態的概率估計; 不同時間決策(決策順序); 對對方先驗信息的估計(即估計對方對信息的掌握程度)。 現實困難: 對市場了解程度不同; 對對方了解程度不同; 如何向對方暗示自己的行動。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 24 4.博弈練習 游戲一: 心靈感應 兩個人一組 , 獨立寫出 1至 10之間的任意 5個數 。 如果不重復則得獎;否則受罰 。 獲勝的秘訣是什么 ? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 25 游戲二: 海盜逃生 有 5個海盜,即將被處死刑。法官愿意給他們一個機會。從 100個黃豆中隨意抓取,最多可以全抓,最少可以不抓,可以和別人抓的一樣多。抓得最多的和最少的要被處死。 如果你第一個抓,你抓幾個? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 26 游戲三: 100元怎么分? 你看見兩個小孩在玩耍,出于好奇,你給他們 100元,讓他們猜拳。猜贏者決定怎么分這 100元,而輸者如果同意贏者的分配比例,那么他們將各有所得,如果不同意,那么這 100元,你將收回。 請你替贏者考慮一下,怎樣分配,贏者既得到最大利益,又能讓輸者也同意呢? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 27 游戲四: 一元錢競拍 給一元錢鈔票開出你的價錢,使自己獲益最大或損失最少;每次叫價以 5分錢為單位;開價最高者得到這一元錢;出價最高和次高者一并按所開的價錢支付。 斜坡上的均衡; “ 騎虎難下 ” 的博弈; “ 協和謬誤 ” 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 28 游戲五: 強盜分贓 有五個強盜搶得 100枚金幣,在如何分贓問題上爭吵不休。于是他們決定: ( 1)抽簽決定自己的號碼( 1, 2, 3, 4,5); ( 2)由 1號提出分配方案,然后 5人表決,如果方案超過半數同意就通過,否則他將被仍進大海喂鯊魚; 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 29 ( 3) 1號死后,由 2號提方案, 4人表決,當且僅當超過半數同意方案通過,否則 2號同樣被仍進大; ( 4)依次類推,直到找到一個每個人都接受的方案(當然,如果只剩下 5號,他當然接受一個人獨吞的結果)。 如果你是第一個強盜,你該如何提出分配方案才能使自己的收益最大化呢? 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 30 5. 關于博弈論 博弈分類 : 合作、非合作: 是否存在一個具有約束力的協議( binding agreement) 前者強調團體理性(效率、公正、公平) 后者強調個人理性(最優決策,不保證效率) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 31 完全信息與不完全信息: 每一個局中人對自己及其它局中人是否有完全的了解; 包括局中人特征、策略空間、盈利函數等知識。 動態與靜態: 行動的先后順序 ; 是否同時(或不同時但對方不知)。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 32 發展歷史: 1944 Von Neumann & Morgenstern “The theory of games and economic behavior” 1950 Nash & 1953 Shapley “討價還價 ” 模型 1950、 1951 Nash 非合作博弈 1950 Tucker Prisoners dilemma 1953 Gillies & Shapley 合作博弈 1965 Selton 動態分析 ; “精煉納什均衡 ” 1967、 1968 Harsanyi “不完全信息 ” 1994 Nash 、 Selton、 Harsanyi 諾貝爾經濟學獎 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 33 納什的傳奇人生 1928年出生于一個電子工程師家庭。 17歲進入今卡耐基梅隆大學,專攻數學。 20歲時進入普林斯頓大學攻讀博士學位。 1949年, 21歲的納什寫下論文 多人博弈的均衡點 。 1950年以論文 非合作型博弈 獲得數學博士學位。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 34 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 35 畢業后先后在蘭德研究所、普林斯頓大學、 MIT工作。 1957年他與 MIT學生愛莉西婭結婚。 在而立之年患上了妄想型精神分裂癥,九十年代逐漸恢復了正常。 1994年納什博士獲諾貝爾經濟學獎。 2002年來北京參加 “ 國際數學家大會 ” 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 36 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 37 電影 “美麗心靈” 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 38 靜態 動態 完全 信息 完全信息靜態博弈 納什均衡 納什( 1950, 1951) 完全信息動態博弈 子博弈精煉納什均衡 澤爾滕( 1965) 不完全信息 不完全信息靜態博弈 貝葉斯納什均衡 海薩尼( 1967 1968) 不完全信息動態博弈 精煉貝葉斯納什均衡 澤爾滕( 1975) 博弈論體系 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 39 第二講 完全信息靜態博弈 1.矩陣博弈 2.累次嚴優均衡 3.納什均衡 4.混合策略納什均衡 5.納什均衡的存在性與多重性 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 40 1. 矩陣博弈 什么是矩陣博弈: 兩人零和有限策略博弈; 可用矩陣形式表述。 矩陣元素為局中人 A的贏得,亦即 B的損失。 例: 用矩陣形式表述田忌賽馬博弈(?) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 41 有鞍點情形 : 存在最優純策略 例: 表中數據為 I的贏得 II I 1 2 3 min 1 6 1 8 8 2 3 2 4 2 3 9 1 10 10 4 3 0 6 3 max 9 2 6 2 博弈哲學 : 從最壞處考慮,爭取最好結果 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 42 無鞍點情形: 最優混合策略 例: II I 1 2 min 1 11 5 5 2 7 9 7 max 11 9 ? )1,(),();1,(),( 2121 yyxx 設最優混合策 略: 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 43 對局中人 I: 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 44 I的最優混合策略為 同理 , II的最優混合策略為 G 8 同理可求局中人 II的最優混合策略 ( ? ) )21,21(),( 21 )43,41(),( 21 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 45 2.累次嚴優均衡 占優策略均衡 (嚴格 )劣策略: 無論對方如何選擇都更差 。 占優策略: 無論對方如何選擇存在唯一最優 。 占優策略均衡: 所有局中人占優策略的組合 。 特點: 只要求每個人理性 , 并不要求知道其它人是不是理性 。 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 46 例:裁軍問題 以巴 武裝 裁軍 武裝 ( 3000, 3000) ( 10000 , ) 裁軍 ( , 10000) ( 0,0) 例: 囚徒困境中的(認罪,認罪) 例: 房地產投資市場大情況下(開發,開發) 博弈論 2009 正大光明 公正無私 幫助別人 成就自己 47 重復剔除的占優均衡 ( iterated elimination) 也稱為累次嚴優均
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 碎石供銷合同協議
- 異地出差合同協議
- 暫扣車輛合同協議
- 現澆裝修合同協議
- 溫棚承包合同協議
- 消防用工合同協議
- 2025注冊監理工程師《合同管理》深度練習
- 銅廠加工合同協議
- 魚坑租賃合同協議
- 豬場管理合同協議
- 再生資源垃圾中轉處理方案
- 2024年高中歷史 第14課 當代中國的外交說課稿 部編版選擇性必修1
- 應用化工技術專業實習總結范文
- 幼兒園課堂教學目標培訓
- 【MOOC】人工智能:模型與算法-浙江大學 中國大學慕課MOOC答案
- 穴位注射法中醫護理課件-課件
- 反恐防暴器械與戰術應用講解
- 2024年防范電信網絡詐騙知識題庫及答案(共100題)
- 第47 屆世界技能大賽商品展示技術項目技術文件
- (中級技能操作考核)消防設施操作員考試題庫(全真題版)
- 南京工業大學《民法》2022-2023學年第一學期期末試卷
評論
0/150
提交評論