




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1第六章
決策分析方法第2頁
決策、決策分析的概念和基本特征決策環境和決策過程風險性決策分析第3頁第4頁亞蒙·哈默(ArmandHamer)(1898~1990)是一個很有志氣的偉人。1919年在哥倫比亞大學獲文學士學位時,接管了父親的制藥廠。1921年獲得醫學博士學位時,已擁有200萬美元的資產,成為一名學生企業家。隨后,他去了蘇聯,為兩國的貿易和礦物開發作了大量的工作;同時還在蘇聯建立了鉛筆生產廠,把美國成功的管理經驗傳授給這家工廠。亞蒙·哈默(ArmandHamer)第5頁1931年返回美國,創建了現代化酒桶廠和種牛牧場。1956年購買了西方石油公司,開創了西方世界的又一個石油王國。80年代,他大力推動西方石油公司的多樣化經營,使西方石油公司成為肉食品加工的巨頭和美國石化產品制造商中的佼佼者。哈默也由此被人們稱為經營奇才。哈默在蘇聯期間與列寧建立了友誼;與美國幾屆總統、外國首腦、王公貴族、將軍及教皇等都有過交往;他還曾多次訪問過中國,與中國進行生意上的合作,為中國少年兒童基金會捐款。他耗費巨資和精力收藏了大量的藝術珍品,并又把它們作為人類共同的財富,送到世界各地展出。因此,人們又稱他為政治外交型企業家。一、基本概念決策是管理的重要職能,它是決策者對系統方案所做決定的過程和結果,是決策者的行為和職責。因此,決策是一種過程:情報活動、設計活動、決擇活動、實施活動等。按照H.A.西蒙(H.A.Simon)的觀點,“管理就是決策”。決策分析的一般過程也即管理系統分析的過程。第6頁第一節管理決策概述二、決策類型的劃分決策問題的基本模型為:
Wij=f(Ai,θj)
i=1,2,3…m,j=1,2,…n式中:
Ai——決策者的第i種方案,屬于決策變量,是決策者的可控因素;
θj——決策者和決策對象(決策問題)所處的第j種環境條件或第j種自然狀態,屬于狀態變量,是決策者不可控制的因素;
Wij——決策者在第j種狀態下選擇第i種方案的結果,是決策問題的價值函數。一般叫益損值、效用值。第7頁
根據決策問題的基本模式,可將決策問題劃分為四種類型。一般按照θj的不同所得到的四種類型是最基本和最常見的。第8頁決策問題的要素θ完全把握完全不把握對抗型決策(對策)
決策分析是為解決風險型和不確定型問題提供一套推理方法和邏輯步驟。決策問題的類型———風險型決策確定型決策不完全把握———不確定決策對自然不確定———對人的不確定——————第9頁三、幾類基本決策問題的分析1.確定型決策(對未來情況可以獲得精確、可靠的數據)
條件:存在決策者希望達到的明確目標(收益大或損失小等);
存在確定的自然狀態(如產品包銷等);存在著可供選擇的兩個以上的行動方案;不同行動方案在確定狀態下的益損值可以計算出來。
舉例:企業開發某個產品,在計劃經濟體制下,產品包銷、原材料統一調撥等等。第10頁2.風險型決策(未來有幾種可能的狀態和相應后果,其出現的概率可以預測)
條件:同確定型;
存在兩個以上不以決策者主觀意志為轉移的自然狀態,但決策者或分析人員根據過去的經驗和科學理論等可預先估算出自然狀態的概率值P(θj);
同確定型同確定型。
方法:期望值、決策樹法。舉例:如引入商品機制后,企業開發某種新產品就要冒一定的風險,銷售狀態、原材料供應情況都沒有把握,但是根據市場調查、原材料供應戶的信息,還能對銷售狀態的好壞和原材料供應充分或短缺的概率做出判斷等。第11頁3.不確定型決策(未來可出現的狀態和后果難以估計)
條件:同確定型
自然狀態不確定,且其出現的概率不可知;同確定型同確定型。
方法:樂觀法(最大最大原則)、悲觀法(最小最大原則)、等概率法(Laplace準則;也是一種特殊的風險型決策)、后悔值法(Savage準則或后悔值最大最小原則)。
對于不確定型決策分析問題,若采用不同求解方法,則所得的結果也會有所不同,因為這些決策方法是各自從不同的決策準則出發來選擇最優方案的。而具體采用何種方法,又視決策者的態度或效用觀而定,在理論上還不能證明哪種方法是最為合適的。第二節風險型分析決策第12頁一、風險型決策分析的基本方法1.期望值法。最大期望收益準則法(ExpectedMonetaryValue,MV或E)。決策目標考慮的是收益值,計算各方案的期望收益值,從中選擇期望收益最大的。最小機會損失準則(ExpectedOpportunityLoss,EOL)。決策目標考慮的是損失值,計算各方案的期望損失值,從中選取期望損失最小的。期望公式:E(X)=∑PiXi
式中:Xi——隨機變量X的第i個取值,i=1,2,。。。
Pi——X=Xi時的概率。例1:某IT企業要決定今后5年內生產某電子產品的生產批量,以便盡快做好生產前的各項準備工作。而生產批量的大小主要根據市場銷路的好壞而定。根據以往銷售統計資料及市場調查和預測可知未來市場出現銷路好、銷路一般和銷路差3種狀態的可能性(概率)分別為0.3、0.5和0.2,若該產品按大、中、小3種不同生產批量投產,則今后5年內在不同銷售狀態下益損值可以估算出來并列入決策表?,F要求通過分析以確定最佳批量,使企業在生產該電子產品上獲得的期望收益最大。第13頁
自然狀態銷路好θ1
銷路一般θ2
銷路差θ3益損值概率方案0.3 0.50.2大批生產A1 20 14-2 中批生產A2 121712 小批生產A3 8 1010
該例是一個面臨3種自然狀態(產品銷路)和3種行動方案(生產批量)的風險型決策分析問題。應用期望值法分析求解如下:根據表中所列的各種信息,利用計算公式可以計算出每一方案的益損值為:
E(X1)=0.3*20+0.5*14+0.2*(-2)=12.6E(X2)=0.3*12+0.5*17+0.2*12=14.5E(X3)=0.3*8+0.5*10+0.2*10=9.4
通過計算并比較后可知,E(X2)=14.5萬元為最大,因此選擇行動方案A2為最優方案,也就是采用中批生產的方案為最佳。第14頁
從上面的例子可以看出,一般的決策問題都包含三個最基本的因素:自然狀態
“產品銷路好”、“產品銷路一般”和“產品銷路差”都是自然狀態,是不以決策者的意志為轉移的,是決策者無法控制的因素。策略策略即決策者可以采取的行動方案。采取哪一個策略,完全由決策者決定。益損值益損值即不同策略在不同自然狀態下的收益值或損失值。第15頁
描述多級決策(序列決策)的工具——決策節點,從它引出的分枝為方案枝,分枝數量與方案數量相同,分枝上要注明方案名稱。
——狀態節點,從它引出的分枝為狀態分枝或概率分枝,分枝數量與可能出現的自然狀態數量相同,分枝上要注明狀態出現的概率。△——結果節點,不同方案在各種狀態下所取得的結果(益損值),標注在結果節點的右端。第16頁2.決策樹法所謂決策樹法就是利用樹形圖模型來描述決策分析問題,并直接在決策樹圖上進行決策分析。其決策目標(準則)可以是益損期望值或經過變換的其它指標值。
單級決策樹的畫法和最優期望值準則的決策步驟:1)首先畫出該問題的決策樹,并把原始數據標在上面。決策樹是由左至右、由粗至細逐步畫出的。2)計算益損期望值。畫出決策樹后,再由右向左計算各策略節點的期望效益值,并將計算結果標注在相應的狀態節點上方。3)最后根據最大期望效益值準則,對決策節點上的各個方案進行比較,選擇其中最大值寫在決策節點的上方,與最大值相對應的方案是A2,即A2即為最優方案。然后,在其余的方案分支上劃上“//”記號,表示這些方案已被舍去。經過決策分析計算并選擇方案A2為最優方案。第17頁解:第18頁12.614.59.4銷路好(0.3)銷路一般(0.5)銷路差(0.2)△20△14△-2銷路好(0.3)銷路一般(0.5)銷路差(0.2)△12△17△12銷路好(0.3)銷路一般(0.5)銷路差(0.2)△8△10△1014.53.多級決策樹第19頁
只需作一次決策就能選出最優方案的決策分析問題叫做單級決策。反之,需要經過兩次或兩次以上決策才能選出最優方案的決策問題叫做多級決策問題。應用決策樹法進行多級決策分析叫做多級決策樹。對于較復雜的問題可在多級決策樹上進行。多級決策樹的畫法類似單級決策樹。但要分級計算收益期望值.多級決策樹把握關鍵在于兩點:一是正確區分方案枝和概率枝,這樣才能正確畫出決策樹,這是下一步正確計算的關鍵,區分的方法是方案的主體一般是決策人,要做出判斷,概率枝的主體一般是客觀規律或市場情況,不需要做出判斷,只需考慮其影響的合力。二是計算時一定要配合現金流量圖還能做到準確、無疑漏。例2:有一鉆探隊做石油鉆探,可以先做地震試驗,費用為0.3萬元/次,然后決定鉆井與否,鉆井費用為1萬元,出油收入為4萬元。根據歷史資料,試驗結果好的概率為0.6,不好的概率為0.4;結果好鉆井出油的概率為0.85,不出油的概率為0.15;結果不好鉆井出油的概率為0.1,不出油的概率為0.9。也可不做試驗而直接憑經驗決定是否鉆井,這時出油的概率為0.55,不出油的概率為0.45,試用決策樹進行決策。第20頁第21頁試驗-0.3不試驗好0.6不好0.4鉆井-1不0.850.154004004003.42.40.102.21.21.441.20.90.550.45結論:不試驗直接鉆井,期望收入為1.2萬元。解:0.16例3:某企業對產品生產工藝進行改進,提出兩個方案:一是從國外引進生產線,另一是自行設計生產線。引進投資較大,但產品質量好成本低,成功率為80%;自行設計投資相對較小,產品質量也有一定保證成本也較低,只是成功率低些為60%。進一步考慮到無論引進還是自行設計,生產能力都能得到提高。因此企業又制訂了兩個生產方案:一是產量與過去保持相同,一是產量增大。為此又需要決策,最后若引進與自行設計不成功,則企業只能采用原工藝生產,產量保持不變。企業打算該產品生產五年,根據市場預測,五年內產品價格下跌的概率為0.1,不變的概率為0.5,上漲的概率為0.4,通過估算各種方案在不同價格狀態下的益損值如表所示,試用決策樹進行決策。第22頁狀態價跌價平價漲概率0.10.50.4按原工藝生產的益損值-1000125引進(成功0.8)產量不變-25080200產量增加-400100300自行設計(成功0.6)產量不變-2500250產量增加-350-250650第23頁各種方案在不同價格狀態下的益損值表解:第24頁13076112951307510040跌價(0.1)原價(0.5)漲價(0.4)△-100△0△125跌價(0.1)原價(0.5)漲價(0.4)△-250△80△200跌價(0.1)原價(0.5)漲價(0.4)△-400△100△300跌價(0.1)原價(0.5)漲價(0.4)△-250△0△125跌價(0.1)原價(0.5)漲價(0.4)△-350△-250△650100B1
B2
B2
B1
成功0.8失敗0.2失敗0.4成功0.6A1
A2
112例4:某企業的設備和技術已經落后,需要進行更新改造。有人提出,目前銷售趨勢上升,應在對設備更新改造的同時,擴大經營規模,增加銷量。但也有人認為,市場的發展趨勢目前很難斷定,不如先更新改造設備,三年后根據市場變化的形勢再考慮擴大經營規模的問題。這樣,該企業面臨著兩個可決策方案。第25頁決策分析的資料:
(1)更新改造設備,需投資200萬元,三年后擴大經營規模另需投資200萬元。
(2)現在更新改造設備同時擴大經營規模,總投資額是300萬元。
(3)現在只更新改造設備,在銷售情況良好時,每年可獲利60萬元,在銷路不好時,每年可獲利40萬元。
(4)如果現在更新改造設備與擴大經營規模同時進行,若銷售情況良好,投產前三年可獲利100萬元,后五年每年可獲利120萬元,銷路不好,每年可獲利30萬元。
(5)每種自然狀態的預測概率如下表:
第26頁銷售情況概率好0.7不好0.3第27頁
概率銷售情況前三年好不好好0.850.1不好0.150.9前三年后五年
解:這是一個多級決策問題。企業有兩個決策方案可供選擇。一是只更新設備不擴大規模,三年后再考慮擴大規模還是不擴大規模;二是同時進行更新與擴大規模。根據條件繪制決策樹,結點1:EMV=0.7{532.5+(3×100)}+0.3{195+(3×30)}=668.25(萬元)
結點2:EMV=0.7{332.5+(3×60)}+0.3{210+(3×40)}=457.75(萬元)
扣除投資后,現在只更新不擴大規模方案的凈收益,小于同時進行更新和擴大規模方案的凈收益。因此,決策應選更新與擴大規模并舉的方案。第28頁靈敏度分析
某工程準備施工,需要決策下個月是否開工,開工后天氣好可按期完工,獲利5萬元,天氣不好損失1萬元;如不開工不論天氣好壞,均需支付窩工費0.1萬元,根據氣象統計資料,下個月天氣好的概率P=0.2,試進行決策。如下個月天氣好的概率P=0.1,試進行決策。第29頁第30頁轉折概率
方案可能出現的狀態的概率會導致最優方案的變化,使最優方案發生變化的概率稱之為轉折概率。在上例中:設轉折概率為P。
則有:
P×5+(1-P)×(-1)=P×(-0.1)+(1-P)×(-0.1)
得P=0.15,即轉折概率為P=0.15,當P大于0.15時,開工方案比較合理;當P小于0.15時,不開工比較好。第31頁二、不確定型問題的決策
決策者根據自己的主觀傾向進行決策,根據決策者主觀態度不同有以下五種常用的決策準則和方法:悲觀主義準則樂觀主義準則樂觀系數準則最小機會損失準則等可能性準則S1
S2
S3
S4
A1
20012545-25A2
300200-50-175A3
425210-75-200第32頁悲觀主義準則
從各方案的最小益損值中選擇最大的,也稱“小中取大”法,是一種萬無一失的保守型決策者的選擇準則。例如:第33頁樂觀主義準則
決策者對客觀情況總是抱樂觀態度,從各方案最大益損值中選擇最大的,也稱“大中取大”。是一種偏于冒進的決策準則。例如:S1
S2
S3
S4
A1
20012545-25A2
300200-50-175A3
425210-75-200樂觀系數準則
一種折衷準則,決策者對客觀條件的估計既不樂觀也不悲觀,主張一種平衡,用一個樂觀系數α(0≤α≤1),計算各方案的折衷益損值,從中選取最大的。例如(=αmax[aij]+(1?α)min[aij])第34頁S1
S2
S3
S4α=0.7A1
20012545-25132.5A2
300200-50-175157.5A3
425210-75-200237.5S1S2
S3
S4
A1
20012545-25A2
300200-50-175A3
425210-75-200第35頁后悔值法(最小機會損失準則)
決策者一般易于接受某狀態下收益最大的方案,但由于無法預知那一狀態一定出現,當決策者沒有采納收益最大的方案,就會感到后悔,最大收益值與其他收益值之差作為后悔值或機會損失值,然后按悲觀主義準則決策,選后悔值最小的方案。例如:2251250851000951200150175150等可能性準則
決策者不能肯定那種狀態會出現,采取一視同仁的態度,認為出現的可能性相等,有n個狀態,其出現的概率均為1/n,計算各方案的期望最大收益值,從中選取最大的。例如(結果=(S1+S2+S3+S4)/4)第36頁S1
S2
S3
S4ERA1
20012545-2586.25A2
300200-50-17568.75A3
425210-75-20090第37頁二、信息的價值
決策所需的信息一般可以分為兩類。一類是完全信息,即據此可以得到完全肯定的自然狀態信息,這樣就有助于正確的決策,從而使決策結果能獲得較大的收益,但為獲得完全信息的代價也相當可觀,而且在現實中和在多數情況下,要獲得這種完全信息也較為困難或根本不可能做到;另一類是抽樣信息,這是一類不完全可靠的信息。通過抽樣所獲得的信息,用統計方法來推斷自然狀態出現的概率,據此來選擇行動方案。抽樣信息雖不十分可靠,但為獲得此類信息的代價也較小,且在實際中和在多數情況下,也只可能獲得這類信息以供決策之需。信息價值分析在靈敏度分析后,有些關鍵狀態的概率有時靈敏度很高,需要進一步收集信息,提高先驗概率的精度,來更準確可靠地評定這些參數。進一步收集信息需要進行“調查研究”,通過收集樣本、統計分析取得更可靠的信息。“調查研究”所得到的咨詢信息一般都有誤差,調研結果要考慮其失誤的可能性“調查研究”需要費用,不管咨詢結果是否有用,都得付費,因此在調研前要考慮所得到的信息用途多大,即信息的價值分析。為了衡量調研人員提供信息的用途大小,一般根據歷史資料,用該人員(單位)過去提供正確或不正確信息的概率來表示。第38頁第39頁例5某化工廠生產一種化工產品,根據統計資料的分析表明,該產品的次品率可以分成五個等級(即五種狀態),每個等級(狀態)的概率如下表所示。純度狀態(次品率)S1(0.02)S2(0.05)S3(0.10)S4(0.15)S5(0.20)概率0.200.200.100.200.30完全信息價值純度狀態(次品率)S1(0.02)S2(0.05)S3(0.10)S4(0.15)S5(0.20)概率0.200.200.100.200.30
純度狀態益損值概率
方案S1S2S3S4S50.200.200.100.200.30提純(A1)10001000100010001000不提純(A2)440032002000800-400第40頁第41頁4400176019701000S1(0.20)S2(0.20)檢驗不檢驗2220S1S2S3S4S5A1A2△1000△4400A2△1000△3200A13200A1A2△1000△2000A1A2△1000△-400A2△1000A1△800200010001000S3(0.20)S4(0.20)S5(0.20)△1000△1000△1000△1000△10001760S1(0.20)S2(0.20)S3(0.20)S4(0.20)S5(0.20)△4400△3200△3000△800△-400A1A2-50完全信息的價值=2220元-1760元=460元例6某家電公司由于原有產品結構陳舊落后,產品質量差,銷路不廣,該公司擬對產品結構進行改革,制定了兩種設計方案:(1)全新設計方案(A1),即產品結構全部重新設計;(2)改型設計方案(A2),即在原有產品結構的基礎上加以改進。公司根據以往的統計資料,對未來5年的市場狀況和損益值估計如下表。自然狀態方案銷路好銷路差0.350.65全新設計A145-22.5改型設計A2184.5第43頁公司進一步通過市場調查和預測獲取抽樣信息,重新評估統計資料預測結果的可靠性,得出以下結論:銷路好的信息,其可靠度只有80%;銷路差的信息,其可靠度只有70%。請利用貝葉斯概率和多級決策樹進行分析,判斷對市場信息進行重新調查和預測的方案是否可取,并計算抽樣信息的價值。附:先驗概率、后驗概率與條件概率先驗概率先驗概率指根據歷史資料或主觀判斷所確定的,沒有經過試驗證實的概率。其中,利用過去歷史資料計算得到的先驗概率,稱為客觀先驗概率;當歷史資料無從取得或資料不完全時,憑人們的主觀經驗來判斷而得到的先驗概率,稱為主觀先驗概率。后驗概率后驗概率是指通過調查或其它方式獲取新的附加信息,利用條件概率公式對先驗概率進行修正,而后得到的概率。(1)條件概率定義式:(2)全概率公式:(3)貝葉斯公式:條件概率公式46回到例6,設:G-產品銷路好;B-產品銷路差;fg-預測結果為產品銷路好;fb-預測結果為產品銷路差。已知:(1)根據企業以往統計資料得出的概率:P(G)=0.35P(B)=0.65(先驗概率)(2)通過重新預測修正后的概率:P(fg/G)=0.8可得出P(fb/G)=1-0.8=0.2P(fb/B)=0.7可得出P(fg/B)=1-0.7=0.3根據全概率公式計算:預測結果為銷路好的全概率為預測結果為銷路差的全概率為以下根據已知的先驗概率利用條件概率公式計算后驗概率48根據貝葉斯公式計算:預測結果好的條件下,產品銷路好的概率預測結果好的條件下,產品銷路差的概率預測結果差的條件下,產品銷路好的概率預測結果差的條件下,產品銷路差的概率例6:第49頁11.50510.50517.26P(G/fg)=不預測預測9.225△45萬元△-22.5萬元P(fg)=-0.5抽樣信息的價值=11.505萬元-9.225萬元=2.28萬元P(B/fg)=P(fb)=12.56P(G/fg)=△18萬元△4.5萬元P(B/fg)=-13.5P(G/fb)=△45萬元△-22.5萬元P(B/fb)=6.3P(G/fb)=△18萬元△4.5萬元P(B/fb)=1.125P(G)=0.35△45萬元△-22.5萬元P(B)=0.659.225P(G)=0.35△18萬元△4.5萬元P(B)=0.65全新設計改型設計全新設計改型設計全新設計改型設計0.5890.5890.4110.4110.1330.1330.8670.86717.260.4750.5256.3效用理論
當決策問題反復多次出現時,期望報酬值方法用來指導決策效果較好;只進行一次某種決策時,再用最大期望值決策準則,就不那么合理!1、效用函數的定義1)從一般定性分析看,效用是人們的價值觀念在決策活動中的綜合表現,它綜合地表明決策者對風險所持有的態度。2)從定量分析,效用就是對人們的價值觀所出現的后果賦以“數值”。例:假設有兩個投資方案供選擇:方案A:投資100萬元,有50%的把握獲利50萬元,但也有50%的可能虧損20萬元。方案B:投資100萬元,有100%的把握盈利10萬元。這兩個方案哪一個更優呢?不同決策者的標準不一。如按期望決策準則,則有EA=100×50%-20×50%=40(萬元)EB=10×100%=10(萬元)效用,就是決策者對決策后果的一種感受、反應或傾向,是決策者的價值觀和偏好在決策活動中的綜合反映。在經濟學領域里,效用是指人們在消費一種商品或勞務時所獲得的一種滿足程度。定義1,設C為后果集,u為C的實值函數,若對所有的當且僅當u(c1)≥u(c2),則稱u(c)為效用函數。
定義2,在Q上的實值函數,如果 對所有,當且僅當u(P1)>u(P2);稱u為效用函數。 把效用函數定義在展望集上,是為了使效用函數反映決策人對風險的態度。用記號P=(p1,c1;…;pi,ci;…;pn,cn)表示后果ci以概率pi出現(i=1,2,…,n),并稱P為展望,即可能的前景。代表P1優于P2。所有展望集記作Q。展望集Q上的效用函數定義如下:2、期望效用效用的大小可用介于0、1之間的實數表示,即0≤效用值≤1。設某家電公司經營彩電、冰箱和空調等家用電器,售后服務實行三包,并配備了普通維修工和高級維修技師。普通維修工只能排除輕微故障,高級維修技師則可排除一切故障。根據歷史統計資料,發生輕微故障的概率為0.6,發生嚴重故障的概率為0.4?,F接到用戶電話通知,電視機出現了故障,但未知是何種故障,若派人去修,就可能發生下述四種情況之一:由上表可知,派高級維修師去的期望效用最大。效用值嚴重故障概率0.4輕微故障概率0.6期望效用值普通維修工00.80.48=(0×0.4+0.8×0.6)高級維修師10.50.70=(1×0.4+0.5×0.6)1、電器出現的是輕微故障,派去的是普通維修工,很快修好,用戶滿意,所花代價小。2、出現的是嚴重的故障,派去的是高級維修技師,很快修好,用戶十分滿意,在用戶中贏得了信譽,公司認為效用最大。3、出現的是輕微故障,但派去的是高級維修技師,很快修好,用戶滿意,但代價較高,公司認為浪費了人力。4、出現的是嚴重故障,派去的是普通維修工,修不好,只換高級維修技師,雖然修好了,但用戶不滿意,影響了公司的信譽,公司認為代價最高,效用最小。3、效用測定簡法效用的測定方法最常用的是馮·諾依曼和摩金斯頓于1944年共同提出的,稱之為標準測定法。假定某人的收益在0元到100元之間,我們要測定這一范圍內的貨幣效用。測定步驟是:1)選定標尺,u(100)=1,u(0)=02)確定中間點的效用值 記“收益a元的方案”為a,0<a<100,來定u(a)。 對決策者愈有利的方案,效用值愈大。u(a)應該滿足0<u(a)<1。 例:現在以a=50為例,從確定u(50)=?的過程來介紹中間點效用值確定的方法。
A、我們可以向決策者提出第一個問題:“有兩種方案,a1和a2,方案a1能有0.5的概率獲0元收益和0.5的概率獲100元收益,方案a2有1的概率獲50元收益,請問你喜歡哪一種方案?” 如果他選方案a2。我們再提出第二個問題:把前一個問題中方案a1改變為0.2的概率獲0元收益,0.8的概率獲100元收益,方案a2不變,決策者怎樣選擇? 如果他選擇方案a1。我們再適當升高方案a1取得0元的概率,降低獲100元概率,繼續提問下去,直到他認為采取方案a1與采取方案a2對他來說是同樣時為止。此時,方案a1與a2在決策者心目中的地位平等,即稱為等效方案(行為)。 設這時的方案a1獲0元收益的概率為0.3,獲100元收益的概率為0.7,則在決策者看來,方案a1與a2效用相等。我們有:0.3u(0)+0.7u(100)=u(50)把u(0)=0,u(100)=1代入上式,得:0.3×0+0.7×1=u(50)即,u(50)=0.7B、向決策者提出上面問題時,也可以表示為任意兩個貨幣數值,只要它們的效用已經得出,并且欲測點介于它們之間。如得出u(50)=0.7后,要測定a=65時,u(65)=?,作法可以如下:“方案a1以概率p獲100元收益,以概率1-p獲50元收益;以概率1獲65元收益。請問p為何值時,方案a1與a2等效?”假設決策者的回答是p=0.3,這時,我們有0.7u(50)+0.3u(100)=u(65)將u(50)=0.7,u(100)=1代入上式,得0.7×0.7+0.3×1=u(65)即u(65)=0.79C、如果知道了貨幣效用值,可否測出貨幣值呢?回答應該是肯定的。比如貨幣的效用值為0.5,我們來測出相應的貨幣值是多少??梢韵冗M行如下提問:“現有兩個方案a1和a2,方案a1能有0.5的概率獲0元收益和0.5的概率獲100元收益;方案a2能有1的概率獲得40元收益,請問你喜歡哪一種方案?”如果他選方案a2,則把40元逐漸減少,一直到某一數目,比如說為30元時,決策者認為方案a1和a2是等效行為,則有u(30)=0.5u(0)+0.5u(100)=0.5×0+0.5×1=0.5當然,我們可以調整數值后繼續提問。這樣,我們可以得出任一收益值介于0~100元之間的效用值。3)可以繼續使用上述心理試驗問答的方法求出。至此,我們已得到5個點的效用值:u(0)=0,u(30)=0.5,u(50)=0.7,u(65)=0.79,u(100)=1,將這些點用線連接起來,并把它光滑化,即得到這位決策者的效用曲線。O305065100損益值(元)u效用值1.00.80.60.40.2決策者的效用曲線4、偏愛結構和效用函數ABCCOu(c)1.00.5不同類型的效用函數曲線效用函數類型1、中性效用函數(風險中性)A2、保守型效用函數(風險規避)B3、冒險型效用函數(風險喜好)C決策人的個性和價值觀等就是偏愛。偏愛的構成即偏愛結構。63三、效用曲線的應用從以上風險型決策分析的求解中可知,各種決策都以損益期望值的大小作為在風險情況下選擇最優方案的準則。所謂“期望值”,如前所述,是在相同條件下通過大量試驗所得的平均值。但在實際工作中,如果同樣的決策分析問題只作一次或少數幾次試驗,用損益期望值作為決策的準則就不盡合理。另一方面,在決策分析中需要反映決策者對決策問題的主觀意圖和傾向,反映決策者對決策結果的滿意程度等。64例7某制藥廠欲投產A、B兩種新藥,但受到資金及銷路限制,只能投產其中之一。若已知投產新藥A需要資金30萬元,投產新藥B只需資金16萬元,兩種新藥生產期均定為5年。估計在此期間,兩種新藥銷路好的概率為0.7,銷路差的概率為0.3。它們的益損值如表下所示。問究竟投產哪種新藥為宜?
狀態益損值概率方案銷路好銷路差0.70.3A70-50B24-665先采用損益期望值作為決策標準,用決策樹法計算如下。可見,采用損益期望值作為決策標準,方案A較優。66(2)根據效用曲線,找到與方案B的損益值相對應的效用值,與損益值24萬元對應的的效用值為0.82,損益值-6對應的效用值為0.58。利用效用值重新計算方案A和方案B的效用期望值。新藥A的效用期望值為:E(A)=1.0×0.7+0×0.3=0.70E(B)=0.82×0.7+0.58×0.3=0.75可見,若用效用值作為決策標準,得到不同的結論,方案B較優。若用效用值作為決策標準,其步驟如下:(1)繪制決策人的效用曲線。設70萬元的效用值為1.0,-50萬元的效用值為零,然后由決策人經過多次辨優過程,找出與益損值相對應的效用值后,就可以畫出決策人的效用曲線,如下圖所示。
一.博弈論(GameTheory)1.博弈論的起源:Game(1)博弈論譯自英文:GameTheory,“Game”的本義就是游戲(弈棋、賭勝)。
Game的共同特征:都有一定的規則;都有一個結果;參與者都面臨策略選擇;策略至關重要,與參與者的利益相互依存。博弈論與沖突分析
一.博弈論(GameTheory)
(一).博弈論的起源:Game1.可以用游戲的規律來研究本質上沒有區別的問題當然,政治、軍事、政治等方面的決策較量,不會象日常生活中的小游戲那么輕松愉快,我們一般也不會把關系到個人、企業、甚至國家前途命運的決策活動稱為游戲,但究其根本,研究游戲規律得出的結論,完全可以用來指導經濟、管理、政治等活動中的重要決策問題。
一.博弈論(GameTheory)
(二)博弈的定義博弈即一些個人、隊組或其他組織,面對一定的環境條件,在一定的規則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進行選擇并加以實施,各自取得相應結果的過程。博弈的四要素:參加者(Players);策略/行為(Strateg-ies/Actions);次序(Orders);得益(Payoffs)。
一.博弈論(GameTheory)
(三)幾類經典的博弈模型
1.囚徒困境“囚徒困境”博弈是由圖克(Tucker)在1950年提出的經典模型,它很好地反映了博弈問題的根本特征,是解釋眾多經濟現象、研究經濟效率問題的非常有效的基本模型和范式。囚坦白徒1不坦白
囚徒2坦白不坦白
一.博弈論(GameTheory)
(三)幾類經典的博弈模型
2.智豬博弈假設豬圈里的兩頭豬都有智慧,按一下就有10個單位的豬食進槽,但誰先按就要首先支付2個單位的成本。若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時到槽邊,收益比是7∶3;小豬先到槽邊,收益比是6∶4。大豬和小豬應如何選擇?行動還是等待?大按豬不按
小豬按不按
一.博弈論(GameTheory)
(三)幾類經典的博弈模型
3.賭勝博弈博弈本身就包含了“賭”和“勝”的意思,賭勝博弈屬于“零和博弈”的范疇,也就是說,博弈方的收益互為消長。
(1)田忌賽馬
(2)猜硬幣
(3)石頭剪子布
田忌齊威王
取勝的關鍵:不能讓對方猜中自己的策略;不能偏愛自己的可選策略,應該以相同的概率選用。
一.博弈論(GameTheory)
(四)博弈的分類
1.博弈方單人博弈:單人迷宮、運輸路線兩人博弈多人博弈單人博弈的最大特征是信息擁有量與得益正相關;兩人或多人博弈中,博弈雙方不總是相互對抗,也有利益一致的情形(合作博弈);多人博弈與兩人博弈的本質區別就是存在破壞者(策略選擇不影響自身的利益,但會影響其他博弈方的利益,如奧運會主辦權的爭奪)。
一.博弈論(GameTheory)
(四)博弈的分類
2.策略的數量有限博弈:每一博弈方的可選策略都有限無限博弈:至少一個博弈方具有無限的可選擇策略
3.利益零和博弈:博弈方始終對立(戰爭)
常和博弈:有對立也有妥協,和平共處(分配獎金)
變和博弈:社會總得益的角度(有效/低效/無效)
一.博弈論(GameTheory)
(四)博弈的分類
4.過程:靜態博弈、動態博弈、重復博弈還可以根據信息結構、博弈方的理性和行為邏輯的差別等對博弈模型進行分類。
(五)分析方法上策均衡法(博弈結果是博弈方各自的上策)、嚴格下策反復消去法(剔除劣果)、劃線法、箭頭法等等。二、沖突分析
沖突分析(ConflictAnalysis,CA)是國外近年來在經典對策論(GameTheory)和偏對策理論(MetagameTheory)基礎上發展起來的一種對沖突行為進行正規分析(FormalAnalysis)的決策分析方法。
其主要特點是能最大限度地利用信息,通過對許多難以定量描述的現實問題的邏輯分析,進行沖突事態的結果預測和過程分析(預測和評估、事前分析和事后分析),幫助決策者科學周密地思考問題。它是分析多人決策和解決多人競爭問題的有效工具之一。國外已在社會、政治、軍事、經濟等不同領域的糾紛談判、水力資源管理、環境工程、運輸工程等方面得到了應用,我國也已在社會經濟、企業經營和組織管理等領域開始應用。
對策論起源于20世紀20年代初,40年代中和60年代中均得到了很大發展,70年代以來在許多方面又取得了豐碩成果。70年代初,N.Howard(英)提出了一種以現實生活中最容易出現的情況為基礎的對策理論——MetagameTheory(偏對策理論)。
其基本思想是認為在選擇策略時要考慮其他局中人可能的反應,即將各局中人的策略作為一種函數,使其構成更高一級的對策,即偏對策。另外,在該理論描述中,主張用結局的優先序代替其贏得(效用)值,從而使得對策模型的可實現性大大增強。
到了80年代,M.Fraser和W.Hipel(加拿大)在偏對策的基礎上,提出了一種研究沖突事態的方法——沖突分析方法,從而使得對策理論更加實用化。該方法的提出也迎合了近一、二十年來對策化(gaming)或通過模擬手段來研究對策問題的趨勢。沖突分析方法的主要特色是:
(1)
能最大限度地利用信息,尤其對許多難以定量分析的問題,用沖突分析解決起來更顯得得心應手,因而較適于解決工程系統中考慮社會因素影響時的決策問題和社會系統中的多人決策問題。(2)
具有嚴謹的數學(集合論)和邏輯學基礎,是在一般對策論基礎上發展起來的偏對策理論的實際應用。(3)沖突分析既能進行沖突事態的結果預測(事前分析),又能進行事態的過程描述和評估(事后分析),從而可為決策者提供多方面有價值的決策信息,并可進行政策和決策行為的分析。(4)分析方法在使用中幾乎不需任何的數學理論和復雜的數學方法,很容易被理解和掌握。主要分析過程還可用計算機、通過人—機對話解決,因而具有很強的實用性。目前,使用較多的沖突分析軟件是CAP(ConflictAnalysisProgram)或DM(DecisionMaker)。(5)沖突分析用結局的優先序代替了效用值,并認為對結局比較判斷時可無傳遞性,從而在實際應用中避開了經典對策論關于效用值和傳遞性假設等障礙。
三、沖突分析的程序及要素
1、沖突分析的一般過程沖突分析的一般過程或程序如圖所示。沖突問題對沖突事件背景的認識與描述建模穩定性分析決策結果分析與評價YN沖突分析過程示意圖
(1)對沖突事件背景的認識與描述以對事件有關背景材料的收集和整理為基本內容。整理和恰當的描述是分析人員的主要工作。主要包括:①沖突發生的原因(起因)及事件的主要發展過程;②爭論的問題及其焦點;③可能的利益和行為主體及其在事件中的地位及相互關系;④有關各方參與沖突的動機、目的和基本的價值判斷;⑤各方在沖突事態中可能獨立采取的行動。對背景的深刻了解和恰當描述,是對復雜的沖突問題進行正規分析的基礎。
(2)沖突分析模型(建模)是在初步信息處理之后,對沖突事態進行穩定性分析用的沖突事件或沖突分析要素間相互關系及其變化情況的模擬模型,一般用表格形式比較方便。(3)穩定性分析是使沖突問題得以“圓滿”解決的關鍵,其目的是求得沖突事態的平穩結局(局勢)。所謂平穩局勢,是指對所有局中人都可接受的局勢(結果),也即對任一局中人i,更換其策略后得到新局勢,而新局勢的效用值(贏得)或偏好度都較原局勢為小,則稱原來的局勢為平穩局勢。因在平穩狀態下,沒有一個局中人愿意離開他已經選定的策略。故平穩結局亦為最優結局(最優解)。穩定性分析必須考慮有關各方的優先選擇和相互制約。
(4)結果分析與評價主要是對穩定性分析的結果(即各平穩局勢)做進一步的邏輯分析和系統評價,以便向決策者提供有實用價值的決策參考信息。2、沖突分析的基本要素
沖突分析的要素(也叫沖突事件的要素)是使現實沖突問題模型化、分析正規化所需的基本信息,也是對原始資料處理的結果。主要有:
(1)時間點:是說明“沖突”開始發生時刻的標志;對于建模而言,則是能夠得到有用信息的終點。因為沖突總是一個動態的過程,各種要素都在變化,這樣很容易使人認識不清,所以需要確定一個瞬間時刻,使問題明朗化。但時間點不直接進入分析模型。
(2)局中人(Players):是指參與沖突的集團或個人(利益主體),他們必須有部分或完全的獨立決策權(行為主體)。沖突分析要求局中人至少有兩個或兩個以上。局中人集合記作N,|N|=n≥2。
(3)選擇或行動(Options):是各局中人在沖突事態中可能采取的行為動作。沖突局勢正是由各方局中人各自采取某些行動而形成的。每個局中人一組行動的某種組合稱為該局中人的一個策略(Strategy)。第i個局中人的行動集合記作Oi,|Oi|=ki。
(4)結局(Outcomes)。各局中人沖突策略的組合共同形成沖突事態的結局。全體策略的組合(笛卡爾乘積或直積)為基本結局集合,記作T,|T|=?。結局是沖突分析問題的解。(5)優先序或優先向量(PreferenceVector)。各局中人按照自己的目標要求及好惡標準,對可能出現的結局(可行結局)排出優劣次序,形成各自的優先序(向量)。
CA基本方法舉例
囚徒困境
1、決策人與行動囚徒甲(1)不坦白(2)坦白囚徒乙(1)不坦白(2)坦白1010011010010101結局1(3,3)2(4,1)3(1,4)4(2,2)2、決策人的優先(偏好)向量甲的偏好向量乙的偏好向量囚徒甲(1)不坦白0101(2)坦白1010囚徒乙(1)不坦白1100(2)坦白0011囚徒甲(1)不坦白1100(2)坦白0011囚徒乙(1)不坦白0101(2)坦白1010結局:2143結局:3142
基本假設:①每個局中人都將不斷朝著對自己最有利的方向改變其策略;②局中人在決定自己的選擇時,都會考慮到其他局中人可能的反應及對本人的影響;③全局平穩結局首先對每個局中人來說都是個體平穩的。(1)確定單方面改進結局UI(UnilateralImprovement)(2)確定個體穩定狀態①合理穩定(Rationalstable——r)②連續處罰穩定(Sequentiallysanctionedstable——s)③非穩定(Unstable——u)(3)確定全局平穩結局(Equilibrium——E)3、穩定性分析囚徒甲
XEEX整體穩定性
rsru個人穩定性P甲
2143
24囚徒乙
rsru個人穩定性P乙
3142
34五、沖突分析一般方法
n人沖突中第i個局中人穩定性分析的程序
開始對于局中人i,結局q有UI嗎?對于局中人i,由q的UI結局q’其他局中人是否有UI?嗎?其他局中人由q’其造成的一切結局q//,對于局人i而言,全都比q更優嗎?對于局中人i,由結局q的UI結局還有嗎?q是合理穩定性結局,記作rq是非穩定性結局,記作u(檢查同時處罰性穩定,若是記作u)q是連續處罰性穩定結局,記作sq是全局平穩結局,記作E結束YNNYYNNY例——某地區飲料廠決策沖突問題的背景:
某地區一個小型飲料廠(簡稱甲廠),在2006年末經過市場調查,發現本地區的飲料大部分是由南方某大廠(簡稱乙廠)生產的,因此他們需要決定是否引進新的生產線擴大生產。如果生產,必須決定旨在本地區銷售,還是在全國(主要是南方)銷售,而乙廠需要決定是否在該地區繼續出售產品,如果出售要決定出售價格的高低。1參與者
1)甲廠
2)乙廠2選擇方案
1)甲廠采取的方案:
①開辟本地區市場;②開辟南方市場。
2)當甲廠采取行動時,乙廠可能的對策是:
①不在甲廠所在地區銷售產品;②高價進入甲廠所在地區;③低價進入甲廠所在地區。
3結局的表示和簡化在沖突中,每個參與者都可根據別的參與者采取方案的情況選擇自己的對策。當每個參與者選定了一個方案之后,沖突事件所形成的局勢稱為一個結局。對于該例所列的甲乙可能選擇的方案來說,每個方案都有選擇和不選擇兩種可能,所以理論上來說,此沖突可能有25=32個結局。表1本例的基本結局甲廠
①01010101010101010101010101010101②00110011001100110011001100110011乙廠①00001111000011110000111100001111②00000000111111110000000011111111③00000000000000001111111111111111十進制0123456789101112131415
16171819202122232425262728293031
實際上有許多結果是不可能的,應首先在所有結局中剔除從邏輯或偏好選擇看來不可行的結局,得到可行結局集。一般來說,以下四類結局可以剔除:對于某一參與者來說,在邏輯上是無效的結局。如乙廠既采取高價進入甲廠所在地區,又低價進入甲廠所在地區;本例中有以下結局屬于此類:12,13,14,15,20,21,22,23,24,25,26,27,28,29,30,31某一參與者根本無法接受的結局。如甲廠在乙廠以低價在所在地銷售產品的情況下不采取任何行動.
本例中結局16,8屬于此類,應予刪除.在參與者之間邏輯上無效的結局。如,唯一的一件東西,兩個參與者都想獲得,但兩個參與者同時得到這件東西的結局是邏輯上無效的。這類結局剔除的難處在于有時方案的定義不太嚴格,如上述那件東西是否可以共享或分享,搞得不清便會出現差錯。故應當十分慎重,并進行仔細分析。某兩個或兩個以上參與者選擇的策略使結局至少對一個參與者從某優先結構上考慮是不可行的結局。如乙廠高價進入甲廠所在地區,甲廠理應開辟本地區市場,或不采取任何措施,對甲廠來說,在其優先次序上采取開辟南方市場是不可行方案。但是,在一定的條件下,這種現象發生的可能性將會影響參與者的選擇行為。因此,這類結局的剔除很困難。一般,當結局很多時(≥50個),可以剔除這類結局,當有效結局較少時(20~25個),這類結局剔除要十分小心。本例中結局10,2,6屬于此類,應予刪除.
剔除無效元素結局最簡單的方法是使用計算機,也可以用手算的方法進行。一般有以下三種方法:
第一種方法:
按數字次序排列所有的結局,剔除無效結局后即得有效結局。如乙廠不采取任何策略下,甲廠可能采取的各種策略所形成的結局為:
按照這種方法的好處在于結局的剔除是大塊大塊的,如:均可剔除,即有23=8個第二種方法:將要剔除的結局用含有盡可能多的破折符集表示。例如:有5個方案的沖突問題,所有理論上的結局可用(-----)表示。1、如要剔除(1----),顯然余下的結局為(0----)2、如要剔除(10---)余下的結局為(00---)(01---)(11---)(0----)(11---)(00---)(-1---)3、從所有結局中剔除一組結局只須簡單地逐組剔除。如要在(-----)中剔除(10---),(1--1-),(--00-)和(0---0)??砂聪铝胁襟E:①從(-----)中剔除(10---)得(0----)(11---)②再要剔除(1--1-)只影響后一組(11---)即得(0----)(11-0-)③再剔除(--00-)(從上兩組中討論)即得(0-01-)(0-10-)(0-11-)(1110-)將第二、三組合并得(0-01-)(0-1--)(1110-)
④再剔除(0---0)第三組中不含此類結局,故只從第一、二組剔除。即得(0-011)(0-1-1)(1110-)這樣表示結局很簡捷,計算結局數很方便。第三種方法:是每一個參與者都選出有效結局,并把它們合并在一起,如乙廠的有效結局可表示為:(--001)在本案例的32個結局中對甲廠:a類結局:14,22,26,30;b類結局:8,16;d類結局:2,6,10,18;是不可行的,應刪除.對乙廠:a類結局:12,13,15,20,21,23,24,25,27,28,29,31;b類結局:4;也不可行,應刪除,故可行結局只有9個。表2本例的可行結局甲廠
①011111111②001010101乙廠①000110000②000001100③000000011十進制
013579111719
甲廠開辟市場,首選同時開辟本地區市場和南方市場;乙廠參與競爭時,按照低價-原價-高價的次序采取策略。
各參與者按照自己的目標要求及好惡對可行結局排序,得偏好向量。甲廠的偏好向量是:751193119170
乙廠的偏好向量是:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025酒店內部承包合同范本
- 陸地港口與海港的優勢比較
- 2025詳盡包工不包料民事建筑合同范本
- 2025汽車銷售公司的購車合同模板
- 2025裝修油漆工程合同
- 2025合同范本防火門維修合同
- 金融基礎知識
- 護理部計劃的制定
- 2025福州影業公司版權許可合同
- 田園房屋租賃合同范本
- 2024年天翼云認證運維工程師考試復習題庫(含答案)
- 儲能項目竣工報告
- 醫療手術分級和準入
- 盆底生物反饋治療肛門直腸功能障礙性疾病中國專家共識(2024版)解讀
- 生產管理部述職報告
- 盤扣式腳手架在大型活動搭建中的方案
- 天津中考英語2020-2024年5年真題匯編-學生版-專題09 短文首字母填空
- 2015-2024年十年高考物理真題分類匯編專題04 曲線運動(解析版)
- 幼兒園食堂原材料采購 投標方案(技術方案)
- 電化學儲能電站巡視檢查、故障處理表格匯編
- 鞋子買賣合同包裝條款
評論
0/150
提交評論