數(shù)學(xué)建模對(duì)策與決策模型_第1頁(yè)
數(shù)學(xué)建模對(duì)策與決策模型_第2頁(yè)
數(shù)學(xué)建模對(duì)策與決策模型_第3頁(yè)
數(shù)學(xué)建模對(duì)策與決策模型_第4頁(yè)
數(shù)學(xué)建模對(duì)策與決策模型_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

對(duì)策與決策模型對(duì)策與決策模型對(duì)策與決策是人們生活和工作中經(jīng)常會(huì)遇到的擇優(yōu)活動(dòng)。人們?cè)谔幚硪粋€(gè)問題時(shí),往往會(huì)面臨幾種情況,同時(shí)又存在幾種可行方案可供選擇,要求根據(jù)自己的行動(dòng)目的選定一種方案,以期獲得最佳的結(jié)果。有時(shí),人們面臨的問題具有競(jìng)爭(zhēng)性質(zhì),如商業(yè)上的競(jìng)爭(zhēng)、體育中的比賽和軍事行動(dòng)、政治派別的斗爭(zhēng)等等。這時(shí)競(jìng)爭(zhēng)雙方或各方都要發(fā)揮自己的優(yōu)勢(shì),使己方獲得最好結(jié)果。因而雙方或各方都要根據(jù)不同情況、不同對(duì)手做出自己的決擇,此時(shí)的決策稱為對(duì)策。在有些情況下,如果我們把可能出現(xiàn)的若干種情況也看作是競(jìng)爭(zhēng)對(duì)手可采取的幾種策略,那么也可以把決策問題當(dāng)作對(duì)策問題來求解。對(duì)策問題對(duì)策問題的特征是參與者為利益相互沖突的各方,其結(jié)局不取決于其中任意一方的努力而是各方所采取的策略的綜合結(jié)果。先考察幾個(gè)實(shí)際例子。

例1

(田忌賽馬)

田忌賽馬是大多數(shù)人都熟知的故事,傳說戰(zhàn)國(guó)時(shí)期齊王欲與大將田忌賽馬,雙方約定每人挑選上、中、下三個(gè)等級(jí)的馬各一匹進(jìn)行比賽,每局賭金為一千金。齊王同等級(jí)的馬均比田忌的馬略勝一籌,似乎必勝無疑。田忌的朋友孫臏給他出了一個(gè)主意,讓他用下等馬比齊王的上等馬,上等馬對(duì)齊王的中等馬,中等馬對(duì)齊王的下等馬,結(jié)果田忌二勝一敗,反而贏了一千金。

例2

(石頭—剪子—布)這是一個(gè)大多數(shù)人小時(shí)候都玩過的游戲。游戲雙方只能選石頭、剪子、布中的一種,石頭贏剪子,剪子贏布,而布又贏石頭,贏者得一分,輸者失一分,雙方相同時(shí)不得分,見下表。表1石頭剪子布石頭01-1剪子-101布1-10例3

(囚犯的困惑)警察同時(shí)逮捕了兩人并分開關(guān)押,逮捕的原因是他們持有大量偽幣,警方懷疑他們偽造錢幣,但沒有找到充分證據(jù),希望他們能自己供認(rèn),這兩個(gè)人都知道:如果他們雙方都不供認(rèn),將被以使用和持有大量偽幣罪被各判刑18個(gè)月;如果雙方都供認(rèn)偽造了錢幣,將各被判刑3年;如果一方供認(rèn)另一方不供認(rèn),則供認(rèn)方將被從寬處理而免刑,但另一方面將被判刑7年。將嫌疑犯A、B被判刑的幾種可能情況列表如下:表2嫌疑犯B供認(rèn)不供認(rèn)嫌疑犯A供認(rèn)不供認(rèn)(3,3)(0,7)(7,0)(1.5,1.5)表中每對(duì)數(shù)字表示嫌疑犯A、B被判刑的年數(shù)。如果兩名疑犯均擔(dān)心對(duì)方供認(rèn)并希望受到最輕的懲罰,最保險(xiǎn)的辦法自然是承認(rèn)制造了偽幣。一、對(duì)策的基本要素(1)局中人。參加決策的各方被稱為決策問題的局中人,一個(gè)決策總是可以包含兩名局中人(如棋類比賽、人與大自然作斗爭(zhēng)等),也可以包含多于兩名局中人(如大多數(shù)商業(yè)中的競(jìng)爭(zhēng)、政治派別間的斗爭(zhēng))。局中人必須要擁用可供其選擇并影響最終結(jié)局的策略,在例3中,局中人是A、B兩名疑犯,警方不是局中人。兩名疑犯最終如何判刑取決于他們各自采取的態(tài)度,警方不能為他們做出選擇。從這些簡(jiǎn)單實(shí)例中可以看出對(duì)策現(xiàn)象中包含的幾個(gè)基本要素。(2)策略集合。局中人能采取的可行方案稱為策略,每一局中人可采取的全部策略稱為此局中人的策略集合。對(duì)策問題中,對(duì)應(yīng)于每一局中人存在著一個(gè)策略集合,而每一策略集合中至少要有兩個(gè)策略,否則該局中人可從此對(duì)策問題中刪去,因?yàn)閷?duì)他來講,不存在選擇策略的余地。應(yīng)當(dāng)注意的是,所謂策略是指在整個(gè)競(jìng)爭(zhēng)過程中對(duì)付他方的完整方法,并非指競(jìng)爭(zhēng)過程中某步所采取的具體局部辦法。例如下棋中的某步只能看作一個(gè)完整策略的組成部分,而不能看成一個(gè)完整的策略。當(dāng)然,有時(shí)可將它看成一個(gè)多階段對(duì)策中的子對(duì)策。策略集合可以是有限集也可以是無限集。策略集為有限集時(shí)稱為有限對(duì)策,否則稱為無限對(duì)策。

記局中人i的策略集合為Si。當(dāng)對(duì)策問題各方都從各自的策略集合中選定了一個(gè)策略后,各方采取的策略全體可用一矢量S表示,稱之為一個(gè)純局勢(shì)(簡(jiǎn)稱局勢(shì))。

例如,若一對(duì)策中包含A、B兩名局中人,其策略集合分別為SA

={1,…,m},SB

={1,…,n}。若A選擇策略i而B選策略j,則(i,j)就構(gòu)成此對(duì)策的一個(gè)純局勢(shì)。顯然,SA與SB一共可構(gòu)成m×n個(gè)純局勢(shì),它們構(gòu)成表。對(duì)策問題的全體純局勢(shì)構(gòu)成的集合S稱為此對(duì)策問題的局勢(shì)集合。

(m,n)

…(m,j)

…(m,2)

(m,1)

m…………………(i,n)

…(i,j)

…(i,2)

(i,1)

i…………………(2,n)

…(2,j)

…(2,2)

(2,1)

2(1,n)

…(1,j)

…(1,2)

(1,1)

1A的策略n…J…21B的策略(3)贏得函數(shù)(或稱支付函數(shù))。對(duì)策的結(jié)果用矢量表示,稱之為贏得函數(shù)。贏得函數(shù)F為定義在局勢(shì)集合S上的矢值函數(shù),對(duì)于S中的每一純局勢(shì)S,F(xiàn)(S)指出了每一局中人在此對(duì)策結(jié)果下應(yīng)贏得(或支付)的值。綜上所述,一個(gè)對(duì)策模型由局中人、策略集合和贏得函數(shù)三部分組成。記局中人集合為I={1,…,k},對(duì)每一i∈I,有一策略集合Si,當(dāng)I中每一局中人i選定策略后得一個(gè)局勢(shì)s;將s代入贏得函數(shù)F,即得一矢量F(s)=(F1(s),…,Fk(s)),其中Fi(s)為在局勢(shì)s下局中人i的贏得(或支付)。只討論兩名局中人的對(duì)策問題,即兩人對(duì)策,其結(jié)果可以推廣到一般的對(duì)策模型中去。對(duì)于只有兩名局中人的對(duì)策問題,其局勢(shì)集合和贏得函數(shù)均可用表格表示。零和對(duì)策存在一類特殊的對(duì)策問題。在這類對(duì)策中,當(dāng)純局勢(shì)確定后,A之所得恰為B之所失,或者A之所失恰為B之所得,即雙方所得之和總為零。在零和對(duì)策中,因F1(s)=-F2(s),只需指出其中一人的贏得值即可,故贏得函數(shù)可用贏得矩陣表示。例如若A有m種策略,B有n種策略,贏得矩陣

表示若A選取策略i而B選取策略j,則A之所得為aij(當(dāng)aij<0時(shí)為支付)。在有些兩人對(duì)策的贏得表中,A之所得并非明顯為B之所失,但雙方贏得數(shù)之和為一常數(shù)。例如在表4中,無論A、B怎樣選取策略,雙方贏得總和均為10,此時(shí),若將各人贏得數(shù)減去兩人的平均贏得數(shù),即可將贏得表化為零和贏得表。表4局中人B123局中人A1(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)

3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)給定一個(gè)兩人對(duì)策只需給出局中人A、B的策略集合SA、SB及表示雙方贏得值的贏得矩陣R。綜上所述,當(dāng)遇到零和對(duì)策或可轉(zhuǎn)化為零和對(duì)策的問題時(shí),R可用通常意義下的矩陣表示,否則R的元素為一兩維矢量。故兩人對(duì)策G又可稱為矩陣對(duì)策并可簡(jiǎn)記成G={SA,SB,R}例4

給定G={SA,SB,R},其中SA

={1,2,3},SB

={1,2,3,4}

從R中可以看出,若A希望獲得最大贏利30,需采取策略1,但此時(shí)若B取策略4,A非但得不到30,反而會(huì)失去22。為了穩(wěn)妥,雙方都應(yīng)考慮到對(duì)方有使自己損失最大的動(dòng)機(jī),在最壞的可能中爭(zhēng)取最好的結(jié)果。局中人A采取策略1、2、3時(shí),最壞的贏得結(jié)果分別為min{12,-6,30,-22}=-22min{14,2,18,10}=2min{-6,0,-10,16}=-10其中最好的可能為max{-22,2,-10}=2。如果A采取策略2,無論B采取什么策略,A的贏得均不會(huì)少于2.B采取各方案的最大損失為max{12,14,-6}=14,max{-6,2,0}=2,max{30,18,-10}=30和max{-22,10,16}=16。當(dāng)B采取策略2時(shí),其損失不會(huì)超過2。注意到在贏得矩陣中,2既是所在行中的最小元素又是所在列中的最大元素。此時(shí),只要對(duì)方不改變策略,任一局中人都不可能通過變換策略來增大贏得或減小損失,稱這樣的局勢(shì)為對(duì)策的一個(gè)穩(wěn)定點(diǎn)或穩(wěn)定解,(注:也被稱為鞍點(diǎn))定義1

對(duì)于兩人對(duì)策G={SA,SB,R},若有,則稱G具有穩(wěn)定解,并稱VG為對(duì)策G的值。若純局勢(shì)()使得,則稱()為對(duì)策G的鞍點(diǎn)或穩(wěn)定解,贏得矩陣中與()相對(duì)應(yīng)的元素

稱為贏得矩陣的鞍點(diǎn),與分別稱為局中人A與B的最優(yōu)策略。設(shè)A方用概率xi選用策略i,B方用概率yj選用策略j,,且雙方每次選用什么策略是隨機(jī)的,不能讓對(duì)方看出規(guī)律,SA:策略α1,…,αmSB:策略β1,…,βn概率x1,…,xm概率y1,…,yn分別稱SA與SB為A方和B方的混合策略。注:例5A有兩架飛機(jī),B有四個(gè)導(dǎo)彈連分別掩護(hù)通向目標(biāo)的四條線路。如飛機(jī)沿一條路線進(jìn)攻,則掩護(hù)該線路的導(dǎo)彈連必?fù)袈湟患茱w機(jī),不過由于重裝導(dǎo)彈時(shí)間很長(zhǎng),所以僅僅能擊落一架飛機(jī);如飛機(jī)突防進(jìn)而摧毀目標(biāo),A的贏得為1;否則A的贏得為0。現(xiàn)在需要為A、B雙方選擇最優(yōu)策略。

解:雙方可選擇的策略集分別為A的策略為B的策略為:飛機(jī)從不同的路線進(jìn)入。:飛機(jī)從同一條路線進(jìn)入。:對(duì)每一條路線配備一個(gè)連。:對(duì)兩條路線各配置兩個(gè)連。:對(duì)一條路線配兩個(gè)連,為另?xiàng)l路線各配一個(gè)連。:對(duì)一條線路配三個(gè)連,對(duì)另一條路線配一個(gè)連。:對(duì)一條路線配四個(gè)連。由題意得A的贏得矩陣為易求得可知,不存在純策略。若A的最佳策略為(x,1-x)(x是A選擇的概率。)對(duì)于A的贏得是對(duì)于A的贏得是對(duì)于A的贏得是則A的至少贏得為13/41/25/61/2則解得例

某工程按正常速度施工時(shí),若無壞天氣影響可確保在30天內(nèi)按期完工。但根據(jù)天氣預(yù)報(bào),15天后天氣肯定變壞。有40%的可能會(huì)出現(xiàn)陰雨天氣而不影響工期,在50%的可能會(huì)遇到小風(fēng)暴而使工期推遲15天,另有10%的可能會(huì)遇到大風(fēng)暴而使工期推遲20天。對(duì)于可能出現(xiàn)的情況,考慮兩種方案:(1)提前緊急加班,在15天內(nèi)完成工程,實(shí)施此方案需增加開支18000元。

(2)先按正常速度施工,15天后根據(jù)實(shí)際出現(xiàn)的天氣狀況再作決策。如遇到陰雨天氣,則維持正常速度,不必支付額外費(fèi)用。如遇到小風(fēng)暴,有兩個(gè)備選方案:(i)維持正常速度施工,支付工程延期損失費(fèi)20000元。(ii)采取應(yīng)急措施。實(shí)施此應(yīng)急措施有三種可能結(jié)果:有50%可能減少誤工期1天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共24000元;有30%可能減少誤工期2天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共18000元;有20%可能減少誤工期3天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共12000元。風(fēng)險(xiǎn)型決策問題如遇大風(fēng)暴,也有兩個(gè)方案可供選擇:(i)維持正常速度施工,支付工程延期損失費(fèi)50000元。(ii)采取應(yīng)急措施。實(shí)施此應(yīng)急措施也有三種可能結(jié)果:有70%可能減少誤工期2天,支付應(yīng)急費(fèi)及誤工費(fèi)共54000元;有20%可能減少誤工期3天,支付應(yīng)急費(fèi)及誤工費(fèi)共46000元;有10%可能減少誤工期4天,支付應(yīng)急費(fèi)和誤工費(fèi)共38000元。根據(jù)上述情況,試作出最佳決策使支付的額外費(fèi)用最少。解:由于未來的天氣狀態(tài)未知,但各種天氣狀況出現(xiàn)的概率已知,本例是一個(gè)風(fēng)險(xiǎn)型決策問題,所謂的額外費(fèi)用應(yīng)理解為期望值。

本例要求作多次決策,工程初期應(yīng)決定是按正常速度施工還是提前緊急加班。如按正常速度施工,則15天后還需根據(jù)天氣狀況再作一次決策,以決定是否采取應(yīng)急措施,故本例為多階段(兩階段)決策問題。為便于分析和決策,采用決策樹方法。根據(jù)題意,作決策樹如圖。圖中,□表示決策點(diǎn),從它分出的分枝稱為方案分枝,分枝的數(shù)目就是方案的個(gè)數(shù)。○表示機(jī)會(huì)節(jié)點(diǎn),從它分出的分枝稱為概率分枝,一條概率分枝對(duì)應(yīng)一條自然狀態(tài)并標(biāo)有相應(yīng)的發(fā)生概率。△稱為未梢節(jié)點(diǎn),右邊的數(shù)字表示相應(yīng)的收益值或損失值。在決策樹上由右向左計(jì)算各機(jī)會(huì)節(jié)點(diǎn)處的期望值,并將結(jié)果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論