




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
高考概率問題的衍生與馬爾可夫鏈馬爾可夫鏈是俄國數學家AndreyAndreyevichMarkov(18561922)研究并提出的一種數學方法,是用來解釋自然變化的一般規律模型,該數學方法可以說是機器學習和人工智能的基石,在強化學習、自然語言處理、金融領域、天氣預測、語音識別方面都有著極其廣泛的應用.在高中,馬爾可夫鏈實際上就是一類特殊的數列遞推問題,最大的難點在于理解題意以及尋找遞推式.賭徒問題(隨機游走)例1:(2023·杭州市二模/湖南師大附中三模T21)馬爾科夫鏈是概率統計中的一個重要模型,也是機器學習和人工智能的基石,在強化學習自然語言處理、金融領域、天氣預測等方面都有著極其廣泛的應用.
其數學定義為:假設我們的序列狀態是…Xt2,Xt1,Xt,Xt+1…,那么Xt+1時刻的狀態的條體概率僅依賴前一狀態Xt,即P(Xt+1|…Xt2,Xt1,Xt)=P(Xt+1|Xt).現實生活中也存在著許多馬爾科大鏈,例如著名的賭徒模型.
假如一名賭徒進入賭場參與一個賭博游戲,每一局賭徒賭贏的概率為50%,每局賭贏可以贏得1元,每一局賭徒賭輸的概率為
50%,賭輸就要輸掉1元.賭徒會一直玩下去,直到遇到如下兩種情況才會結束賭博游戲:一種是手中賭金為0元,即賭徒輸光;一種是賭金達到預期的B元,賭徒停止賭博.記賭徒的本金為A(A∈N*,A<B),賭博過程如圖的數軸所示.
當賭徒手中有n元(0≤n≤B,n∈N)時,最終輸光的概率為P(n),請回答下列問題:
(1)請直接寫出
P(0)與P(B)的數值;(2)證明{P(n)}是
個等差數列,并寫出公差d;
(3)當A=100時,分別計算B=200,B=1000時,P(A)的數值,并結合實際,解釋當B→+∞時,P(A)的統計含義.(1)請直接寫出
P(0)與P(B)的數值;我們來理解一下問題在說什么:一個賭徒拿著A元去賭博,50%輸掉一元,手上的本金就只有A1元,贏得話就A+1元,不妨優先考慮一些極端情況:①如果一開始就是0元的本金,那他就是一開始就是輸光的狀態,所以他輸的概率
P(0)=1②如果一開始就是B元的本金,那他一開始就已經贏到目標錢數,所以輸的概率
P(0)=0(2)證明{P(n)}是
個等差數列,并寫出公差d;考慮一些常規情況,手上有未知的本金n元,我們令n=10,手上有10元,他輸光的概率就是
P(10)
,同時這也是一種所處的狀態,這個
P(10)
的狀態,可以是由P(9)
的狀態贏了一局后得到的,也可以是由
P(11)
的狀態輸了一局得到的,公式表為P這樣子我們可以得到一個更普遍的遞推式也許會有同學會問為什么不可以由
的狀態或者別的狀態到達P(n)嗎?其實也是可以的,最后化出來的式子是隔項的遞推式,經過變形推導也能得到上述式子,但是為了方便我們一般都是取最近的狀態研究,我們來推導一下它的通項:2P易知
{P(n)}為等差數列,令公差為d,則有P0+Bd=(3)當A=100時,分別計算B=200,B=1000時,P(A)的數值,并結合實際,解釋當B→+∞時,P(A)的統計含義.在這里我們可以看到,如果你的目標錢數B如果趨于
+∞
時,你輸光的概率將趨近于1即百分百,事實上,如果拓展到更廣的范圍,你輸光為0仍然不收手繼續賭博,仍然要達到目標B,最后你很有可能會先負債B;也就是說,在公平游戲的情況下,也會趨于“久賭必輸”,更何況現實中的賭博往往是不公平的(莊家贏的概率較大);所以我們要控制自己的欲望,不要參與賭博.例2:(2020·岳陽市一模T21)某產品自生產并投入市場以來,生產企業為確保產品質量,決定邀請第三方檢測機構對產品進行質量檢測,并依據質量指標Z時,產品為優等品;當時,產品為一等品;當時,產品為二等品.第三方檢測機構在該產品中隨機抽取500件,繪制了這500件產品的質量指標Z的條形圖.用隨機抽取的500件產品作為樣本,估計該企業生產該產品的質量情況,并用頻率估計概率.(1)①從該企業生產的所有產品中隨機抽取1件,求該產品為優等品的概率;②X元,求X的分布列與數學期望;(2)商場為推廣此款產品,現面向意向客戶推出“玩游戲,送大獎”活動.客戶可根據拋硬幣的結果,操控機器人在方格上行進,已知硬幣出現正、反面的概率都是12,方格圖上標有第0格、第1格、第2格、……、第50格.機器人開始在第0格,客戶每擲一次硬幣,機器人向前移動一次,若擲出正面,機器人向前移動一格(從k到k+1),若擲出反面,機器人向前移動兩格(從k到k+2),直到機器人移到第49格(勝利大本營)或第50格(參與n格的概率為.①投擲三次硬幣后,設機器人所在格數為X,求X的分布列以及數學期望;②求Pn的表達式并解釋此方案能否吸引顧客購買該款產品.解析:(1)①.根據條形圖可知,優等品的頻率為121+87+42500=12,用頻率估計概率,可得任取一件產品為優等品的概率.
②.由①任取一件產品為優等品的概率為12,由題意求出檢測出3件或4件為優等品時以及檢測出的優等品低于3件時的X的值進而得出P(X=47000)或P(X=39000).可得X的分布列,即可得出數學期望E(X)=41500.
(2)機器人在第0格為必然事件,P0=1,第一次擲硬幣出現正面,機器人移到第1格,其概率P1=12.機器人移到第n(2≤n≤49)格的情況只有兩種:①先到第n2格,又出現反面,其概率12Pn2,②先到第n1格,又出現正面,其概率12Pn1.可得Pn=12PPnPn1=12(Pn1Pn2),1≤n≤49時,數列{PnPn1}為首項P1P0=12,公比為12的等比數列馬爾可夫鏈(MarkovChains)我們可以看到,上述問題的解決,是在一個當前的狀態下,去判斷前一個狀態和后一個狀態與該狀態的聯系,從而找到遞推式,過程中的每個狀態的轉移只依賴于在此之前的n個狀態,這個過程被稱為n階馬爾可夫模型(其中n是影響轉移狀態的數目),最簡單的馬爾科夫過程就是一階過程,每一個狀態的轉移只依賴于其之前的那一個狀態,這也是后面很多模型的討論基礎.很多時候,題目中的馬爾科夫鏈、隱馬爾可夫模型都是只討論一階模型,甚至很多文章就將一階模型稱之為馬爾可夫模型,實際上我們知道一階模型只是一種特例而已.傳球問題中的馬爾可夫模型例3:三人互相傳球,由甲開始發球,并作為第一次傳球,每人得球后傳球給其他人的可能性均相等.經過5次傳球后,球仍回到甲手中,則不同的傳球方式共有(
)A.6種 B.8種 C.10種 D.16種【答案】C【解析】根據題意,作出樹狀圖,第四次球不能傳給甲,由分步加法計數原理可知:經過5次傳球后,球仍回到甲手中,則不同的傳球方式共有10種,這個問題解決起來不算麻煩,可以看做是一個排列組合問題下的分支,但是一旦參與的人數變多或者傳球次數增加,那么列舉法就會顯得捉襟見肘,所以我們不妨把這類問題做一個引申和推廣.(例3升級Plus版本):甲乙丙丁4人傳接球訓練,球從甲腳下開始,等可能地隨機傳向其余3人中的1人,接球者接到球后,再等可能地隨機傳向另外3人中的1人,依此類推.假設所有傳出的球都能接住.記第n次傳球之前,球在甲腳下的概率為Pn
(n∈N?)
,易知
P1=1
,P2=0.
(1)推導Pn
的表達式;
(2)設第n次傳球之前,球在乙腳下的概率為Qn
,比較Qn
與Pn
(
n≥3
)的大小;并結合實際,解釋當n→+∞時,Pn
與Qn
的統計含義;(3)假設經歷了6次傳球后,球依舊在甲的腳下,請問共有多少種不同的傳球路徑?分析第一個問題球在甲腳下,概率為
Pn
,這個概率是受上一個持球者影響的:如果上一個持球者還是甲,那球傳出去后,只能是其它三人接球,下一個持球者就不可能是甲,所以從上一個甲持球的狀態,到現在還是甲持球的狀態,轉移概率為0;如果上一個持球者不是甲,而是乙丙丁三人中的隨便一個人,那么球傳出去后,有
13可能給到甲,即轉移概率為
綜上公式可以描述為Pn=0·Pn1+13·(1-P經過變形也能構造出等比數列,進而求出通項分析第二個問題易得乙的遞推也類似甲,唯一不同的是初始概率.得到,接下來就是做差比較,最后分奇數和偶數討論大小.這里我們觀察一下通項
,隨著n越來越大,意思是傳球的次數越來越多,球在甲、乙手上的概率會趨于一個定值14,又因為四個人是等可能地隨機傳球,所以每個人接到球的可能性會逐漸相等.分析第三個問題球在甲腳下的概率可以計算得到,所有傳球路徑總的可能數為36,四個人是等可能地隨機傳球,所有路徑均為等可能性,使其相乘即為不同的傳球路徑的數量,易知答案為183種.例4:(2023·惠州一模T22改編)為了避免就餐聚集和減少排隊時間,某校開學后,食堂從開學第一天起,每餐只推出即點即取的米飯套餐和面食套餐(吐槽一下惠州學生命真苦啊……).已知某同學每天中午會在食堂提供的兩種套餐中選擇,已知他第一天選擇米飯套餐的概率為
23
,而前一天選擇了米飯套餐后一天繼續選擇米飯套餐的概率為
14
,前一天選擇面食套餐后一天繼續選擇面食套餐的概率為
12
,如此往復.
(1)求該同學第二天中午選擇米飯套餐的概率;
(2)記該同學第n天選擇米飯套餐的概率為
Pn;
(i)求Pn表達式;
(ii)證明:當n≥2時,Pn
≤512
;并結合實際,說明當n→+∞時,P高考中的馬爾可夫鏈問題(2019·全國1·理T21)為治療某種疾病,研制了甲、乙兩種新藥,希望知道哪種新藥更有效,為此進行動物試驗.試驗方案如下:每一輪選取兩只白鼠對藥效進行對比試驗.對于兩只白鼠,隨機選一只施以甲藥,另一只施以乙藥.一輪的治療結果得出后,再安排下一輪試驗.當其中一種藥治愈的白鼠比另一種藥治愈的白鼠多4只時,就停止試驗,并認為治愈只數多的藥更有效.為了方便描述問題,約定:對于每輪試驗,若施以甲藥的白鼠治愈且施以乙藥的白鼠未治愈則甲藥得1分,乙藥得1分;若施以乙藥的白鼠治愈且施以甲藥的白鼠未治愈則乙藥得1分,甲藥得1分;若都治愈或都未治愈則兩種藥均得0分.甲、乙兩種藥的治愈率分別記為α和β,一輪試驗中甲藥的得分記為X.(1)求X的分布列;(2)若甲藥、乙藥在試驗開始時都賦予4分,pi(i=0,1,…,8)表示“甲藥的累計得分為i時,最終認為甲藥比乙藥更有效”的概率,則p0=0,p8=1,pi=api1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=1),b=P(X=0),c=P(X=1).假設α=0.5,β=0.8.(ⅰ)證明:{pi+1pi}(i=0,1,2,…,7)為等比數列;(ⅱ)求p4,并根據p4的值來解釋這種試驗方案的合理性.【解析】(1)X的所有可能取值為1,0,1.P(X=1)=(1α)β,P(X=0)=αβ+(1α)(1β),P(X=1)=α(1β).所以X的分布列為X101P(1α)βαβ+(1α)(1β)α(1β)(2)(ⅰ)由(1)得a=0.4,b=0.5,c=0.1.因此pii1pii+1,故0.1(pi+1pi)=0.4(pipi1),即pi+1pi=4(pipi1).又因為p1p0=p1≠0,所以{pi+1pi}(i=0,1,2,…,7)為公比為4,首項為p1的等比數列.(ⅱ)由(ⅰ)可得p8=p8p7+p7p6+…+p1p0+p0=(p8p7)+(p7p6)+…+(p1p0)=48-1由于p8=1,故p1=34所以p4=(p4p3)+(p3p2)+(p2p1)+(p1p0)=44-13pp4表示最終認為甲藥更有效的概率.由計算結果可以看出,在甲藥治愈率為0.5,乙藥治愈率為0.8時,認為甲藥更有效的概率為p4=1257此時得出錯誤結論的概率非常小,說明這種試驗方案十分合理.思考:pi=api1+bpi+cpi+1(i=1,2,…,7)這個公式怎么來的?一維隨機游走模型:設數軸上一個點,它的位置只能位于整點處,在時刻t=0時,位于點x=i(i∈N+),下一個時刻,它將以概率α或者β(α,β∈(0,1),且α+β=1)向左或者向右平移一個單位.若記狀態Xt=i表示:在時刻t該點位于位置x=i(i∈N+),那么由全概率公式可得:
P(Xt+1=i)=P(Xt=i1)?P(Xt+1=i|Xt=i1)+P(Xt=i+1)?P(Xt+1=i|Xt=i+1)
另一方面,由于P(Xt+1=i|Xt=i+1)=α,P(Xt+1=i|Xt=i1)=β;
代入上式可得:Pi=α?Pi+1+β?Pi1
進一步,我們假設在x=0與x=m(m>0,m∈N+)處各有一個吸收壁,當點到達吸收壁時被吸收,不再游走.于是,P0=0,Pm=1.隨機游走模型是一個典型的馬爾科夫過程,進一步,若點在某個位置后有三種情況:向左平移一個單位,其概率為a,原地不動,其概率為b,向右平移一個單位,其概率為c,那么根據全概率公式可得:
pi=api+1+bpi+cpi1(2020·全國Ⅰ卷T19)甲、乙、丙三位同學進行羽毛球比賽,約定賽制如下:累計負兩場者被淘汰;比賽前抽簽決定首先比賽的兩人,另一人輪空;每場比賽的勝者與輪空者進行下一場比賽,負者下一場輪空,直至有一人被淘汰;當一人被淘汰后,剩余的兩人繼續比賽,直至其中一人被淘汰,另一人最終獲勝,比賽結束.經抽簽,甲、乙首先12(1)求甲連勝四場的概率;(2)求需要進行第五場比賽的概率;(3)求丙最終獲勝的概率.【解析】(1)甲連勝四場的概率為116(2)根據賽制,至少需要進行四場比賽,至多需要進行五場比賽.比賽四場結束,共有三種情況:甲連勝四場的概率為116;乙連勝四場的概率為1丙上場后連勝三場的概率為18.所以需要進行第五場比賽的概率為1(3)丙最終獲勝,有兩種情況:比賽四場結束且丙最終獲勝的概率為18比賽五場結束且丙最終獲勝,則從第二場開始的四場比賽按照丙的勝、負、輪空結果有三種情況:勝勝負勝,勝負空勝,負空勝勝,概率分別為116,18,18思考:這里主要研究第三問,事實上,本題是一個典型的馬爾可夫鏈模型,其具有馬爾可夫性質:即一個隨機過程在給定現在狀態及所有過去狀態情況下,其未來狀態的條件概率分布僅依賴于當前狀態.對于這種滿足馬爾科夫性質的隨機事件,其概率或者期望,采用馬爾科夫鏈公式,能夠極大地簡化計算.具體如下:(基本就是降維打擊)設第一輪比賽的負者最終獲勝概率為P1=,第一輪比賽的勝者與丙最終獲勝概率均為P2,故有P1+P2+P2=1,解得P2=.再來看兩個例子,①:甲、乙兩人輪流拋硬幣(質地均勻),約定甲先拋,誰先拋出正面獲勝,問甲獲勝的概率是多少?法一:數列通項求極限法二:概率遞推設甲最終獲勝概率為P,分兩種情況:第一種情況,第一輪甲拋出正面,概率為12第二種情況,第一輪甲拋出反面,概率為12,則相當于比賽重新進行,只是由乙先拋,根據對稱性可知此時乙獲勝概率為P,甲獲勝概率為1P.因此,我們有P=12+12(1P),②:(2017清華大學自主招生T12)投擲一枚質量均勻的硬幣,當出現兩次正面向上即停止,求總投擲次數的數學期望.法一:數學期望定義+函數與數列方法(需要無窮級數知識)記隨機變量X表示總投擲次數,下面計算P(X=k);總共投擲k次結束,說明第k次投擲的結果為正面,前k?1次中恰有一次為正面.不難利用古典概型推出,P(X=k)=(k?1)·.接下來使用無窮級數求和去解決極限收斂問題(需要一些極限知識)法二:采用數學期望性質+馬爾科夫鏈思路求解:設投擲硬幣直到出現兩次正面這件事為X.將這個事情分成兩件事:1.投擲硬幣,直到第一次出現正面,記此時投擲X1次;2.到第一次出現正面后,重新計算.投擲硬幣,直到再一次出現正面,記此時投擲X2次.投擲硬幣是一個獨立問題,這一次的正反不會影響后面投擲時的正反.因此不難得出E(X1)=E(X2)=2.(同樣的概率模型可以用在彩票上,如果說某個彩票的大獎的中獎率為1%,從理論上來說,買上100張彩票,就可以中一次大獎了,即E(ξ)=1p,p為一次試驗成功的概率由數學期望性質,得E(X)=E(X1)+E(X2)=4.思考:如果此題改為“投擲一枚質量均勻的硬幣,當出現連續兩次正面向上即停止,求總投擲次數的數學期望.”該如何解決?(2020·江蘇T23)甲口袋中裝有2個黑球和1個白球,乙口袋中裝有3個白球.現從甲、乙兩口袋中各任取一個球交換放入另一口袋,重復n次這樣的操作,記甲口袋中黑球個數為Xn,恰有2個黑球的概率為pn,恰有1個黑球的概率為qn.(1)求p1·q1和p2·q2;(2)求2pn+qn與2pn1+qn1的遞推關系式和Xn的數學期望E(Xn)(用n表示).(2023·新高考Ⅰ卷T21)甲、乙兩人投籃,每次由其中一人投籃,規則如下:若命中則此人繼續投籃,若末命中則換為對方投籃.無論之前投籃情況如何,甲每次投籃的命中率均為0.6,乙每次投籃的命中率均為0.8.由抽簽確定第1次投籃的人選,第1次投籃的人是甲、乙的概率各為0.5.(1)求第2次投籃的人是乙的概率;(2)求第i次投籃的人是甲的概率;(3)已知:若隨機變量Xi服從兩點分布,且,則.記前n次(即從第1次到第n次投籃)中甲投籃的次數為Y,求E(Y).(1)分類,第一次投籃是甲的話,到第二次投籃還是甲的轉移概率為0.6;第一次是乙的話,到第二次投籃還是乙的轉移概率為0.8,即
P(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版四年級下冊數學 福州市數學期末質量監測卷教案
- 三年級數學上冊 1 時、分、秒第2課時 時間的簡單計算教學設計 新人教版
- 店鋪培訓講課課件
- 人教部編版七年級上冊第七課 戰國時期的社會變化教案
- 茶葉種植技術培訓
- 九年級化學上冊 第七單元 燃料及其利用 實驗活動3 燃燒的條件教學設計(新版)新人教版
- 六年級語文下冊 第四單元 11 十六年前的回憶配套教學設計 新人教版
- 人教版九年級化學上冊同步教學設計:第三單元課題2 原子的結構(3課時)(3份打包)
- 五年級上冊科學教學設計-第七節 制作一個潛望鏡 教科版
- 初中湘教版1.4.1有理數的加法教案
- 廣東廣州市2025屆高考數學二模試卷含解析
- 2024年大學生心理健康教育考試題庫及答案(含各題型)
- 線切割每日點檢表A0
- 年產美甲貼100萬張新建項目環境影響報告表
- 信息時代的研究生 學習與創新能力培養
- 起重機防搖擺控制PPT課件
- 第十一章 地役權
- 西門子Siemens 840D參數詳解
- DLT 596-2021 電力設備預防性試驗規程
- 風機基礎土方開挖專項施工方案
- 詩歌朗誦《詩意中國》
評論
0/150
提交評論