




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一章隨機事件與概率§1.1隨機事件一、基本概念
1.隨機現(xiàn)象:預先不能斷定結(jié)果的現(xiàn)象(有多種結(jié)果)投擲硬幣、抽取牌張、觀察天氣、測量潮位、射擊目標、顧客到來、考試排座、交通事故
2.隨機試驗:對隨機事件進行實驗或觀察,簡稱試驗。有的是人為設(shè)置,有的是必須經(jīng)歷。
通常所指的試驗具有以下2個特征:
(1)可以重復進行;
(2)事先明確所有基本結(jié)果
3.隨機事件:試驗的某種結(jié)果,事前不能確定,事后可觀察到是否發(fā)生,簡稱事件(是個判斷句)以、、,…等表示。
例1教師任取一個學號(隨機),請對應的學生回答問題,站起來的可能“是男生”,“是女生”,“是戴眼鏡的學生”,“是穿紅衣服的學生”,“是高個子”,“是體重在60公斤以上的”“是叫張華的學生”——這些都是隨機事件。
4.基本事件:不能再分解的“最簡單”的事件,試驗中各種最基本的可能結(jié)果。
例2在52張撲克牌中,任取一張,=“抽到
”,=“抽到K”都是事件,其中可分解為13個最基本的結(jié)果,可分解為4個。
5.樣本點:即基本事件,記為。隨機事件是某些基本事件(樣本點)構(gòu)成的集合。
6.樣本空間:樣本點的全體,即全集,記為Ω。如投幣:Ω={正,反}抽牌:Ω=隨機事件都是樣本空間的子集。例1中抽到任何一張
,都認為已發(fā)生,類似地,抽到任何一張牌,都認為Ω已發(fā)生。7.必然事件:試驗中必然發(fā)生的事件,即Ω。如投幣:Ω=“正面朝上或反面朝上”。抽牌:Ω=“抽到一張牌”。8.不可能事件:試驗中不可能發(fā)生的事件,是一個空集,記為。如投幣:=“正面朝上且反面朝上”。抽牌:=“抽到一張電影票”。
例3在一批燈泡里,任取一只測試它的壽命(1000~3000小時):(1)試述一個事件;(2)指出一個樣本點;(3)指出樣本空間。二、事件的關(guān)系與運算
事件是集合,可以進行集合的運算,要求除了會用集合的語言表述外,還要會用事件的語言表述,并且著重于后者。
1.包含關(guān)系
(或)
集合語言:A中的樣本點,全在內(nèi)。
事件語言:若發(fā)生,則必發(fā)生。(如“抽到
”“抽到紅牌”)
2.相等關(guān)系
=(且):、是同一個事件。
3.事件的和
=+:、至少有一個發(fā)生(發(fā)生或發(fā)生)
如:“抽到紅牌”=“抽到
”+“抽到紅桃”
++:、、至少有一個發(fā)生。
4.事件的積
=:、同時發(fā)生(發(fā)生且發(fā)生)
5.互不相容事件(簡稱不相容)
若=,則稱、互不相容,即、不能同時發(fā)生
6.逆事件(對立事件):不發(fā)生顯然=(不相容)且+=(完備)
例4生產(chǎn)加工三個零件,表示第個零件實在正品
(1):沒有一個零件是次品,全是正品
(2):只有第一個是次品
(3)恰有一個是次品:++(是否等于?)
(4)至少有一個是次品:++(是否等于?)
事件的語言見P7的表格§1.2事件的概率一、古典概型概率即可能性大小:事件A的概率記為投幣時,出現(xiàn)正、反面的可能性相同,各為50%,故(正)=0.5,(反)=0.5若試驗滿足以下條件:(1)樣本空間中的元素(樣本點)有限:(2)基本事件發(fā)生的可能性相同:則稱之為古典概型,古典概型的概率很容易計算上節(jié)例1中抽到
和抽到K的概率分別是
(注)此處關(guān)心的是基本事件的個數(shù),而不是具體的哪些基本條件。
例1在52張撲克中,抽2張,“抽到的都是
”,求
解:這里樣本點總數(shù)是(注)同時抽兩張于無放回的先后抽2張,效果是一樣的(對不講次序的事件)有放回的抽取以后在分析例2從一批9個正品,3個次品的產(chǎn)品中,依次任取5件,求概率
(1)=“恰有兩件次品”,
(2)=“至少有一件次品”,
(3)=“至少有2件次品”(分為二件與三件次品的計算)
解:
二、概率的性質(zhì)
1.
2.,3.可加性(加法定理)
(點擊見圖1>>)
、不相容時,,
、、兩兩不相容時,
4.
5.若,則(單調(diào)性)三、概率的統(tǒng)計定義
1.古典概型的局限性
例如任選一人測量體重(樣本點無限)或投擲不均勻的股子(可能性不均等),都無法用古典概型計算概率,即使是古典概型,也有計算難以進行的時候。
2.概率的背景
說某人射擊命中目標的概率為0.7,這個0.7是怎么得來得呢?是來自于以往大量的射擊實踐,比如他曾有過100次射擊經(jīng)歷,其中命中70次,射擊次數(shù)越多,這個概率就越可靠。可見概率的背后有大量的試驗,這是支撐概率的條件。
3.統(tǒng)計規(guī)律
一般地,隨機現(xiàn)象在一次試驗中,無法斷言其結(jié)果,但經(jīng)過大量的試驗會呈現(xiàn)某種規(guī)律性(如頻率穩(wěn)定性),這叫做統(tǒng)計規(guī)律性。概率的實質(zhì)就是統(tǒng)計規(guī)律,可能性大小要與大量的試驗相聯(lián)系。
4.概率的統(tǒng)計定義
為了研究事件的概率,在相同的條件下,重復進行次試驗,若出現(xiàn)(發(fā)生)了次,則稱為事件的頻率。理論和試驗都表明,當充分大時,頻率具有穩(wěn)定性(穩(wěn)定于某個數(shù)值),因此定義:理論證明見第五章,實驗結(jié)果見P9表格,在這一定義下,概率的性質(zhì)依舊(證明略,自閱P8)。
5.概率的統(tǒng)計觀點
⑴從概率的來源看,概率取值需要有統(tǒng)計的支撐
如果一個從來未打過槍的人,聲稱他的命中率為0.7,那么他不是在吹牛,便是對概率一無所知,或者僅是開玩笑而已。類似的例子很多,比如“明天下雨的可能性是60%”,同樣一句話,出自于氣象部門,往往背后有大量的統(tǒng)計資料,而出自于其他人,則是一句不必負責任的空話、套話。⑵從概率值對實踐的指導意義看,也需要面對統(tǒng)計的過程
還是以射擊為例。命中率0.7,對于一次射擊意義不大,因為0.7不能保證命中,即使打不中,也不能否定這個0.7。概率等于0.7的意義在于:若做多次射擊,他將有70%左右的次數(shù)會擊中目標,反之,命中次數(shù)與70%差異很大就有理由懷疑這個0.7。
再以投幣為例,(正面)=0.5的依據(jù)是均勻,(等可能性),那么均勻的依據(jù)又是什么呢?正是(正面)=0.5(造幣廠沒有責任鑒定均勻性,也不必保證均勻性,兩面圖案不同,可以不均勻,因為投擲概率不是造幣的目的)。
6.小概率原理
當概率很大(超過0.9)或很小(小于0.1)時,對一次試驗是有指導意義的。可以認為小概率事件在一次試驗中基本上不會發(fā)生,這就是小概率原理。(試驗次數(shù)多時,就不適用了,概率再小,也有可能發(fā)生。比如飛機失事的報道很多,但是人們?nèi)匀幌蛲w機出行,又比如人們在做決策時,有90%以上的把握,都會斷言“不出意外的話肯定成功”不過應當指出的是:小概率原理不能保證沒有風險,以概率的觀點看問題,凡有隨機因素,便不可能有絕對的把握,對此要有清醒的認識。§1.3條件概率一、條件概率
例1袋中有3個紅球,2個白球,無放回地依次取2個
=“第一次取到紅球”,=“第二次取到紅球”
(1)=?(“兩次都抽到紅球”)
(2)已知第一次取到紅球,求第二次取到紅球的概率。(第二次取時為4個球,其中2個紅球)簡記為
(3)與不同,后者還要計算第一次取到紅球的機會,可以算得(計算過程不作要求,但不顯然)
一般是已知發(fā)生的條件下,發(fā)生的概率,稱為條件概率。本例中顯然
這是一般規(guī)律,同樣
二、乘法公式
將上面兩式改寫,即這就是乘法公式,可推廣到多個事件,以三個事件為例:
例2(1)52張撲克牌。依次取三張(無放回),求三張都是
的概率。
、、依次為第一、二、三次是
(2)一次性抽取三張,三張都是
的概率為這兩個概率是相同的。無放回的取K張與同時取K張,效果相同(對不講次序的結(jié)果)。
例3
已知
,,;
解:
,三、全概率公式
如圖(點擊見圖2>>),分為4塊,計算各塊的樣本點數(shù),不難得到
類似的有全概率公式:
若(1)兩兩互不相容,且
(2)(把分為n份);則不易直接求時有效,特別的當n=2時
例4設(shè)倉庫內(nèi)有10箱產(chǎn)品,分別來自于甲(5箱),乙(3箱),丙(2箱)廠,而三個廠的次品概率依次為,先任取一箱,再從中取一產(chǎn)品,求取得正品的概率解:=取得正品,=甲廠生產(chǎn),=乙廠生產(chǎn),=丙廠生產(chǎn),則
注意:做題目先要將事件,概率字母化,符號化,并加以明確。§1.4事件的獨立性一、兩個事件的獨立性
事件的發(fā)生與否不影響的概率(如燒香和下雨),可認為、是相互獨立的,即、
例1在52張牌中,有放回地抽取兩次,=“第一次是
”。=“第二次是K”則
說明:第二次仍面對52張牌。第三個概率用排列組合的乘法原理。顯然
定義:若,滿足上式,則稱、相互獨立,簡稱獨立。事件的獨立性可根據(jù)實際經(jīng)驗判斷。如:天氣好壞與學習成績,二人打槍各自的命中率。又:甲乙兩人上課講話(不獨立),前后兩次抽牌(無放回和有放回)。
,獨立,;
,;
,也相互獨立。
例2兩人射擊,甲射中概率0.9,乙射中概率0.8,各射一次,求目標被擊中的概率
解:=“甲中”,=“乙中”。“目標被擊中”=+,,獨立或者
二、多個事件的獨立性
若干事件相互獨立諸事件乘積的概率等于概率的乘積。對于三個事件、、C,相互獨立是指以下4個等式都成立,,,這些等式稱為獨立條件下的乘法公式
例3對目標進行三次射擊,命中率依次為0.4,0.5,0.7,求至少有一次命中的概率
解:設(shè)”第次命中”,以下計算太麻煩(展開有7項,4正,3負):另一種算法是:未擊中的概率所以
“三保險”,命中率大,提高系統(tǒng)的可靠性,有類似做法(P22例5)。三、強調(diào)幾個概念
(1)和不要混淆。
(2)獨立性和不相容性不要混淆(不影響與不相交)。
(3)有放回的抽樣是相互獨立的,無放回的取樣是不獨立的。當總數(shù)很龐大時,可認為近似獨立。(4)事件的獨立性是很普遍的現(xiàn)象,概率性質(zhì)簡單。第二章隨機變量及其概率分布§2.1離散型隨機變量及其分布律一.隨機變量
隨機試驗的結(jié)果往往表現(xiàn)為數(shù)量,如:擊中次數(shù)、潮位數(shù)值、投擲骰子,若不表現(xiàn)為數(shù)量,可使其數(shù)量化,如抽牌時,將牌張編號。
以X表示試驗的數(shù)值結(jié)果,則X是隨機變量。(解釋“隨機”)擲幣:X為“出現(xiàn)正面的次數(shù)”,X的可能取值為1、0。{X=1}=“正面朝上”,{X=0}=“反面朝上”,P{X=1}=P{X=1}=0.5抽牌:X為“抽得牌張編號“,X的可能取值為1,2,3,…,52。{14≤X≤26}=“抽到紅心”
隨機變量用大寫字母X、Y、Z等表示。隨機變量的取值或取值范圍表示隨機事件(隨機變量X本身不是事件)。二.離散型隨機變量
X的取值可以一一列出(有限或無限),則X是離散型的。設(shè)X的可能取值為Xk(k=1,2,…,n),若相應的概率P{X=xk}=pk都知道,則該隨機變量的規(guī)律就完全搞清楚了。X的規(guī)律是指①弄清可能取值②知道概率。寫成表格形式:Xx1x2…xk…pp1p2…pk…稱為分布律(分布列)。分布律應滿足以下條件(性質(zhì)):(1)
(2)
分別叫做概率的非負性和概率的完備性。
例1求的值,使X的分布律為
。
解:
(注):分布律可以列表,也可用公式表示。
例210件產(chǎn)品中,有3件次品,任取兩件,X是“抽得的次品數(shù)”,求分布律。
解:X可能取值為0,1,2,(這是關(guān)鍵步驟,常被忽視而致思維受阻)。概率分別為
分布律為X
0
1
2p
(注)求分布律,首先弄清X的確切含義及其所有可能取值。
例3有獎儲蓄,20萬戶為一開獎組,設(shè)特等獎20名,獎金4000元;一等獎120名,獎金400元;二等獎1200名,獎金40元;末等獎4萬名,獎金4元。求一戶得獎額X的分布律。
解:X的可能取值為4000,400,40,4,0(最后一值易漏),易求分布律X40004004040p0.00010.00060.0060.20.7933以下討論三種常見的分布:兩點分布、二項分布、泊松分布(名稱易混淆)三.兩點分布
X的可能取值僅兩點0和1,且P{X=1}=p,分布律為X
1
0p
p
q其中q=1-p,則稱X服從參數(shù)為p的兩點分布(0-1分布)。
例4袋中裝6只白球和4只紅球,任取一只,X為“取得白球數(shù)”,求X的分布律。
解:P{X=1}=0.6分布律為X
1
0p
0.4
0.6(注)任何隨機試驗都可與兩點分布相聯(lián)系:設(shè)A是試驗中某一事件,X是“一次試驗中A出現(xiàn)的次數(shù)”,若P(A)=p,則X的分布律為(X=0表示A未出現(xiàn))X
1
0p
p
q四.二項分布
1.貝努里試驗
將隨機試驗在相同條件下獨立地重復n次,觀察事件A出現(xiàn)的次數(shù),稱為貝努里試驗,或n重獨立試驗。如:射擊n次,中幾次?有放回的抽樣(抽牌、模球、取產(chǎn)品)。事件A出現(xiàn)k次的概率記為Pn(k)。
例5產(chǎn)品次品率為0.2,有放回地抽5次,求出現(xiàn)2次次品的概率。
解即求P5(2),出現(xiàn)次品為A,5次抽樣情況可以是
這樣的情況共有
種,互不相容,其概率都是0.22,0.83,所以
一般地,在貝努里試驗中,A出現(xiàn)的概率是p,q=1-p,則這種概率模型稱為貝努里概型。(點擊進入貝努里試驗動態(tài)模擬>>)
2.二項分布
X是n重獨立試驗中A事件出現(xiàn)的次數(shù),P(A)=p,則
()稱X服從參數(shù)為n,p的二項分布(或貝努里分布),記為X~B(n,p)。
例6產(chǎn)品次品率為10%,任意抽取5件樣品,求最多有2件次品的概率。
解:產(chǎn)品量很大時,不放回近似于放回,所以這是貝努里概型且p=10%=0.1,現(xiàn)在求P{X≤2}:(注)要重視應用二項分布的現(xiàn)成結(jié)論。常見的二項分布實際問題:
①有放回或總量大的無放回抽樣;
②打槍、投籃問題(試驗n次發(fā)生k次);
③設(shè)備使用、設(shè)備故障問題。
例7螺絲次品率為0.05,十個一包出售,多于一個次品可退貨,求退貨率。
解:螺絲量大,近似于有放回抽樣,次品數(shù)X~B(10,0.05),求P{X>1}。直接不易求,可先求不多于一個次品的概率(可以查表)。所以退貨率為1-0.9139=0.0861=8.6%。五.泊松分布(Poisson)
若X的可能取值為0,1,2,...,k,...(無窮)且(和為1),則稱X服從參數(shù)為的泊松分布,記為X~P(λ)。泊松分布來自于“排隊現(xiàn)象”,如某時間段內(nèi)的電話呼叫、紗線斷頭、顧客到來、車輛通過等。
當n很大時,二項分布近似于泊松分布,即
§2.2連續(xù)型隨機變量及其概率密度一.連續(xù)型隨機變量
1.概率密度
X的取值連成一片(成為一些區(qū)間),就是連續(xù)型隨機變量。如零件尺寸、電池壽命、降雨量等。P{a≤X≤b}是連續(xù)和,應是定積分(a,b)可不同,但被積函數(shù)相同)
(注意大、小寫勿相混)這里函數(shù)f(x)稱為隨機變量X的概率密度函數(shù),簡稱密度。密度f(x)決定了X的變化規(guī)律,不同的隨機變量有不同的密度。定積分的幾何意義是面積,所以概率的幾何意義是密度函數(shù)曲線下方的面積。
2.密度的性質(zhì)
連續(xù)型的概率非負性和概率完備性表現(xiàn)為(1);(2)
。
例1設(shè)下列函數(shù)是概率密度,求k及P{1≤X≤3},P{X≤1}解:由完備性(注意分段函數(shù)的積分處理)
3.單點概率這說明單點概率為零。概率為零的事件不一定是不可能事件。于是
進一步的考慮是當Δx很小時即單點概率是和密度函數(shù)值成正比的無窮小量。
4.概率的幾何意義表明概率的幾何意義是曲線y=f(x)下方的面積,并且整個曲線下方的面積等于1。又說明密度f(x)本身不是概率,但它表示各點概率(無窮小)之間的比例。(幾何意義點擊見圖3>>)以下討論三種常見的分布:均勻分布、指數(shù)分布、正態(tài)分布。二.均勻分布
各點的概率(比例)相同,即f(x)恒等于常數(shù)。若X的概率密度為則稱X服從區(qū)間[a,b]上的均勻分布,記為X~U(a,b)。均勻分布是最簡單的分布(圖形點擊見圖4>>)。問:(1)常數(shù)為何是區(qū)間長度的倒數(shù)?(2)均勻(概率)分布的概率如何簡單求得?三.指數(shù)分布
若X的密度為則稱X服從參數(shù)為λ的指數(shù)分布。顯然有指數(shù)分布也來自于“排隊現(xiàn)象”,與泊松分布緊密聯(lián)系。四.正態(tài)分布
最重要的分布,將在第四節(jié)著重討論。§2.3分布函數(shù)與函數(shù)的分布一.分布函數(shù)
1.概念
設(shè)X是隨機變量,x是一個數(shù),則P{X≤x}與x有關(guān)。稱F(x)=P{X≤x}為X的分布函數(shù)。F(x)是在區(qū)間(-∞,x]內(nèi)的“累積概率”,不要與單點概率混淆。
2.性質(zhì)
(1)
(2)
F(x)單調(diào)不減
(3)
(4)
這是累積概率之差額。可見利用分布函數(shù)計算概率很方便。
3.求法
對于離散型,F(xiàn)(x)是概率之和;對于連續(xù)型,F(xiàn)(x)是積分。計算公式分別是分布函數(shù)對于連續(xù)型隨機變量比較有用。F(x)連續(xù),且F'(x)=f(x)在連續(xù)點成立。
例1設(shè)X~U(a,b)(均勻分布)求分布函數(shù)F(x)。
解:當x∈(a,b)時,利用概率的幾何意義(面積)得
F(x)的圖形連續(xù),尖點處無導數(shù),恰為f(x)的間斷點(圖形點擊見圖5>>)。二.函數(shù)的分布
已知X的分布,求Y=g(X)的分布。如動能對速度Y=mX2∕2,面積對半徑Y(jié)=πX2。
1.X為離散型隨機變量。
例2已知X的分布律如下,求Y=X2的分布律。X-10125p0.10.3
解:事件{Y=4}={X=2},概率也相等,但{Y=1}={X=±1},所以Y01425p0.3即Y=g(X)的可能取值為概率不變。
2.X為連續(xù)型隨機變量
已知X的分布密度為fX(x),求Y=g(X)的密度fY()。先要求出Y的分布函數(shù),
(與y有關(guān)),再通過求導得到
,由于計算比較復雜,此處從略。第三章隨機變量的數(shù)字特征分布律和概率密度描述了隨機變量的全貌(完整性),但還可以用幾個數(shù)字來說明隨機變量的“概況”。在許多情況下知道概狀已足夠了,而且更有利。如全國人口平均年齡與13億人年齡的大表(數(shù)萬本)。§3.1數(shù)學期望一.數(shù)學期望的概念與計算公式
例1某工人工作水平為:全天不出廢品的日子占30%,出一個廢品的日子占40%,出二個廢品占20%,出三個廢品占10%。
(1)設(shè)X為一天中的廢品數(shù),求X的分布律;
(2)這個工人平均每天出幾個廢品?
解:(1)分布律X0123p0.1
(2)考慮工作1000天,其中約300天不出廢品,400天中各出一個,200天中出二個,100天中出三個,平均廢品數(shù)
=0×0.3+1×0.4+2×0.2+3×0.1=1.1(個/天)
數(shù)學期望,即隨機變量X取值的平均數(shù)(加權(quán)平均),記為E(X)(是一個實數(shù),不是隨機變量)。
離散型:分布律為P{X=xk}=pk(k=1,2,…)時即兩兩相乘再相加(無窮級數(shù)絕對收斂)。
連續(xù)型:概率密度為f(x)時,以單點概率f(x)dx代替pk,去掉下標,和號改為積分即有
例2甲、乙兩人廢品數(shù)的分布如下。在產(chǎn)量相同時,哪個技術(shù)高?甲
X0123乙Y0123
p0.2p0
解:E(X)=0+0.3+0.4+0.6=1.3,
E(Y)=0+0.5+0.4+0=0.9,說明乙的技術(shù)好。
從本例看出,數(shù)學期望是評價隨機變量的一個重要指標,數(shù)學期望簡稱為期望或均值。二.常見分布的數(shù)學期望
1.兩點分布
X
1
0
p
p
1-p
2.二項分布這一推導比較難懂,比較復雜,記住結(jié)論,還有更好的推導。
3.泊松分布(推導略)
4.均勻分布
5.指數(shù)分布(推導略)
6、正態(tài)分布
積分中運用了積分換元和對稱性,最后的等號用到了概率積分。正態(tài)分布的前一個參數(shù)是它的均值。三.數(shù)學期望的性質(zhì)
1.C為常數(shù)時,E(C)=C;
2.E(CX
)=CE(X)(常數(shù)提取);
3.E(X+Y)=E(X)+E(Y);
4.若X,Y相互獨立,則E(XY)=E(X)E(Y)(注意前提條件——獨立:X,Y的取值相互獨立)。
例3計算二項分布X~B(n,p)的數(shù)學期望。
解:X是n次獨立試驗中A事件出現(xiàn)的次數(shù)。引入隨機變量Xi是第i次試驗中A出現(xiàn)的次數(shù)(取0或1),顯然這里Xi均服從兩點分布,故
,
這是數(shù)理統(tǒng)計中常用的方法,應熟悉這一方法。
例4傳染病患病率約為10%,對1000名師生抽血化驗,采用二種方案(1)逐個化驗;(2)4個人一組(分250組)抽血化驗,有問題再逐個化驗。試比較兩個方案的化驗次數(shù)。
解:方案(1)要化驗1000次。方案(2)的次數(shù)是隨機變量,設(shè)Xi表示第i組化驗的次數(shù)(i=1,2,…,250),則總的化驗次數(shù)X是所有Xi之和。顯然Xi分布律相同均為P{Xi=1}=0.94,P{Xi=5}=1-0.94,則這里E(X)=594次應理解為“期望次數(shù)”(樣本大,期望可達)。四.隨機變量函數(shù)的數(shù)學期望
1、一維函數(shù)
已知X的分布,求Y=g(X)的分布較困難(連續(xù)型要通過分布函數(shù)),但求E(Y)是否能簡單些呢?
(1)離散型
設(shè)X的分布為P{X=xk}=pk(k=1,2,…),則Y=g(X)的分布律為P{Y=g(xk)}=pk于是這是E(X)計算公式的推廣。
(2)連續(xù)型
設(shè)X的密度為f(x),在上述離散型計算公式中,將pk換成單點概率f(x)dx,略去下標,和號改為積分,可得這也是E(X)計算公式的推廣。
例3設(shè)X~U(0,a),求Y=kX2(k>0)的數(shù)學期望。
解:§3.2方差一.方差的概念與計算公式
例1兩人的5次測驗成績?nèi)缦拢?/p>
X:50,100,100,60,50
E(X)=72;
Y:73,70,75,72,70
E(Y)=72。平均成績相同,但X不穩(wěn)定,對平均值的偏離大。
方差描述隨機變量對于數(shù)學期望的偏離程度。單個偏離是
消除符號影響方差即偏離平方的均值,記為D(X):直接計算公式分離散型和連續(xù)型,具體為:這里是一個數(shù)。推導另一種計算公式得到:“方差等于平方的均值減去均值的平方”,即
,其中分別為離散型和連續(xù)型計算公式。稱為標準差或均方差,方差描述波動程度。二.方差的性質(zhì)
1.設(shè)C為常數(shù),則D(C)=0(常數(shù)無波動);
2.D(CX)=C2D(X)(常數(shù)平方提取);
證:特別地
D(-X)=D(X),D(-2X)=4D(X)(方差無負值)
3.若X、Y相互獨立,則
證:記
則前面兩項恰為D(X)和D(Y),第三項展開后為當X、Y相互獨立時,
,故第三項為零。特別地獨立前提的逐項求和,可推廣到有限項。三.常用分布的方差
1.兩點分布
2.二項分布X~B(n,p)引入隨機變量Xi(第i次試驗中A出現(xiàn)的次數(shù),服從兩點分布),
3.泊松分布(推導略)
4.均勻分布
另一計算過程為
5.指數(shù)分布(推導略)
6.正態(tài)分布(推導略)~正態(tài)分布的后一參數(shù)反映它與均值的偏離程度,即波動程度(隨機波動),這與圖形的特征是相符的。
例2求上節(jié)例2的方差。
解根據(jù)上節(jié)例2給出的分布律,計算得到工人乙廢品數(shù)少,波動也小,穩(wěn)定性好。第四章數(shù)理統(tǒng)計§4.1樣本與統(tǒng)計量一.總體與樣本
例1欲了解一批燈泡的壽命X(小時)的分布情況,只能抽取n個作破壞性試驗,根據(jù)試驗結(jié)果來推斷X的分布。
1.總體
研究對象的全體稱為總體。例1中,我們關(guān)心的是全體燈泡壽命的分布情況,即壽命X的所有可能的取值及其概率分布。因此壽命X是連續(xù)的隨機變量。一般地把我們關(guān)心的隨機變量X稱為總體。
2.個體
組成總體的每個單元稱為個體。例1中,我們關(guān)心的是燈泡的壽命。所以個體也可理解為總體X的取值。
3.簡單隨機抽樣
為了使抽樣具有充分的代表性,所以要求:
(1)每個個體被抽到的機會均等;
(2)每次抽取是獨立的(共抽取n次)。
這樣的抽樣叫做簡單隨機抽樣。通常的抽樣都是無放回的,當總體很大時,可以滿足獨立性。
4.樣本
在總體中抽取n個個體,稱為總體的一個樣本,記為(X1,X2,...,Xn),其中每次抽樣Xi(i=1,2,...
,n)也都是隨機變量(解釋),共n個隨機變量,加上括號,表示樣本是一個整體。
5.樣本的容量
抽取的個體數(shù)n,稱為樣本的容量。
6.獨立同分布
每次抽取的Xi來自總體,應該與總體X有相同的分布(概率密度相同),所以說樣本是一組具有獨立同分布的隨機變量。
7.樣本觀察值(樣本值)
樣本的測試結(jié)果記為(x1,x2,...,xn),是一組數(shù)據(jù),在容易產(chǎn)生誤會時,大小寫要分清,尤其在作理論分析時,一般都取大寫,作為隨機變量處理。二.統(tǒng)計量
1.三個重要統(tǒng)計量(1)樣本均值:(2)樣本方差:(3)樣本標準差(又稱為樣本均方差):
其中作為均值可以反映總體X的均值(不是等同),S2是數(shù)據(jù)與均值偏離值平方的平均,體現(xiàn)樣本的離散程度,因而可以反映總體X的方差。和s(計算值)可以利用函數(shù)計算器的統(tǒng)計功能快速得到。
2.統(tǒng)計量的概念
統(tǒng)計量是含有樣本X1,X2,...,Xn的一個數(shù)學表達式,并且式中不含未知參數(shù),因而可以在得到樣本值后立即算出它的數(shù)值來。在抽樣之前,統(tǒng)計量的值無法確定,抽樣測試之后,可以觀察到它的取值,因此統(tǒng)計量是隨機變量,是由樣本派生出來的隨機變量。三.抽樣分布
統(tǒng)計量既然是隨機變量,當然有它的概率分布,稱為抽樣分布。以下僅給出結(jié)論,結(jié)論都對正態(tài)總體而言。
1.樣本均值的分布
(1)若總體,則
(獨立同分布),于是作為線性函數(shù)(2)特別地,標準化以后,得
2.t分布
當總體標準差未知時,U不再是統(tǒng)計量,這時可用樣本標準差S代替,但不再是正態(tài)分布,而是一種新的分布叫做服從于自由度的t分布。它的密度曲線與正態(tài)曲線相類似(點擊見圖8>>)。
3.分布
為了將樣本方差S2和總體相比較、聯(lián)系。構(gòu)造出叫做服從于自由度的分布,也是一種新的分布。其密度曲線在原點右側(cè),這是因為統(tǒng)計量是不會出現(xiàn)負值的(圖形點擊見圖9>>)。
、、是繼、、后第二輪復合而成的統(tǒng)計量,可以更有利于實際的應用。四.臨界值
設(shè)U~N(0,1),有關(guān)U的概率可查表。如果反過來,已知概率,求使
或
,倒查表得到的稱為標準正態(tài)分布的右側(cè)臨界值,意為右側(cè)的概率為,又叫分位點,記為.(示意圖形點擊見圖10>>)若求使則查表得到的是稱為雙側(cè)臨界值(示意圖形點擊見圖11>>),意為對稱兩側(cè)的概率之和為,它們的概率意義分別是
和
比如U0.05=1.645,U0.025=1.96。
t分布和分布的右側(cè)臨界值記為和。括號內(nèi)的n是自由度,不要與樣本容量相混淆,如,的概率意義為,(幾何意義點擊見圖12>>,圖13>>)
t分布表和分布表已直接編為臨界值表,不必“倒查表”。正態(tài)分布和t分布的左側(cè)臨界值是對稱值和(左側(cè)概率為),不必另行查表,而分布無對稱性,左側(cè)臨界值是(點擊見圖14>>)(右側(cè)概率是,左側(cè)概率當然是),需另行查表。
分布的雙側(cè)臨界值是(左)和(右)(幾何意義點擊見圖15>>)。
例2求滿足以下概率式的臨界值并給出對應的記號
(1),則;
(2),則;
(3),則;
(4),則;
(5),則。
例3對于查表得到的和,給出它們的概率意義。
解:,,,,。§4.2參數(shù)估計一.點估計
1.點估計的概念
總體X的分布類型往往是已知的,如,但它的參數(shù)不知道,要通過樣本來估計,稱為點估計。
2.樣本數(shù)字特征法
用樣本的均值、方差來估計總體的均值、方差是很自然的,即這里在字母上加一個“帽子”是為了表明這僅僅是估計值而非準確值。這樣的估計方法稱為樣本數(shù)字特征法。
例1某果園有1000株果樹,在采摘前欲估計果樹的產(chǎn)量,隨機抽選了10株,產(chǎn)量(公斤)分別為:161,68,45,102,38,87,100,92,76,90假設(shè)果樹的產(chǎn)量服從正態(tài)分布,試求果樹產(chǎn)量的均值與標準差的估計值,并估計一株果樹產(chǎn)量超過100公斤
解:利用計算器的統(tǒng)計功能,可計算得到產(chǎn)量均值公斤,標準差公斤。于是即一株果樹產(chǎn)量超過100公斤的概率為0.34
3.估計量及其評選標準
用來估計未知參數(shù)的統(tǒng)計量(如,)稱為估計量。一般的提法是:設(shè)是總體X的未知參數(shù),找一個統(tǒng)計量(表達式)來估計,即以的觀測值作為的估計值,則稱為的估計量。這里是未知的但客觀存在的固定常數(shù),不是隨機變量,而是隨樣本值而變動的,是隨機變量。估計量不是唯一的,可以通過多種途徑和方法去尋找、構(gòu)造,如矩估計法、最大似然估計法等,應該制定一套評判標準來評價它們的優(yōu)劣。(1)無偏性
設(shè)是的估計值,若,則稱是的無偏估計量。其統(tǒng)計意義是:是隨機變量,它的波動中心(均值)等于,即經(jīng)過多次抽樣,的觀察值將圍繞著變動,沒有“系統(tǒng)”誤差,當然是較好的。
和S2都分別是總體均值,總體方差的無偏估計,其中顯然,而的推導復雜,S2的表達式中,分母是而不是n,正是為了滿足無偏性。(2)有效性
對于多個無偏估計量,方差小的波動小,穩(wěn)定性好。即方差越小越好,設(shè)(都是無偏估計),若,則稱比有效。是的所有無偏估計中最有效的。二.區(qū)間估計1.置信度與置信區(qū)間
有了點估計,還要進一步作誤差估計,數(shù)理統(tǒng)計中的誤差估計必然具有概率特征,即要用概率去描述,要與概率相聯(lián)系。設(shè)是未知參數(shù),希望確定一個區(qū)間(a,b),使它包含的把握很大,寫成概率式,即
取時,把握是0.95%。往往事先取定,稱為置信度。(a,b)
稱為參數(shù)的置信區(qū)間,稱為置信下限,稱為置信上限。
2.置信區(qū)間的求法
直接求置信區(qū)間難度較大,實際求解時,往往從已知的統(tǒng)計量入手。比如統(tǒng)計量分布已知,如果總體標準差已知,那么關(guān)于U的不等式變形可得到關(guān)于的不等式,所以只需求A,B,使即可。滿足此式的區(qū)間很多,其中“區(qū)間居中”是效果最好的,所謂“區(qū)間居中”是指區(qū)間左側(cè)和右側(cè)的概率相等,都等于。因為正態(tài)分布有對稱性,區(qū)間居中的概率公式是
于是可確定,將不等式變形可得(1)正態(tài)總體方差已知時,均值的置信區(qū)間按上面的公式,置信區(qū)間是注意:已知時,應借助于U統(tǒng)計量,要查正態(tài)分布表;置信區(qū)間有兩個端點,所以要找雙側(cè)臨界值(下標帶有)
例2設(shè)總體測得n=4的樣本觀測值為:12.6,13.4,12.8,13.2,求的0.95置信區(qū)間。
解,已知,采用U統(tǒng)計量,查表得U0.025=1.96,計算,所以置信限為置信區(qū)間為(12.706,13.294)。
(2)正態(tài)總體方差未知時,均值的置信區(qū)間未知,以S代替,得到的是t統(tǒng)計量,要查t分布表;置信區(qū)間公式相類似,為
例3例2中設(shè)
,未知,求的置信區(qū)間(取)。
解:計算得,。未知,采用t統(tǒng)計量,查表得t0.025(4-1)=3.1824,所以置信限為置信區(qū)間為(12.419,13.581)。例3的信息量比例2少(未知),在同樣的置信度下置信區(qū)間比較寬,精度比較小是很自然的。
(3)正態(tài)總體方差及標準差的置信區(qū)間
統(tǒng)計量就是為提取的信息而設(shè)計的,所以借助于統(tǒng)計量,由概率式
及區(qū)間居中原理。可得,
,利用不等式變形,得到的置信區(qū)間是
的置信區(qū)間,只需將端點開平方即可
例4設(shè)零件長度(mm)抽取n=16件零件測量,經(jīng)計算得,,求零件長度與標準差的置信區(qū)間()。
解未知,求的置信區(qū)間應采用統(tǒng)計量,查表得t0.025(15)=2.1315,置信限為均值的置信區(qū)間為(12.049,12.125)。求的置信區(qū)間,采用統(tǒng)計量,查表得,,的置信區(qū)間為開方后即標準差的置信區(qū)間:(0.0526,0.1102)
3.置信度的選擇
對于同一個樣本,信息量是固定的,于是會出現(xiàn)“有得必有失”的局面:如果提高置信度,就會降低估計精度(置信區(qū)間變寬);反之,想提高估計精度,就需降低置信度。如果希望兩者都提高,則只有增加樣本容量,即增加信息量。
前面提到的“區(qū)間居中”效果最好,指的是在同一個樣本,同一個置信度之下,區(qū)間居中可得到最窄的置信區(qū)間。在做區(qū)間估計時,首先要選擇合適的統(tǒng)計量(三種情形),這不僅關(guān)系到查哪一張表,用哪一個置信區(qū)間公式的問題,還為下一節(jié)學習假設(shè)檢驗打下必要的基礎(chǔ)。§4.3假設(shè)檢驗一.原假設(shè)與拒絕域
例1自動包裝機裝箱,箱重額定標準每箱重公斤,某日開工后,隨機抽取n=10箱,稱得它們的重量(公斤)為:99.3,98.9,101.0,99.6,98.7,102.2,100.8,99.8,100.9,問包裝機工作是否正常?(已知總體標準差公斤)
1.原假設(shè)
本例實際上是檢驗結(jié)論是否成立。H0代表一個結(jié)論,一句話,便于簡稱。通常先假設(shè)H0為真,然后考慮拒絕還是接受H0。H0叫做原假設(shè),解決這類問題叫做假設(shè)檢驗。
2.臨界值
總體期望未知,可用近似代替(計算值是),但因隨機波動,不能以來否定H0,只有當誤差大到一定程度,才能認為效應顯著而否定H0,這里的“一定程度”要用概率的觀點來描述:一旦認定顯著(拒絕H0),要有很大的把握,犯錯誤的概率很小,即H0成立時是事先設(shè)定的數(shù),比如。由于已知,所以上述概率式等同于
當H0成立時,統(tǒng)計量分布已知,可查表得到這樣,“一定程度”就確定下來了,它正是標準正態(tài)分布的雙側(cè)臨界值。
3.拒絕域
確定了臨界值后,不等式就成為拒絕還是接受原假設(shè)H0的判斷依據(jù),因而稱為拒絕域。當統(tǒng)計量U的計算值落入拒絕域,便拒絕H0,否則接受H0
。特別提醒:拒絕域與原假設(shè)呈相反的形態(tài),為了更好地體現(xiàn)這一點,往往需要附上與H0相反的結(jié)論H1,稱為備擇假設(shè)。例1的備擇假設(shè)是:二.假設(shè)檢驗的一般步驟
(1)根據(jù)實際問題的特性,認定檢驗的對象(還是),建立原假設(shè)和備擇假設(shè);
(2)選擇一個與檢驗對象相聯(lián)系的統(tǒng)計量(參照區(qū)間估計),找出與之相對應的臨界值表;
(3)寫出拒絕域的形式,雙側(cè)檢驗(參看H0
或H1
)含兩個不等式,單側(cè)檢驗含一個不等式,拒絕域的不等式方向與備擇假設(shè)H1呈相同形態(tài),查臨界值表確定拒絕域的端點;
(4)計算統(tǒng)計量的值,視其是否落入拒絕域而決定拒絕還是接受原假設(shè)H0。
按此步驟,例1的求解過程如下:(1)檢驗假設(shè),:;(2)當H0成立時,;
(3)拒絕域,取,查表得;
(4)計算
,
,因為,所以接受H0
,即認為包裝機工作正常(未見異常)。
例2在例1中,若未知,檢驗包裝機工作是否正常。(取)未知,應以樣本標準差S代替總體標準差,因而選擇t統(tǒng)計量。
解:(1)檢驗假設(shè),:;
(2)H0成立時,
(3)拒絕域查表得
;
(4)計算
,
,因為,所以接受H0,即認為包裝機工作正常。三.正態(tài)分布的均值與方差的假設(shè)檢驗
1.統(tǒng)計量的選擇若總體~,則統(tǒng)計量有三種不同的選擇:
(1)已知,對的檢驗,選用
(2)未知,對的檢驗,選用
(3)對(或)的檢驗,選用在統(tǒng)計學中,這三種檢驗分別稱作檢驗,檢驗和檢驗。
例3某種電子元件的壽命服從正態(tài)分布,要求其標準差不超過小時,現(xiàn)取25只,測量后算得小時,小時,問這批元件是否合格(取)?
解(1)檢驗假設(shè),;
(2)選擇統(tǒng)計量
(3)拒絕域,查表得單側(cè)臨界值;
(4)計算因為31.106<36.415,所以接受H0,即認為這批元件的標準差沒有明顯超標。
2.雙側(cè)檢驗與單側(cè)檢驗
例3中,原假設(shè)H0和備擇假設(shè)H1都以不等式給出,所以是單側(cè)檢驗,拒絕域含一個不等式,且與有相同的形態(tài),查表得到的是單側(cè)臨界值。H0以等式給出的檢驗是雙側(cè)檢驗,拒絕域含二個不等式:如
即
和按照雙側(cè)還是單側(cè)檢驗,原假設(shè)可以有六種情況,如下表:檢驗類型拒絕域檢驗或檢驗或檢驗或檢驗或檢驗或檢驗或檢驗和檢驗檢驗
例4設(shè)木材的小頭直徑
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025購車合同樣本范本
- 2025年拒絕政府采購合同的法律責任分析
- 房地產(chǎn)買賣補充合同范本
- 車庫轉(zhuǎn)讓協(xié)議
- 2025《中央商務區(qū)B區(qū)基礎(chǔ)設(shè)施建設(shè)與管理承包合同》
- 產(chǎn)品購銷合同范本
- 2025版合同:國內(nèi)勞務合同
- 2025城區(qū)商場餐飲服務承包合同
- 廣州南沙就業(yè)協(xié)議書
- 肇慶學院《巖土工程設(shè)計》2023-2024學年第一學期期末試卷
- 2024上海市招聘社區(qū)工作者考試題及參考答案
- 機器設(shè)備評估常用數(shù)據(jù)及參數(shù)(最新)
- 叉車日常維護保養(yǎng)檢查記錄表
- 東風汽車特約店培訓資料-WDMS維修系統(tǒng)培訓管理(PPT 131頁)
- Q∕GDW 12070-2020 配電網(wǎng)工程標準化設(shè)計圖元規(guī)范
- 汽車半懸掛系統(tǒng)建模與分析(現(xiàn)代控制理論大作業(yè))
- 小學語文人教課標版(部編)三年級下冊習作:我做了一項小實驗
- 畢業(yè)設(shè)計論文土木工程專業(yè)五層單身宿舍樓框架結(jié)構(gòu)設(shè)計
- 立式水輪發(fā)電機軸線分析及處理
- 蹲踞式起跑PPT
- 1云南省初中綜合素質(zhì),完整版綜合素質(zhì)評定表
評論
0/150
提交評論