概率統計基礎知識_第1頁
概率統計基礎知識_第2頁
概率統計基礎知識_第3頁
概率統計基礎知識_第4頁
概率統計基礎知識_第5頁
已閱讀5頁,還剩56頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章

概率統計基礎知識

北京理工大學珠海學院吳浩然第一頁,共62頁。第一章概率統計基礎知識概率基礎知識1隨機變量及其分布2統計基礎知識3參數估計4假設檢驗5第二頁,共62頁。

第一節概率基礎知識事件與概率1概率的古典定義與統計定義2概率的性質及其運算法則3第三頁,共62頁。1.事件與概率確定性現象隨機現象在一定條件下必然會發生的現象。【如】:水100oC沸騰。在一定條件下,并不總是出現相同結果的現象。【如】:(1)擲一枚硬幣,出現正面或反面?(2)一批產品中,不合格品的數量;(3)機械加工中出現的誤差;第四頁,共62頁。樣本空間隨機現象一切可能結果(樣本點)構成的全體,稱為樣本空間。【如】:(1)擲一枚硬幣。={正面,反面};(2)一批產品中,不合格品的數量。={0,1,2,3,…};第五頁,共62頁。隨機事件隨機現象的某些樣本點構成的集合,稱為事件,用大寫英文字母A、B、…、表示。表示。【如】:(1)擲一顆骰子,出現奇數點。

A={1,3,5};第六頁,共62頁。事件之間的關系及運算若事件A發生必然導致事件B發生,則稱事件B包含事件A,記作。用圖形表示為:事件的包含AB擲一顆骰子,A表示點數為1,B表示點數小于3,則。例如第七頁,共62頁。若且,則稱事件B與事件A相等,記作。事件的相等擲一顆骰子,A表示點數小于3,B表示點數為1或2,則。例如第八頁,共62頁。若事件A與事件B同時發生,則為事件A與事件B的交,記作。用圖形表示:事件的交擲一顆骰子,A表示點數為1、2或3,B表示點數為1、3或5,則 表示點數為1或3。例如BA第九頁,共62頁。兩個事件A,B中至少有一個發生,即“A或B”是一個事件,稱為A與B的并(和),記作。用圖形表示:事件的并A={1,2,3},B={1,3,5},則={1,2,3,5}。例如AB第十頁,共62頁。事件的差事件A發生而事件B不發生,稱為A與B的差,記作A-B

。用圖形表示:ABA={1,2,3},B={1,3,5},則A-B={2},例如第十一頁,共62頁。概率事件A發生可能性的數量指標,以P(A)表示。【如】:1.如果一個骰子是公平的,則擲一次骰子會以等可能(概率1/6,6種可能之一)得到1至6點的中的每一個點。2.拋一個公平的硬幣,則以等可能(概率1/2)出現正面或反面。定義第十二頁,共62頁。2.概率的古典定義與統計定義利用等可能事件,P(A)=k/n,其中k為事件A的樣本點數目,n為的樣本點數目。【如】:1.如果一個骰子是公平的,則擲一次骰子會以等可能(概率1/6,6種可能之一)得到1至6點的中的每一個點。2.拋一個公平的硬幣,則以等可能(概率1/2)出現正面或反面。概率的古典定義第十三頁,共62頁。

性質;;;;;3.概率的性質及其運算法則第十五頁,共62頁。條件概率及概率的乘法法則在事件B已發生的條件下,事件A發生的概率,稱為事件A在給定B下的條件概率,記作P(A|B)。其中:P(A|B)=條件概率擲一顆骰子,事件A表示點數為3,事件B表示點數為6,則P(A|B)表示第一次骰子的點數為6,第二次點數為3的概率。例如第十六頁,共62頁。獨立性和獨立事件的概率如果事件A和事件B有如下關系:則稱事件A和事件B相互獨立。定義如果你有一個固定電話和一個手機,假定固定電話出毛病的概率為,而手機出問題的概率為,則,兩個電話同時出毛病的概率是多少呢?例如第十七頁,共62頁。

第二節隨機變量及其分布隨機變量1隨機變量的分布2隨機變量分布的均值、方差3常用分布及中心極限定理4第十八頁,共62頁。1.隨機變量表示隨機現象各種結果的變量,一般大寫英文字母X、Y、Z表示。隨機變量拋一枚硬幣,X表示正面出現的次數,它是隨機變量,可取0或1兩個值。例如第十九頁,共62頁。2.隨機變量的分布隨機變量取一切可能值的概率稱為概率分布(probabilitydistribution),簡稱分布。概率分布可以用各種圖或表來表示;一些可以用公式來表示。定義擲一顆骰子,隨機變量X表示出現的點數,X可取1、2、3、4、5和6六個值,則X的分布為:X123456

P1/61/61/61/61/61/6例如第二十頁,共62頁。離散型隨機變量的分布如果隨機變量X只取有限個或可列個可能值,而且以確定的概率取這些不同的值,則稱X為離散型隨機變量。一般列成概率分布表:

X

x1x2…xk

…Pp1p2…pk

定義1.2.性質第二十一頁,共62頁。一批產品的廢品率為5%,從中任意抽取一個進行檢驗,用隨機變量描述廢品出現的情況。解:用X

=1表示產品為廢品,X

=0表示產品為合格品。則:

X

0

1

P例如第二十二頁,共62頁。連續型隨機變量的分布隨機變量X如果能夠在一區間內取任何值,則該變量稱為在此區間內是連續的,其分布稱為連續型概率分布,用密度函數表示。定義第二十三頁,共62頁。逐漸增加矩形條數目的直方圖和一個形狀類似的密度曲線。第二十四頁,共62頁。3.隨機變量分布的均值、方差均值用來表示分布的中心位置,用表示。其中如:

X

0

1

P均值,離散分布,連續分布第二十五頁,共62頁。方差用來表示分布的離散程度,用表示。其中如:

X

0

1

P方差,離散分布,連續分布第二十六頁,共62頁。(1)(2)(3)(4)均值、方差的性質第二十七頁,共62頁。4.常見的離散分布如果隨機變量X的密度函數為:X

0

1

Pp1-p則稱隨機變量X服從二項分布,記為:其均值、方差分別為:、二項分布1.每一個進入某商場的顧客是否購買某商品;2.每一個新出嬰兒的性別;應用第二十八頁,共62頁。如果隨機變量X取

x的概率為:

則稱隨機變量X服從泊松分布,記為:其均值、方差分別為:、泊松分布1.在一定時間內,操作系統發生的故障數;2.一平方米玻璃上氣泡的個數;應用第二十九頁,共62頁。常見的連續分布如果隨機變量X的密度函數為:則稱隨機變量X服從正態分布(normaldistribution),記為:正態分布第三十頁,共62頁。正態分布的曲線及性質(1)標準差不變,不同的均值,正態分布曲線的形狀相同,位置不同;均值不變,不同的標準差,正態分布曲線的位置相同,形狀不同;(2)(3)正態分布曲線第三十一頁,共62頁。其它連續分布如果隨機變量X的密度函數為:則稱隨機變量X服從均勻分布,記為:其均值、方差分別為:均勻分布均勻分布密度函數曲線第三十二頁,共62頁。如果隨機變量X的密度函數為:則稱隨機變量X服從指數分布,記為:其均值、方差分別為:指數分布指數分布的密度函數曲線(0,0)第三十三頁,共62頁。中心極限定理

不論總體服從何種分布,只要樣本容量足夠大,樣本均值的分布都大致服從正態分布:第三十四頁,共62頁。

第三節統計基礎知識總體與樣本1直方圖2統計量3抽樣分布4第三十五頁,共62頁。1.總體與樣本總體:研究對象的全體;個體:構成總體的每個單位;總體與個體某飲料生產企業用自動罐裝機罐裝飲料,每罐標準含量為500ml,為保證產品的穩定性,需要每隔一定時間檢查每罐飲料的含量情況。總體:某一批飲料;個體:該批中每一罐飲料;例如第三十六頁,共62頁。從總體中抽取部分個體所組成的集合。如:某飲料生產企業用自動罐裝機罐裝橙汁飲料,每罐標準含量為500ml,為保證產品的穩定性,需要每隔一定時間檢查每罐飲料的含量情況。現抽得10罐,測得其含量為(單位:ml)495,510,498,503,492,502,505,512,497,506。樣本:10罐飲料的含量。樣本第三十七頁,共62頁。2.直方圖2007年某地區農村居民家庭純收入數據按純收入分組(元)戶數比重(%)500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94頻數(頻率)表第三十八頁,共62頁。2007年某地區農村居民家庭純收入1000500←15002000250030003500400045005000→結論:收入較少的家庭占據多數,而收入較高的家庭則占少數。

純收入(元)252015105戶數比重(%)直方圖:1.用于表示連續性變量的頻數(頻率)分布;

2.橫軸表示分組,縱軸表示頻數或頻率。第三十九頁,共62頁。3.統計量不含總體未知參數的樣本函數稱為統計量。如:某飲料生產企業用自動罐裝機罐裝橙汁飲料,每罐標準含量為500ml,為保證產品的穩定性,需要每隔一定時間檢查每罐飲料的含量情況。現抽得10罐,測得其含量為(單位:ml)495,510,498,503,492,502,505,512,497,506。統計量第四十頁,共62頁。描述樣本集中位置的統計量(1)樣本均值:

設樣本數據為:x1,x2,…,xn

,樣本均值的計算公式為:(2)中位數:樣本數據排序后,處于中間位置上的值,用Me表示;(3)眾數:樣本數據中出現次數最多的值,用Mod表示;第四十一頁,共62頁。描述樣本分散程度的統計量(1)極差:樣本數據中的最大值與最小值之差:

R=max(xi)-min(xi)(2)方差與標準差:(3)變異系數:用于對不同總體或同一總體不同量綱數據離散程度的比較,目的是消除數據水平高低和量綱的影響;

第四十二頁,共62頁。4.抽樣分布抽樣分布某個樣本統計量的抽樣分布,從理論上說就是在抽取容量為n的樣本時,由每一個樣本算出的該統計量數值的頻數分布或概率分布。第四十三頁,共62頁。重復抽樣分布

樣本均值的分布一個總體5,8,7,4。對該總體進行容量為2的重復抽樣,則樣本個數有16個,如下表所示:5874556.564.586.587.56767.575.544.565.54第四十四頁,共62頁。樣本均值的頻數分布表第四十五頁,共62頁。樣本均值的直方圖第四十六頁,共62頁。中心極限定理

不論總體服從何種分布,只要樣本容量足夠大,樣本均值的分布都大致服從正態分布:中心極限定理第四十七頁,共62頁。三大抽樣分布t分布0分布密度曲線第四十八頁,共62頁。分布分布的密度曲線第四十九頁,共62頁。F分布分布密度函數曲線第五十頁,共62頁。

第四節參數估計點估計1區間估計2第五十一頁,共62頁。參數估計某企業某天生產了6000個燈泡,從中抽取10個進行壽命測試,得到的數據如下:(單位:小時)1050108011001030112012001210113011701040

問:該天生產的燈泡平均壽命大約是多少?引例第五十二頁,共62頁。

根據樣本統計量估計總體的未知參數,這類問題稱為參數估計。定義

點估計:以樣本的某一函數值作為總體中未知參數的估計值。

區間估計:依據樣本把總體的參數確定在某一范圍內,要求它以足夠大的概率包含待估參數真值。兩種方法第五十三頁,共62頁。1.點估計-矩估計法利用樣本的數字特征作為總體數字特征的估計,即用樣本的均值

估計總體的均值

,用樣本的方差

估計總體的方差

,其中:定義第五十四頁,共62頁。某企業某天生產了6000個燈泡,從中抽取10個進行壽命測試,得到的數據如下:(單位:小時)1050108011001030112012001210113011701040

請用矩估計法估計該天生產燈泡的平均壽命。

解:樣本的平均壽命:

所以,該天生產燈泡平均壽命的矩估計量為1113小時。例第五十五頁,共62頁。2.區間估計

依據樣本把總體的未知參數確定在某一范圍內,要求它以足夠大的概率包含待估參數真值。區間估計區間總體未知參數區間下界區間上界第五十六頁,共62頁。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論