概率論與數理統計 第6章 數理統計基礎_第1頁
概率論與數理統計 第6章 數理統計基礎_第2頁
概率論與數理統計 第6章 數理統計基礎_第3頁
概率論與數理統計 第6章 數理統計基礎_第4頁
概率論與數理統計 第6章 數理統計基礎_第5頁
已閱讀5頁,還剩98頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第6章數理統計根底6.1總體和樣本6.2統計量與抽樣分布第6章數理統計根底前五章我們學習了概率論的根本知識,從本章開始將學習數理統計的根本知識、理論和方法.數理統計是以對隨機現象觀測所取得的資料〔數據〕為出發點,以概率論為根底來研究隨機現象的一門學科.概率論中,往往是在隨機變量分布的條件下,去研究它的性質、特點和規律性,比方求隨機變量取某些特定值的概率、求隨機變量的數字特征、研究多個隨機變量之間的關系等.第6章數理統計根底在數理統計中,我們所研究的隨機變量的分布往往是未知的,通過對隨機變量進行屢次獨立重復的試驗和觀測,獲取數據,利用實際觀測數據研究隨機變量的分布,對其分布函數、數字特征等進行估計和推斷.本章作為數理統計根底,學習總體、樣本、統計量與抽樣分布等有關概念,以及有關正態總體的重要的抽樣分布定理.第6章數理統計根底【數理統計簡史】相對于其它許多數學分支而言,數理統計是一個比較年輕的數學分支.多數人認為20世紀40年代克拉美〔H.Carmer〕的著作?統計學的數學方法?,使得1945年以前25年間英、美統計學家在統計學方面的工作與法、俄數學家在概率論方面的工作結合起來,從而形成數理統計這門學科.數理統計有很多分支,但其根本內容為采集樣本和統計推斷兩大局部.開展到今天的現代數理統計學,已經歷了各種歷史變遷.1.近代統計學時期18世紀末到19世紀,是近代統計學時期.這一時期的重大成就是大數定律和概率論被引入統計學.之后最小二乘法、誤差理論和正態分布理論等相繼成為統計學的重要內容.這一時期有兩大學派:數理統計學派和社會統計學派.【數理統計簡史】【數理統計簡史】數理統計學派始于19世紀中葉,代表人物是比利時的凱特萊〔A.Quetelet,1796-1874〕,著有?概率論書簡??社會物理學?等,他主張用研究自然科學的方法研究社會現象,正式把概率論引入統計學,并最先用大數定律證明了社會生活中隨機現象的規律性,提出了誤差理論.凱特萊的奉獻,使統計學的開展進入個了一個新的階段.社會統計學派始于19世紀末,首創人物是德國的克尼斯〔K.G.A.Knies〕,他認為統計學是一個社會科學,是研究社會現象變動原因和規律性的實質性科學.各國專家學者在社會經濟統計指標的設定與計算、指數的編制、統計調查的組織和實施、經濟社會開展評價和預測等方面取得了一系列的重要成果.德國統計學家恩格爾〔,1821-1896〕提出的“恩格爾〞系數,美國經濟學家庫茲涅茨和英國經濟學家斯通等人研究的國民收入和國內生產總值的核算方法等,都是偉大的奉獻.【數理統計簡史】18世紀到19世紀初期,高斯從描述天文觀測的誤差而引進正態分布,并使用最小二乘法作為估計方法,是近代數理統計學開展初期的重大事件,對社會開展有很大的影響.【數理統計簡史】用正態分布描述觀測數據的應用是如此普遍,以至在19世紀相當長的時期內,包括高爾頓〔Galton〕在內的一些學者,認為這個分布可用于描述幾乎是一切常見的數據.直到現在,有關正態分布的統計方法,仍占據著常用統計方法中很重要的一局部.最小二乘法方面的工作,在20世紀初以來,經過一些學者的開展,如今成了數理統計學中的主要方法.【數理統計簡史】【數理統計簡史】例如英國統計學家卡爾.皮爾遜〔K.Pearson,1857-1936〕的2分布理論,統計學家戈賽特〔,1876-1937〕的小樣本t分布理論,統計學家費歇爾〔,1890-1962〕的F分布理論和試驗設計方法,波蘭統計學家尼曼〔J.Neyman〕和英國統計學家皮爾遜〔,1895-1980〕的置信區間理論和假設檢驗理論,以及非參數統計法、序貫抽樣法、多元統計分析法、時間序列跟蹤預測法都應運而生,并逐步成為現代統計學的主要內容.【數理統計簡史】現代統計學時期是數理統計開展的輝煌時期,數理統計不僅在理論上取得重大進展,其方法在生物、農業、醫學、社會、經濟、工業和科技等方面得到愈來愈廣泛的應用.另外,計算機的應用對統計學的產生了巨大的影響,需要大量計算的統計方法,有了計算機,這一切都不成問題.【數理統計簡史】第6章數理統計根底【質量控制問題】

某食鹽廠用包裝機包裝的食鹽,每袋重量500g,通常在包裝機正常的情況下,袋裝食鹽的重量X服從正態分布,均值為500g,標準差為25g.為進行生產質量控制,他們每天從當天的產品中隨機抽出30袋進行嚴格稱重,以檢驗包裝機工作是否正常.某日,該廠隨機抽取30袋鹽的重量分別為:

從這些數據看,包裝機的工作正常嗎?4755004854545044394925014634614644945124514345115134905215144494674994845084784794995294806.1總體和樣本6.1.1總體與個體

總體或母體指我們研究對象的全體構成的集合,個體指總體中包含的每個成員.例如,在研究某高校學生生活消費狀況時,該校全體學生就是一個總體,其中每一個學生是一個個體;在人口普查中,總體是某地區的全體人口,個體就是該地區的每一個人.第6章數理統計根底6.1.1總體與個體我們研究總體時,所關心的往往是總體某方面的特性,這些特性又常常可以用一個或多個數量指標來反映.例如,在研究某高校學生生活消費狀況時,關心的可能是學生們每月的生活消費額,在研究某廠生產的燈泡的質量時,關心的可能是這些燈泡的壽命和光亮度等.這時總體指一個或多個數量指標,這些數量指標對我們來說是不了解或者說是未知的,我們可以用一個或多個隨機變量來表示它們.

因此,總體可以是一維隨機變量,也可以是多維隨機變量.例如,在研究某高校學生生活消費狀況時,可以用X表示月生活消費額,在研究某廠生產的燈泡的質量時,可以分別用X,Y表示燈泡的壽命和光亮度,那么,對上面兩個問題的研究就轉化為對總體X和總體(X,Y)的研究了.

6.1.1總體與個體根據總體中包含個體的數量,可以將總體分為有限總體和無限總體,當總體中包含個體的數量很大時,我們可以把有限總體看成是無限總體.例如,某廠某天生產的燈泡可以看作是有限總體,而該廠生產的全部燈泡就可以看作為無限總體,因為它包含過去和將來生產的燈泡的全部.6.1.1總體與個體6.1.2樣本與抽樣實際應用中,為了研究總體的特性,總是從總體中抽出局部個體進行觀察和試驗,根據觀察或試驗得到的數據推斷總體的性質.我們把從總體中抽出的局部個體稱為樣本,把樣本中包含個體的數量稱為樣本容量,把對樣本的觀察或試驗的過程稱為抽樣,把觀察或試驗得到的數據稱為樣本觀測值〔觀測數據〕,簡稱樣本值.例如,在質量檢驗中,隨機抽出n件產品,測得的數據x1,x2,...,xn,就稱它們是樣本觀測值.在抽樣前,不知道樣本觀測值究竟取何值,應該把它們看作為隨機變量,記作X1,X2,...,Xn,稱其為容量為n的樣本.〔在不會混淆的情況下,有時我們也將觀測數據x1,x2,...,xn稱為樣本,如“質量控制問題〞中的30個數據,也可以說成是一個容量為30的樣本〕.樣本與抽樣在應用中,我們從總體中抽出的個體必須具有代表性,樣本中個體之間要具有相互獨立性,為保證這兩點,一般采用簡單隨機抽樣.定義6.1一種抽樣方法假設滿足下面兩點,稱其為簡單隨機抽樣:(1)總體中每個個體被抽到的時機是均等的;(2)樣本中的個體相互獨立.由簡單隨機抽樣得到的樣本稱為簡單隨機樣本.如果沒有特殊說明,以后所說樣本均指簡單隨機樣本.樣本與抽樣設X1,X2,...,Xn是從總體X中抽出的簡單隨機樣本,由定義可知,X1,X2,...,Xn有下面兩個特性:(1)代表性:X1,X2,...,Xn均與X同分布,即假設XF(x),那么對每一個Xi都有XiF(xi),i=1,2,…,n(2)獨立性:X1,X2,...,Xn相互獨立.由這兩個特性可知,假設X的分布函數為F(x),那么X1,X2,...,Xn的聯合分布函數為F(x1,x2,…,xn)=F(x1)F(x2)…F(xn)假設X具有概率密度為f(x),那么X1,X2,...,Xn的聯合概率密度為f(x1,x2,…,xn)=f(x1)f(x2)…f(xn)樣本與抽樣往往是未知或不完全知道的,是需要通過樣本來進行研究和推斷的.【例6.1】設總體X服從均值為1/2的指數分布,X1,X2,X3,X4為來自X的樣本,求X1,X2,X3,X4的聯合概率密度和聯合分布函數.解:X的概率密度為其分布函數為那么X1,X2,X3,X4的聯合概率密度為:樣本與抽樣樣本與抽樣由于X的分布函數為X1,X2,X3,X4的聯合分布函數為

【例6.2】總體X的分布為P{X=i}=1/4,i=0,1,2,3,抽取n=36的簡單隨機樣本X1,X2,...,X36,求大于50.4小于64.8的概率.解:總體X的均值和方差分別為

樣本與抽樣由于X1,X2,...,X36均與總體X同分布,且相互獨立,所以,Y的均值和方差分別為

又因為n=36較大,依中心極限定理,近似服從正態分布,所以

樣本與抽樣6.1總體和樣本6.1.3直方圖與經驗分布函數如前所述,數理統計所研究的實際問題〔總體〕的分布一般來說是未知的,需要通過樣本來推斷.但如果對總體一無所知,那么,做出推斷的可信度一般也極為有限.在很多情況下,我們往往可以通過具體的應用背景或以往的經驗,再通過觀察樣本觀測值的分布情況,對總體的分布形式有個大致了解.觀察樣本觀測值的分布規律,了解總體X的概率密度和分布函數,常用直方圖和經驗分布函數.1.直方圖直方圖是對一組數據x1,x2,...,xn的分布情況的圖形描述.將數據的取值范圍分成假設干區間〔一般是等間隔的〕,在等間隔的情況,每個區間的長度稱為組距.考察這些數據落入每一個小區間的頻數和頻率,在每一個區間上畫一個矩形,它的寬度是組距,高度可以是頻數、頻率或頻率/組距,所得直方圖分別稱為頻數直方圖、頻率直方圖和密度直方圖.6.1.3直方圖與經驗分布函數圖6-1密度直方圖如果數據x1,x2,...,xn是來自連續總體X的樣本觀測值,其密度直方圖中,每一個矩形的面積恰好是觀測數據落入對應區間的頻率,這種密度直方圖可以用來估計總體的概率密度〔用密度直方圖的頂部折線估計X的概率密度曲線〕.組距對直方圖的形態有很大的影響,組距太小或太大,直方圖反映概率密度的形態就不夠準確.直方圖與經驗分布函數直方圖與經驗分布函數一個適宜的分組是希望密度直方圖的形態接近總體的概率密度函數的形態.手工計算常取組數等于左右,一些統計軟件會根據樣本容量和樣本的取值范圍自動確定一個適宜的分組方式,畫出各種漂亮的直方圖.【實驗6-1】從某高校一年學生的“高等數學〞課程考試成績中,隨機抽取60名學生的成績如下:試利用Excel的“數據分析〞功能作學生成績的密度直方圖,并通過直方圖了解學生成績的分布情況.7669717769718369858586777495668766516873776266739379638787548057727258767276697181756674606779638878857258906170776880796.1.3直方圖與經驗分布函數實驗步驟:(1)確定分組個數:因為,取分組個數為8.數據的最小值為51,最大值為95,為分組方便起見,考慮范圍從50到100,分為8個組,組距取50/8=6.25,分點分別為:50,56.25,62.5,68.75,75,81.25,87.5,93.75,100。整理學生成績數據,在“組上限〞欄中填入各組的上限值,如圖6-2左所示.

圖6-2數據整理與“直方圖〞對話框(2)在Excel主菜單中選擇“工具〞“數據分析〞,翻開“數據分析〞對話框,在“分析工具〞列表中選擇“直方圖〞選項,單擊“確定〞按鈕.(3)在翻開的“直方圖〞對話框中,依次輸入〔或用鼠標拖動選擇〕“輸入區域〞、“接收區域〞和“輸出區域〞,如圖6-2右所示,單擊“確定〞按鈕.得到頻率分布的結果如圖6-3左所示.

圖6-3計算各組頻率與密度(4)計算密度:在單元格區域J2:J9中依次輸入組域名:50-56.25、、、68.75-75、75-81.25、、、93.75-100,然后在“密度〞列的單元格K2中輸入公式:=I2/60/6.25,并將公式復制到K3~K9中,如圖6-3右所示.(5)畫密度直方圖:選中單元格區域J1:K9,單擊“圖表向導〞按鈕,翻開“圖表向導〞對話框.在“圖表類型〞選擇中,取默認的“柱形圖〞向導,直接單擊“完成〞按鈕,即可得到密度柱形圖,如圖6-4所示.圖6-4密度柱形圖右鍵單擊圖中條形,在快捷菜單中選擇“數據系列格式〞,翻開“數據系列格式〞對話框,在其中的“選項〞選項卡中,修改“分類間距〞為0,如圖6-5〔左〕所示,單擊“確定〞按鈕,即可加寬條形,得到密度直方圖,進一步修改圖形,得到密度直方圖,如圖6-5〔右〕所示.

圖6-5密度直方圖從學生成績的密度直方圖可以看到,學生成績在平均分附近比較密集,較低或較高分數學生比較少,學生成績的分布呈近似“鐘形〞對稱,即成績分布近似正態分布.類似的方法可以畫出學生成績的頻數直方圖和頻率直方圖,由于三種直方圖只是高度相差一定的倍數,所以在研究總體分布的形態時,三種直方圖具有同樣的作用.2.經驗分布函數為了解總體X的分布形式,根據樣本觀測值x1,x2,...,xn構造一個函數Fn(x)來近似總體X的分布函數,函數Fn(x)稱為經驗分布函數.它的構造方法是這樣的,將樣本觀測值x1,x2,...,xn按從小到大可排成,定義

直方圖與經驗分布函數Fn(x)只在x=x(k),〔k=1,2,…,n〕處有躍度為1/n的間斷點,假設有l個觀測值相同,那么Fn(x)在此觀測值處的躍度為l/n.對于固定的x,Fn(x)即表示事件{Xx}在n次試驗中出現的頻率,即,其中k為落在(-,x)中xi的個數.

直方圖與經驗分布函數由伯努利大數定理知Fn(x)依概率收斂于F(x).實際上,Fn(x)還一致地收斂于F(x),所謂的格里文科定理指出了這一更深刻的結論,即所以,當n充分大時經驗分布函數Fn(x)是總體分布函數F(x)的一個良好的近似.

直方圖與經驗分布函數6.2統計量與抽樣分布在利用樣本推斷總體的性質時,往往不能直接利用樣本,而需要對它進行一定的加工,這樣才能有效地利用其中的信息,否那么,樣本只是呈現為一堆“雜亂無章〞的數據.第6章數理統計根底【例6.3】從某地區隨機抽取50戶農民,調查其人均年收入情況,得到數據〔單位:元〕如下: 試對該地區農民收入的水平和貧富懸殊程度做個大致分析.9248009167048701040824690574490972988126668476494040880461085260275478896270471285488876884888211928208786148467468287928726966449268081010728742850864738

6.2統計量與抽樣分布解:顯然,如果不進行加工,面對這一大堆大小參差不齊的數據,很難得出什么印象.但是可以對這些數據稍事加工,如記各農戶的人均年收入分別為x1,x2,...,x50,計算得到這樣,就可以了解到該地區農民的平均收入和該地區農民貧富懸殊的大致情況:農民的年人均平均收入大約為809.52元,標準差約為155.85元,貧富懸殊不算很大.

6.2統計量與抽樣分布由此可見對樣本的加工是十分重要的.對樣本加工,主要就是構造統計量.6.2.1統計量定義6.2設X1,X2,…,Xn為來自總體X的樣本,稱不含未知參數的樣本的函數g(X1,X2,…,Xn)為統計量.假設x1,x2,...,xn為樣本觀測值,那么稱g(x1,x2,...,xn)為統計量g(X1,X2,…,Xn)的觀測值.統計量是處理、分析數據的主要工具.對統計量的一個最根本的要求就是可以將樣本觀測值代入進行計算,因而不能含有任何未知的參數.

6.2統計量與抽樣分布【例6.4】設X1,X2,…,Xn是來自總體X的樣本,X~N(,2),其中、2為未知參數,那么X1,min{X1,X2,…,Xn}均為統計量,但諸如等均不是統計量,因它含有未知參數或.常用的統計量有如下幾種:

6.2.1統計量1.有關一維總體的統計量設X1,X2,…,Xn為總體X的樣本,x1,x2,...,xn為樣本觀測值,(1)樣本均值常用來作為總體期望〔均值〕的估計量,其觀測值為

統計量(2)樣本方差(3)樣本標準差樣本方差和樣本標準差刻畫了樣本數據的分散程度,常用來作為總體方差和標準差的估計量.觀測值分別為

統計量(4)樣本k階原點矩〔簡稱樣本k階矩〕,(k=1,2,…)(5)樣本k階中心矩,(k=2,3,…)顯然Ak和Bk的觀測值分別記為

統計量定理6.1設總體X的期望E(X)=,方差D(X)=2,X1,X2,…,Xn為總體X的樣本,,S2分別為樣本均值和樣本方差,那么

統計量由辛欽大數定理和依概率收斂的性質可以證明定理6.2設總體X的k階原點矩E(Xk)=k存在〔k=1,2,…,m〕,X1,X2,…,Xn為總體X的樣本,g(t1,t2,…,tm)是m元連續函數,那么特別有

統計量2.有關二維總體的統計量設(X1,Y1),(X2,Y2),…,(Xn,Yn)為二維總體(X,Y)的樣本,其觀測值為(x1,y1),(x2,y2),…,(xn,yn),那么以下各量為統計量:(1)樣本協方差(2)樣本相關系數其中SXY和RXY常分別用來作為總體X和Y的協方差Cov(X,Y)與相關系數XY的估計量.

統計量

統計量

實驗方法一:(1)輸入數據及統計量名,如圖6-7左所示.(2)計算樣本均值,在單元格H2中輸入公式:=AVERAGE(A2:E11)(3)計算樣本方差s2,在單元格H3中輸入公式:=VAR(A2:E11)(4)計算樣本標準差s,在單元格H4中輸入公式:=STDEV(A2:E11)計算結果:、s2=24288.91、s=155.85,如圖6-7右所示.

統計量圖6-7計算統計量

統計量實驗方法二:(1)輸入整理數據,如圖6-8左所示.(2)在Excel主菜單中選擇“工具〞“數據分析〞,翻開“數據分析〞對話框,在“分析工具〞列表中選擇“描述統計〞選項,單擊“確定〞按鈕.(3)在翻開的“描述統計〞對話框中,依次輸入“輸入區域〞和“輸出區域〞,選中“標志位于第一行〞復選框,如圖6-8中所示,單擊“確定〞按鈕.得到描述統計的結果如圖6-8右所示.

統計量

圖6-8描述統計

統計量

6.2統計量與抽樣分布6.2.2抽樣分布統計量的分布稱為抽樣分布.為了研究抽樣分布,先研究數理統計中三種重要的分布.1.2分布定義6.3設X1,X2,…,Xn為相互獨立的隨機變量,它們都服從標準正態N(0,1)分布,那么稱隨機變量服從自由度為n的2分布,記為2~2(n).此處自由度指2中包含獨立變量的個數.可以證明,2(n)的概率密度為其中()稱為伽馬函數,

6.2.2抽樣分布2分布概率密度

圖6-92(n)分布的概率密度曲線可以看出,隨著n的增大,的圖形趨于“平緩〞,其圖形下區域的重心亦逐漸往右下移動.

6.2.2抽樣分布2分布具有下面性質:(1)(可加性)設是兩個相互獨立的隨機變量,且(2)設證明(1)由2分布的定義易得證明.(2)因為存在相互獨立、同分布于N(0,1)的隨機變量X1,X2,…,Xn,使那么

6.2.2抽樣分布由于Xi獨立,且注意到N(0,1)的四階矩為3,可得

英國統計學家費歇〔〕曾證明,當n較大時,近似服從

6.2.2抽樣分布2.t分布定義6.4設X~N(0,1),Y~2(n),X與Y獨立,那么稱隨機變量服從自由度為的t分布,又稱為學生氏分布(Studentdistribution),記為T~t(n).可以證明t(n)的概率密度為圖6-10t分布的概率密度曲線

6.2.2抽樣分布

圖6-10t分布的概率密度曲線顯然t分布的概率密度是x的偶函數,圖6-10描繪了n=1,3,7時t(n)的概率密度曲線.作為比較,還描繪了N(0,1)的概率密度曲線.

6.2.2抽樣分布可看出,隨著n的增大,t(n)的概率密度曲線與N(0,1)的概率密度曲線越來越接近.可以證明t分布具有下面性質:即當n趨向無窮時,t(n)近似于標準正態分布N(0,1).一般地,假設n>30,就可認為t(n)根本與N(0,1)相差無幾了.

6.2.2抽樣分布3.F分布定義6.5設X~

2(n1),Y~

2(n2),且X與Y獨立,稱隨機變量服從自由度為(n1,n2)的F分布,記為F~F(n1,n2).可以證明的概率密度函數為

6.2.2抽樣分布

抽樣分布圖6-11F分布的概率密度曲線由F分布的定義容易看出,假設F~F(n1,n2),那么1/F~F(n2,n1).4.正態總體的抽樣分布定理在數理統計問題中,正態分布占據著十分重要的位置,一方面因為在應用中,許多隨機變量的分布或者是正態分布,或者接近于正態分布;另一方面,正態分布有許多優良性質,便于進行較深入的理論研究.因此,我們著重討論正態總體下的抽樣分布,給出有關最重要的統計量樣本均值和樣本方差S2的抽樣分布定理.

抽樣分布定理6.3設X1,X2,…,Xn為來自總體N(,2)的樣本,,S2分別為樣本均值和樣本方差,那么有(1)(2)(3)與S2相互獨立;(4)證明:由正態分布的性質容易得到(1),略去(2)和(3)的證明,下面僅證明4.

抽樣分布

證明(4):由(1)知,從而由(2)(3)知根據t分布的定義

抽樣分布【例6.5】某廠生產的燈泡壽命近似服從正態分布N(800,402),抽取16個燈泡的樣本,求平均壽命小于775小時的概率.

解:設燈泡壽命總體為X,因為X~N(800,402),n=16,所以樣本均值故

抽樣分布【例6.6】設總體X~N(

,102),抽取容量為n的樣本,樣本均值記為.欲使與的偏差小于5的概率大于0.95,樣本容量n至少應該取多大?解:依題令,即因為總體,從而所以即查表知,由于單調不減,應有故n至少應該取為16.

6.2.2抽樣分布【例6.7】設X1,X2,…,Xn為總體X~N(,2)的樣本,求樣本方差的均值和方差.解:此題可以通過2分布的均值和方差簡單求出.由定理6.3,所以有

于是

抽樣分布6.2.3分位數設X為一隨機變量,我們知道對于給定的實數x,P{X>x}是事件{X>x}的概率.在統計中,我們常常需要對給定事件{X>x}的概率,由此確定的x取是一個臨界點,稱為分位數(點),有如下定義:定義6.6設X為隨機變量,假設對給定的(0,1),存在x滿足P{X>x}=,那么稱x為X的上分位數(點).

6.2統計量與抽樣分布假設X具有密度f(x),P{X>x}=說明分位數x右邊的一塊陰影面積為,即

容易看出,X的上分位數x是關于的減函數,即增大時x減少.下面給出幾種常用分布的上分位數的求法:

6.2.3分位數1.設ZN(0,1),記N(0,1)的上分位數為z,即有P{Z>z}=.由于(z)=P{Zz}=1–P{Zz}=1–,由標準正態分布函數表〔附表2〕反過來查,即可以得到z的值.為使用方便,表6-1列出了標準正態分布的幾個常用分位數z的值.表6-1常用的標準正態分布的分位數

0.0010.0050.010.0250.050.10z

3.0902.5762.3261.9601.6451.282

6.2.3分位數由N(0,1)的概率密度的對稱性〔見圖6-13〕可知所以z1-=–z.

圖6-13z1-與z

6.2.3分位數2.設

2

2(n),記

2(n)的上

分位數為

2(n),即有P{

2>

2(n)}=

.附表3中給出了時

2(n)的值,當n>40時,由

2(n)的漸近性質,有

6.2.3分位數3.設T~t(n),記t(n)的上

分位數為t

(n),即有P{T>t

(n)}=

;由t(n)的概率密度的對稱性t1-

(n)=–t

(n)

圖6-14t1-

(n)與t

(n)附表4中給出了時t

(n)的值,當n>40時,由于t(n)近似N(0,1),所以t

(n)

z

6.2.3分位數4.設F~F(n1,n2),記F(n1,n2)的上分位數為F(n1,n2),即有P{F>F(n1,n2)}=.附表5中給出局部F(n1,n2)的值.另外,由于F~F(n1,n2)時,1/F~F(n2,n1),所以故

6.2.3分位數【例6.8】求以下分位數:(1)z0.025;20..5(20);t0.1(25);F0.05(10,15);(2)t0.975(4);(3)t0.05(55);(4)F0.9(14,10);(5)20.975(200).解:(1)查表6-1知z0.025=1.96.也可由標準正態分布函數表〔附表2〕,對函數值(z0.025)=1–0.025=0.975反查表得z0.025=1.96.

6.2.3分位數分別查附表3、附表4、附表5得到

20.5(20)=31.4104、t0.1(25)=1.3164、F0.05(10,15)=2.54;(2)在附表4中沒有

=0.975,可先查出t0.025(4)=2.7764,利用對稱性得到t0.975(4)=–t0.025(4)=–2.7764.(3)在附表4中查不到t0.05(55),用近似公式t0.05(55)

z0.05=1.645.

6.2.3分位數(4)在附表5中,查不到F0.9(14,10),但可查出F0.1(10,14)=2.10,故(5)在附表3表中查不到

20.975(200),先查出z0.975=–z0.025=–1.96,再作如下近似計算

6.2.3分位數【實驗6.3】用Excel計算例6-8中的分位數:(1)z0.025;(2)t0.975(4);(3)t0.05(55);(4)F0.9(14,10);(5)

20.975(200).

實驗準備:(1)函數NORMSINV的使用格式:NORMSINV(probability)功能:返回標準正態分布的分布函數的反函數值.

分位數

(2)函數TINV的使用格式:TINV(probability,degrees_freedom)功能:返回給定自由度的t-分布的上

/2分位數.其中

=probability為t-分布的雙尾概率,degrees_freedom為分布的自由度.(3)函數FINV的使用格式:FINV(probability,degrees_freedom1,degrees_freedom2)功能:返回F分布的上

分位數,其中

=probability為F分布的單尾概率,degrees_freedom1和degrees_freedom2為兩個自由度.

分位數(4)函數CHIINV的使用格式:CHIINV(probability,degrees_freedom)功能:返回

2分布的上

分位數.其中

=probability為

2分布的單尾概率,Degrees_freedom為自由度.

分位數實驗步驟:(1)計算z0.025,在單元格B2中輸入公式:=NORMSINV(0.975)(2)計算t0.975(4),由于t0.975(4)=-t0.025(4),在單元格B3中輸入公式:=-TINV(2*0.025,4)(3)計算t0.05(55),在單元格B4中輸入公式:=TINV(2*0.05,55)

分位數(4)計算F0.9(14,10),在單元格B5中輸入公式:=FINV(0.9,14,10)(5)計算20.975(200),在單元格B6中輸入公式:=CHIINV(0.975,200)計算結果如以以下圖.

分位數【例6.9】設X1,X2是總體X~N(1,2)的樣本,試求概率P{(X1–X2)2

20.08}.

解法一:因為X~N(1,2),所以Xi~N(1,2),i=1,2,從而記,所以查表知,即所以

分位數【例6.9】設X1,X2是總體X~N(1,2)的樣本,試求概率P{(X1–X2)2

20.08}.解法二:因X~N(1,2),所以從而

分位數由定理6.3容易證明下述有關兩個總體的抽樣分布定理.定理6.4設,分別為來自N(1,12)和N(2,22)的樣本,且它們相互獨立,設,S12,,S22,分別為相應樣本的樣本均值和樣本方差,那么(1)(2)

6.2.3分位數(3)當時,其中

6.2.3分位數證:(1)由于,,又與獨立,故由正態分布的性質知所以

6.2.3分位數證:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論