




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數理統計講義精品文檔《數理統計》教案收集于網絡,如有侵權請聯系管理員刪除精品文檔第一章統計量及其抽樣分布第一節 總體與樣本教學目的:要求學生理解數理統計的兩個基本概念 :總體和樣本,以及與這兩個基本概念相關的統計基本思想和樣本分布。教學重點:掌握數理統計的基本概念和基本思想 .教學難點:掌握數理統計的基本概念和基本思想 .一、總體與個體在一個統計問題中,我們把研究對象的全體稱為總體,構成總體的每個成員稱為個體。對多數實際問題。總體中的個體是一些實在的人或物。比如,我們要研究某大學的學生身高情況,則該大學的全體學生構成問題的總體,而每一個學生即是一個個體。事實上,每個學生有許多特征:性別、年齡、身高、體重、民族、籍貫等。而在該問題中,我們關心的只是該校學生的身高如何,對其他的特征暫不予以考慮。這樣,每個學生(個體)所具有的數量指標值——身高就是個體,而將所有身高全體看成總體。這樣一來,若拋開實際背景,總體就是一堆數,這堆數中有大有小,有的出現的機會多,有的出現的機會少,因此用一個概率分布去描述和歸納總體是恰當的。從這個意義上看,總體就是一個分布,而其數量指標就是服從這個分布的隨機變量。以后說“從總體中抽樣”與“從某分布中抽樣”是同一個意思。例1.考察某廠的產品質量,將其產品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則總體={該廠生產的全部合格品與不合格品}={由 0或1組成的一堆數}。若以p表示這堆數中 1的比例(不合格品率),則該總體可由一個二點分布表示:不同的p反映了總體間的差異。例如,兩個生產同類產品的工廠的產品總體分布為:我們可以看到,第一個工廠的產品質量優于第二個工廠。實際中,分布中的不合格品率是未知的,如何對之進行估計是統計學要研究的問題。二、樣本為了了解總體的分布,我們從總體中隨機地抽取n個個體,記其指標值為x1,x2,?,xn,則x1,x2,?,xn稱為總體的一個樣本,n稱為樣本容量,或簡稱樣本量,樣本中的個體稱為樣品。收集于網絡,如有侵權請聯系管理員刪除精品文檔我們首先指出,樣本具有所謂的二重性:一方面,由于樣本是從總體中隨機抽取的,抽取前無法預知它們的數值,因此,樣本是隨機變量,用大寫字母X1,X2,?,Xn表示;另一方面,樣本在抽取以后經觀測就有確定的觀測值,因此,樣本又是一組數值。此時用小寫字母x,x,?,x表示是恰當的。簡單起見,無12n論是樣本還是其觀測值,本書中樣本一般均用1,x2,?,xn表示,讀者應能從上x下文中加以區別。例2.啤酒廠生產的瓶裝啤酒規定凈含量為640g,,由于隨機性,事實上不可能使得所有的啤酒凈含量均為640g,現從某廠生產的啤酒中隨機抽取10瓶測定其凈含量,得到如下結果:641635640637642638645643639640這是一個容量為10的樣本的觀測值。對應的總體為該廠生產的瓶裝啤酒的凈含量。從總體中抽取樣本時,為使樣本具有代表性,抽樣必須是隨機抽樣。通常可以用隨機數表來實現隨機抽樣。還要求抽樣必須是獨立的,即每次的結果互不影響。在概率論中,在有限總體(只有有限個個體的總體)中進行有放回抽樣,是獨立的隨機抽樣;然而,若為不放回抽樣,則是不獨立的抽樣。但當總體容量N很大但樣本容量 n較小 時,不放回抽樣可以近似地看做放回抽樣,即可近似看做獨立隨機抽樣。下面,我們假定抽樣方式總滿足獨立隨機抽樣的條件。從總體中抽取樣本可以有不同的抽法,為了能由樣本對總體做出較可靠的推斷,就希望樣本能很好地代表總體。這就需要對抽樣方法提出一些要求,最常用的“簡單隨機抽樣”有如下兩個要求:1)樣本具有隨機性,即要求總體中每一個個體都有同等機會被選入樣本,這便意味著每一樣品xi與總體X有相同的分布。2)樣本要有獨立性,即要求樣本中每一樣品的取值不影響其他樣品的取值,這意味著x1,x2,?,xn相互獨立。用簡單隨機抽樣方法得到的樣本稱為簡單隨機樣本,也簡稱樣本。除非特別指明,本書中的樣本皆為簡單隨機樣本。于是,樣本x1,x2,?,xn可以看成是相互獨立的具有同一分布的隨機變量,其共同分布即為總體分布。設總體X具有分布函數F(x),x1,x2,?,xn為取自該總體的容量為n的樣本,則樣本聯合分布函數為:若總體具有密度函數 f(x),則樣本的聯合密度函數為若總體X為離散型隨機變量,則樣本的(聯合)概率函數為顯然,通常說的樣本分布是指多維隨機變量( x1,x2,?,xn)的聯合分布。收集于網絡,如有侵權請聯系管理員刪除精品文檔例3.為估計一物件的重量μ,用一架天平重復測量n次,得樣本x1,x2,?,xn,由于是獨立重復測量,x1,x2,?,xn是簡單隨機樣本。總體的分布即x1的分布(x1,x2,?,xn分布相同)。由于稱量誤差是均值(期望)為零的正態變量,2所以x1可認為服從正態分布 N(μ,σ)(X1等于物件重量 μ)加上稱量誤差,即x1的概率密度為這樣,樣本分布密度為。例4.設某種電燈泡的壽命X服從指數分布E(λ),其概率密度為:則來自這一總體的簡單隨機樣本x1,x2,?,xn的樣本分布密度為例5.考慮電話交換臺一小時內的呼喚次數X。求來自這一總體的簡單隨機樣本1,x2,?,xn的樣本分布。解由概率論知識,X服從泊松分布P(λ),其概率函數,(其中x是非負整數{0,1,2,?,k,?}中的一個)。從而,簡單隨機樣本x1,x2,?,xn的樣本分布為:收集于網絡,如有侵權請聯系管理員刪除精品文檔第二節 統計量及其分布教學目的:要求學生理解數理統計的基本概念:統計量,熟練掌握樣本均值、樣本方差、樣本原點矩、樣本中心矩等常用統計量的計算公式,掌握次序統計量及其抽樣分布。能用 R軟件來計算這些常用統計量,能用 R軟件來產生分布的隨機數以進行隨機模擬。教學重點:樣本均值、樣本方差、樣本原點矩、樣本中心矩等常用統計量的求法;次序統計量的抽樣分布。教學難點:次序統計量的抽樣分布。一、統計量與抽樣分布樣本來自總體,樣本的觀測值中含有總體各方面的信息,但這些信息較為分散,有時顯得雜亂無章。為將這些分散在樣本中有關總體的信息集中起來以反映總體的各種特征,需要對樣本進行加工。最常用的加工方法是構造樣本的函數,不同的函數反映總體的不同特征。定義1.設x1,x2,?,xn為取自某總體的樣本,若樣本函數T=T(x1,x2,?,xn)中不含有任何未知參數,則稱T為統計量。統計量的分布稱為抽樣分布。按照這一定義,若 x1,x2,?,xn為樣本,則 , 都是統計量,而當2,等均不是統計量。μ,σ未知時,二、樣本均值及其抽樣分布定義2.設x1,x2,?,xn為取自某總體的樣本,其算術平均值稱為樣本均值,一般用表示,即。例6.某單位收集到20名青年人某月的娛樂支出費用數據:79848488929394979899100101101102102108110113118125則該月這20名青年的平均娛樂支出為對于樣本均值 的抽樣分布,我們有下面的定理。收集于網絡,如有侵權請聯系管理員刪除精品文檔定理1.設x1,x2,?,xn是來自某個總體 X的樣本,為樣本均值。(1)若總體分布為2;N(μ,σ),則的精確分布為2(2)若總體X分布未知(或不是正態分布),且E(X)=μ,D(X)=σ,則當樣本容量n較大時,的漸近分布為,這里的漸近分布是指n較大時的近似分布。證明(1)由于為獨立正態變量線性組合,故仍服從正態分布。另外,故(2)易知 為獨立、同分布的隨機變量之和,且。由中心極限定理,,其中Φ(x)為標準正態分布。這表明 n較大時的漸近分布為 。三、樣本方差與樣本標準差定義3.設x1,x2,?,xn為取自某總體的樣本,則它關于樣本均值的平均偏差平方和稱為樣本方差,其算術根 稱為樣本標準差。相對樣本方差而言,樣本標準差通常更有實際意義,因為它與樣本均值具有相同的度量單位。在上面定義中,n為樣本容量, 稱為偏差平方和,它有3個不同的表達式:事實上,收集于網絡,如有侵權請聯系管理員刪除精品文檔,偏差平方和的這 3個表達式都可用來計算樣本方差。例7.在例6中,我們已經算得 ,其樣本方差與樣本標準差為,。方法二s=11.5731通常用第二種方法計算s2方便許多。下面的定理給出樣本均值的數學期望和方差以及樣本方差的數學期望,它不依賴于總體的分布形式。這些結果在后面的討論中是有用的。定理2.設總體X具有二階矩,即2E(x)=μ,D(X)=σ<+∞x1,x2,?,xn為從該總體得到的樣本, 和s2分別是樣本均值和樣本方差,則此定理表明,樣本均值的均值與總體均值相同,而樣本均值的方差是總體方差的 。證明 由于1)2)且有:,而,收集于網絡,如有侵權請聯系管理員刪除精品文檔于是,兩邊各除以n-1,即得證。值得讀者注意的是:本定理的結論與總體服從什么分布無關。四、樣本矩及其函數樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見的統計量。定義4.設x1,x2,?,xn是樣本,則統計量稱為樣本k階原點矩,特別地,樣本一階原點矩就是樣本均值。統計量稱為樣本k階中心矩。常見的是k=2的場合,此時稱為二階樣本中心矩。本書中我們將其記為22。n五、極大順序統計量和極小順序統計量定義5.設總體X具有分布函數F(x),分布密度f(x),x1,x2,?,xn為其樣本,我們分別稱X(1)=min{x1,x2,?xn},x(n)=max{x1,x2,?xn}為極小順序統計量和極大順序統計量。定理3.若x(1),x(n)分別為極小、極大順序統計量,則1)x(1)的分布函數F1(x)=1-(1-F(x))n,x(1)的分布密度f1(x)=n-(1-F(x))n-1f(x)2)x(n)的分布函數Fn(x)=[F(x)]n,x(n)的分布密度fn(x)=n[F(x)]n-1f(x)證明先求出x(1)及x(n)的分布函數 F1(x)及Fn(x):,,分別對F1(x),Fn(x)求導即得收集于網絡,如有侵權請聯系管理員刪除精品文檔六、正態總體的抽樣分布有很多統計推斷是基于正態總體的假設的,以標準正態變量為基石而構造的三2應用。這是因為這三個統計量不僅有明確背景,而且其抽樣分布的密度函數有“明確的表達式”,它們被稱為統計中的“三大抽樣分布”。x2分布(卡方分布)定義6.設X1,X2,?,Xn獨立同分布于標準正態分布2222則x=x1nn的x分布,記為+?x的分布稱為自由度為
N(0,1),2 2x~x(n)。x2(n)分布的密度函數見圖 1-42222(n)}=當隨機變量x~x(n)時,對給定的α(0<α<1),稱滿足p{x>xα(n)}是自由度為2n的開方分布的α分位數。分位數xα(n)}可以從附表到。例如n=10,α=0.05,那么從附表4中查得x2(10)=18.307p(x)2>x20.05(10)=p{x2>18.307=0.05注:請讀者注意x2~x2(n)時,n是自由度,不是容量。
2α的xα中查2.F分布定義7.設x1~x2(m),x2~x2(n)X1與X2獨立,則稱 的分布是自由度為m與n的F分布,記為F~F(m,n),其中m稱為分子自由度,n稱為分母自由度。自由度為m與n的F分布的密度函數的圖像是一個只取非負值的偏態分布(見圖6-5)。當隨機變量F~F(m,n)時,對給定的α(0<α<1),稱滿足P{F>Fα}(m,n)=α的數Fα(m,n)是自由度為m與n的F分布的α分位數。收集于網絡,如有侵權請聯系管理員刪除精品文檔當F~F(m,n)時,有下面性質(不證),這說明對小的α,分位為Fα(m,n)可以從附表5中查到,而分位數F1-α(m,n)則可通過上式得到。例8.若取m=10,則n=5,α=0.05,那么從附表5上(m=n1,n=n2)查得F0.05(10,5)=4.74利用()式可得到3.t分布定義8.設隨機變量與 X1與X2獨立且X1~N(0,1),X2~X2(n),則稱 的分布為自由度為 n的t的分布,記為 t~t(n).分布密度函數的圖像是一個關于縱軸對稱的分布(如下圖),與標準正態分布的密度函數形態類似,只是峰比標準正態分布低一些,尾部的概率比標準正態分布的大一些。分布與N(0,1)的密度函數當隨機變量t~t(n)時,稱滿足P{t>tα(n)}=α的tα(n)是自由度為n的t分布的α分位數,分位數tα(n)可以從附表3中查到,例如當n=10,α=0.時05,從附表3上查得t0.05(10)=1.8125由于t分布的密度函數關于 0對稱,故其分位數有如下關系:t1-α(n)=-tα(n)例如,t0.95(10)=-t0.05(10)=-1.8125當n很大時,(n≥30),t分布可以用N(0,1)近似收集于網絡,如有侵權請聯系管理員刪除精品文檔P(t>-tα)=1-α,p(t>t1-α)=1-α,∴t1-α=-tα4.一些重要結論來自一般正態總體的樣本均值和樣本方差S2的抽樣分布是應用最廣的抽樣分布,下面我們加以介紹。定理4.設X1,X2,?Xn是來自正態總體N(μ,2σ)的樣本,其樣本均值和樣本方差分別為:則有1)與s2相互獨立;2)特別,若(不證)22212則(不證)本章小結本章的基本要求:(一)知道總體、樣本、簡單樣本和統計量的概念(二)知道統計量 和s2的下列性質:收集于網絡,如有侵權請聯系管理員刪除精品文檔2 2E(s)=σ(三)若x的分布函數為F(x),分布函數為f(x),則樣本(x1,x2,?xn)的聯合分布函數為F(x1)F(x2)?F(xn)樣本(x1,x2,?xn)的聯合分布密度為fx1)f(x2)?f(xn),樣本(x1,x2,?xn)的概率函數,p(x1,x2,?xn)=pX=x1)p(X=x2)?p(X=xn)因而順序統計量x(1),?x(n)中X(1)的分布函數為 1-(1-F(x))nX(n)的分布函數為[F(x)]n(四)掌握正態總體的抽樣分布2若X~N(μ,σ)則有(1)2)3)4)若=>當 時, 。(五)知道樣本原點矩與樣本中心矩的概念第二章 參數估計收集于網絡,如有侵權請聯系管理員刪除精品文檔從本章開始我們介紹統計推斷,所謂統計推斷就是由樣本推斷總體,統計推斷包括參數估計和假設檢驗兩部分,它們是統計推斷最基本而且是互相有聯系的兩部分,本章介紹統計推斷的第一部分參數估計。參數通常指總體分布中的特征值 和 和各種分布中的參數,例如二點分布 B1,P)中的p,泊松分布P()中的,正態分布N(、)的、等,習慣用表示參數,通常參數是未知的。參數估計的形式有兩類,設x1,x2,?,xn是來自總體的樣本。我們用一個統計量的取值作為參數的估計值,則稱為的點估計(量),就是參數的點估計,如果對參數的估計需要對估計作出可靠性判斷,就需要對這一可靠性給出可靠性區間或置信區間,叫區間估計。下面首先介紹點估計第一節 點估計教學目的:要求學生了解參數點估計的基本思想,理解參數點估計的基本概念,熟練運用替換原理、矩法估計和最大似然估計對參數進行估計。教學重點:矩法估計、最大似然估計 .教學難點:運用矩法估計、最大似然估計對參數進行估計 .直接用來估計未知參數 的統計量 稱為參數 的點估計量,簡稱為點估計,人們可以運用各種方法構造出很多的估計,本節介紹兩種最常用的點估計方法。它們是:矩法和極大似然法。一、替換原理和矩法估計用下面公式表示 的方法叫矩法例1.對某型號的 20輛汽車記錄每 5L汽油的行駛里程(km),觀測數據如下:29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9這是一個容量為20的樣本觀測值,對應總體是該型號汽車每5L汽油的行駛里程,其分布形式尚不清楚,可用矩法估計其均值,方差,本例中經計算有28.695,=0.9185由此給出總體均值,方差的估計分別為即矩法估計的統計思想(替換原理)十分簡單明確,眾人都能接受,使用場合甚廣。例2.設總體為指數分布,其密度函數為收集于網絡,如有侵權請聯系管理員刪除精品文檔x1,?,xn是樣本,由于 ,亦即 ,故 的矩法估計為例3.設x1,?,xn是來自服從區間(0,)上的均勻分布 的樣本, >0為未知參數。求 的矩估計 。解:易知總體 X的均值為由矩法的矩估計為比如,若樣本值為 0.1,0.7,0.2,1,1.9,1.3,1.8,則的估計值2×(0.1+0.7+0.2+1+1.9+1.3+1.8)=2例4.在一批產品取樣n件,發現其中有m件次品,試用此樣本求該批產品的次品率p的矩估計。解:因為∴例如抽樣總數 n=100,其中次品m=5.則例5.電話總機在一分鐘間隔內接到呼喚次數X~P()。觀察一分種接到呼喚次數共觀察40次,結果如下接到呼喚次數012345觀察次數51012832求未知參數的矩估計解:(1)∵X~P()∴EX=由矩法∴(2)計算(0×5+1×10+2×12+3×8+4×3+5×2)=2∴=2二、極大似然估計收集于網絡,如有侵權請聯系管理員刪除精品文檔為了敘述極大似然原理的直觀想法,先看例 6例6.設有外表完全相同的兩個箱子,甲箱中有 99個白球和1個黑球,乙箱中有99個黑球和1個白球,現隨機地抽取一箱,并從中隨機抽取一球,結果取得白球,問這球是從哪一個箱子中取出的?解:不管是哪一個箱子,從箱子中任取一球都有兩個可能的結果: A表示取出白球,B表示取出黑球,如果我們取出的是甲箱,則 A發生的概率為 0.99,而如果取出的是乙箱,則A發生的概率為0.01,現在一次試驗中結果A發生了,人們的第一印象就是:“此白球(A)最像從甲箱取出的”,或者是說,應該認為試驗條件對事件A出現有利,從而可以推斷這球是從甲箱中取出的,這個推斷很符合人們的經驗事實,這里 “最像”就是“極大似然”之意。本例中假設的數據很極端,一般地,我們可以這樣設想,在兩個箱子中各有100個球,甲箱中白球的比例是 P1,乙箱中白球的比例是 P2,已知P1>P2,現隨機地抽取一個箱子并從中抽取一球,假定取到的是白球,如果我們要在兩個箱子中進行選擇,由于甲箱中白球的比例高于乙箱,根據極大似然原理,我們應該推斷該球來自甲箱。下面分別給出離散型隨機變量和連續型隨機變量的極大似然估計求未知參數的估計的步驟(一)離散型隨機變量第一步,從總體 X取出樣本x1,x2,?,xn第二步,構造似然函數L(x1,x2,?,xn,)=P(X=x1)P(X=x2)?P(X=xn)第三步,計算lnL(x1,x2,?,xn,)并化簡第四步,當=時lnL(x1,x2,?,xn,)取最大值則取=常用方法是微積分求最值的方法。(二)連續型隨機變量若X~f(x,),x,?,x第一步從總體X取出樣本x12n第二步構造似然函數L(x1,x2,?,xn,)=f(x1,)f(x2,)?f(xn,)第三步計算lnL(x,x,?,x,)并化簡12n第四步當=時lnL(x,x,?,x,)取最大值則取=12n常用方法是微積分求最值的方法例7.設總體X~B(1,P)即設P(A)=,從總體X中抽樣x1,x2,?,xn,問最大似然法求解:當X~B(1,P)時,應有P(X=1)=P,P(X=0)=1-P第一步 構造似然函數L(x1,x2,?,xn,P)=P(X=x1)P(X=x2)?P(X=xn)收集于網絡,如有侵權請聯系管理員刪除精品文檔==第二步 計算lnL(x1,x2,?,xn,P)并化簡=(x1+?+xn)lnp+(n-(x1+?+xn)ln(1-p)第三步 求=∴駐點為化簡為(x1+?+xn)(1-p)=p[n-(x1+?+xn)](x1+?+xn)=np駐點因為只有一個駐點是最大點取例抽樣n次A發生m次,則在x1,x2?xn中有m個1,其余為0,∴例8.(1)設總體X服從泊松分布p(),求的極大似然估計;(2)設總體X服從指數分布E(),求的極大似然估計解:(1)∵X~P()p(X=k)=從總體X中取樣本x1,x2?xn。駐點解得 的極大似然估計易知 的矩估計亦為收集于網絡,如有侵權請聯系管理員刪除精品文檔(2)∵X~E()∴第一步,從中取樣本值 x1,x2?xn,應有x1>0,x2>0?xn>0∴似然函數L(x1,x2?xn)=f(x1)f(x2)?f(xn)=第二步 計算第三步 求∴駐點 是最大點∴取在例2中用矩法估計也是同樣結果 。例9.設 ,即從中取樣x1,x2?xn,試用最大似然法求解:因為樣本 x1,x2?xn已經取出。所以應有0≤x1≤,0≤x2,?0≤xn所以的取值范圍為第一步 構造似然函數∵>0,很明顯,似然函數 是的單調減函數,因此當 最小時,似然函數 最大,由條件知的最小值為所以 時 最大。取這一結果與用矩法估計(例 7-3)的結果 不同。例10.若,從中抽樣x1,x2?xn,試用最大似然估計法求:,解:X的似然函數收集于網絡,如有侵權請聯系管理員刪除精品文檔將 分別關于兩個分量求偏導并令其為 0即得到似然方程組,(1),(2)解此方程組,由(1)可得駐點 , 的極大似然估計為 ,將之代入(2)給出 的極大似然估計第二節 點估計的評價標準教學目的:要求學生了解相合性、無偏性、有效性和均方誤差的基本思想,理解相合性、無偏性、有效性和均方誤差的基本概念,熟練掌握相合性、無偏性和有效性的判別方法。教學重點:相合估計、無偏估計和有效性。教學難點:如何確定相合估計、無偏估計和有效性。我們已經看到,點估計有各種不同的求法,為了在不同的點估計間進行比較選擇,就必須對各種點估計的好壞給出評價標準。數理統計中給出了眾多的估計量評價標準,對同一估計量使用不同的評價標準可能會得到完全不同的結論,因此,在評價某一個估計好壞時首先要說明是在哪一個標準下,否則所論好壞毫無意義。但在諸多標準中,有一個基本標準是所有的估計都應該滿足的,它是衡量一個估計是否可行的必要條件,這就是估計的相合性,我們就從相合性開始介紹。一、相合性我們知道,點估計是一個統計量,因此它是一個隨機變量,在樣本量一定的條件下,我們不可能要求完全等同于參數的真實取值,但如果我們有足夠的觀測值,根據格里紋科定理,隨著樣本量的不斷增大,經驗分布函數逼近真實分布函數,因此完全可以要求估計量隨著樣本量的不斷增大而逼近參數真值,這就是相合性,嚴格定義如下,定義2.設 為未知參數, 是的一個估計量,n是樣本容量,若對任何一個 ,有收集于網絡,如有侵權請聯系管理員刪除精品文檔則稱 為參數的相合估計相合性被認為是對估計的一個最基本要求,如果一個估計量,在樣本量不斷增大時,它都不能把被估參數估計到任意指定的精度,那么這個估計是很值得懷疑的,通常,不滿足相合性要求的估計一般不予考慮,證明估計的相合性一般可應用大數定律或直接由定義來證。例11.用大數定律證明 是 的相合估計證:由切比雪夫大數定律∴即∴ 是 的相合估計為了避免用定義判斷相合性的困難,下面介紹一個判斷相合性很有用的定理:定量:設 是的估計量若(1)(2)則 是的相合估計。例12.證明 是 的相合估計證:在前面我們已經證明1)2)∴ 是 的相合估計二、無偏性相合性是大樣本下估計量的評價標準,對小樣本而言,需要一些其他的評價標準,無偏性便是一個常用的評價標準。設 是的一個估計, 的參數空間為 ,若對任意的 ,有則稱 是的無偏估計,否則稱為有偏估計。例13.對任一總體而言,樣本均值是總體均值的無偏估計,當總體 k階矩存在時,樣本k階原點矩 是總體k階原點矩 的無偏估計,但對 k階中心矩則不一收集于網絡,如有侵權請聯系管理員刪除精品文檔樣,例如,二階樣本中心矩 就不是總體方差 的無偏估計,事實上,對此,有如下兩點說明(1)當樣本量趨于無究時,有,我們稱為的漸近無偏估計,這表明當樣本量較大時,可近似看作的無偏估計(2)若對 作如下修正:則 是總體方差的無偏估計,這種簡章的修正方法在一些場合常被采用, 它比 更常用,這是因為在 n≥2時, <,因此用 估計 有偏小的傾向,特別在小樣本場合要使用 估計 。無偏性不具有不變性。即若 是的無偏估計,一般而言, g()不是g()的無偏估計,除非 g()是的線性函數,例如, 是 的無偏估計,但 s不是 的無偏估計例14.證明 是的無偏估計。其中 是X的樣本證:====∴特別情形 是的無偏估計例15.證明 是 的無偏估計證 ∵∴==∴三、有效性參數的無偏估計可以有很多,那么如何在無偏估計中進行選擇?直觀的想法是希望該估計圍繞參數真值的波動越小越好,波動的大小可以用方差來衡量,因此人們常用無偏估計的方差的大小作為度量無偏估計優劣的標準,這就是有效性。定義4.設 , 是的兩個無偏估計,如果對任意的 有 則稱 比收集于網絡,如有侵權請聯系管理員刪除精品文檔有效例16.設x1,?xn是取自某總體的樣本,記總體均值為 ,總體方差為 ,則都是 的無偏估計,但 顯然,只要n>1, 比 有效,這表明,用全部數據的平均估計總體均值要比只使用部分數據更有效。例17.比較 與 誰有效解:(1)∴ 與 都是 的無偏估計2)==∵∴ 比 有效例18.設 ,從總體中取樣證明 是的無偏估計和相合估計解:(1)∴∴是的無偏估計=是的相合估計收集于網絡,如有侵權請聯系管理員刪除精品文檔第三節 參數的區間估計教學目的:要求學生了解置信區間的基本思想,理解置信區間的基本概念,掌握求置信區間的樞軸量法方法,熟練掌握正態總體參數置信區間的計算公式和大樣本置信區間。能用R軟件計算正態總體參數的置信區間。教學重點:置信區間的思想、概念和樞軸量法方法,計算正態總體參數的置信區間。教學難點:計算單個正態總體的置信區間以及兩個正態總體下的 置信區間。用點估計去估計總體的參數,即使是無偏且有效的,也會由于樣本的隨機性,使得從一個樣本x1,x2,x3,?,xn算得的估計值不一定是被估計的參數的真實值,而且估計值的可靠性并不知道,這是一個重大的問題,因此,必須解決根據估計量的分布,在一定可靠性的程度下指出被估計的總體參數的取值范圍,這正是本節要介紹的參數的區間估計問題。一、置信區間概念為了引入置信區間的概念,請看下面的引例。引例 設某種絕緣子抗扭強度 X服從正態分布 ,其中 未知, 已知( =45公斤·米),試對總體均值 作區間估計。收集于網絡,如有侵權請聯系管理員刪除精品文檔對于區間估計,要選擇一個合適的統計量,若在該總體取一個容量為 n的樣本x1,x2,x3,?,xn,樣本均值為 的點估計即 ,然而我們要給出 的一個區間估計,以體現出估計的誤差,我們知道 。在區間估計問題中,要選取一個合適的估計函數。這時,可取 ,它是 的標準化隨機變量,且具備下面兩個特點:1)u中包含所要估計的未知參數(其中已知);2)u的分布為N(0,1),它與未知參數無關。因為u~N(0,1),因而有,根據u~N(0,1)的概率密度 的對稱性(見下圖)可得 。當α=0.05時,1-α=0.095, =1.96,將不等式 轉化為 ,亦即,因此有。當α=0.05時, 。。收集于網絡,如有侵權請聯系管理員刪除精品文檔說明未知參數 包含在區間中 的概率是95%,這里,不僅給出了 的區間估計,還給出了這一區間估計的置信度(或置信概率)。事實上,當置信度為 1-α時,區間估計為在引例中,若 =160, =40,n=16。則有說明該絕緣子抗扭強度 X的期望 在(140.4,179.6)內的可靠度為 0.95。下面,引出置信區間的概念。定義5.設為總體的未知參數 是由樣本 定出的兩個統計量,若對于給定的概率 1-α(0<α<1),有,則隨機區間 稱為參數 的置信度為1-α的置信區間, 稱為置信下限, 稱為置信上限。置信區間的意義可作如下解釋: 包含在隨機區間 中的概率為100(1-α)%;或者說,隨機區間 以100(1-α)%的概率包含 。粗略地說,當α=0.05時,在100次的抽樣中,大致有 95次包含在 中,而其余5次可能不在該區間中。α常取的數值為 0.05,0.01,此時置信度 1-α分別為0.95,0.99。置信區間的長度可視為區間估計的精度,下面分析置信度與精度的關系。1)當置信度1-α增大,又樣本容量n固定時,置信區間長度增大,即區間估計精度減低;當置信度1-α減小,又樣本容量n固定,置信區間長度減小,即區間估計精度提高。2)設置信度1-α固定。當樣本容量n增大時,置信區間減小(如引例中,置信區間長度為),區間估計精度提高。二、單個正態總體參數的置信區間正態總體 是最常見的分布,本小節中我們討論它的兩個參數的置信區間。已知時的置信區間收集于網絡,如有侵權請聯系管理員刪除精品文檔設總體X服從正態分布,其中已知,而未知,求的置信度1-α的置信區間。這一問題實際上已在引例中的討論中解決,得到。所以 的置信度1-α的置信區間為。當α=0.05, =1.96;當α=0.01, =2.576。例1.某車間生產滾珠,從長期實踐知道,滾珠直徑 X服從正態分布。從某天產品里隨機抽取 6個,測得直徑為(單位:毫米):14.6,15.1,14.9,14.8,15.2,15.1。若總體方差 =0.06,求總體均值 的置信區間(α=0.05,α=0.01)。解 ,=0.05時,置信度為95%的置信區間為=0.01時,置信度為99%的置信區間為。從此例知,在樣本容量n固定時,當置信度1-α較大時,置信區間長度較大;當置信度1-α較小時,置信區間較小。例2.用天平稱量某物體的質量 9次,得平均值為 =15.4(g),已知天平稱量結果為正態分布,其標準差為 0.1g,試求該物體質量的 0.95置信區間。解此處1-α=0.95,α=0.05,查表知u0.025=1.96,于是該物體質量 的0.95的置信區間為,從而該物體質量的 0.95置信區間為[15.3347,15.4653]。例3.設總體為正態分布 ,為得到 的置信水平為 0.95的置信區間長度不超過1.2,樣本容量應為多大?解由題設條件知 的0.95置信區間為,收集于網絡,如有侵權請聯系管理員刪除精品文檔其區間長度為 ,它僅依賴于樣本容量 n而與樣本具體取值無關。現要求 ,即有 。現1-α=0.59,故 =1.96,從而。即樣本容量至少為11時才能使得的置信水平為0.95的置信區間長度不超過1.2。未知時的置信區間這時可用t統計量,因為 ,完全類似于上一小節由于t(n-1)分布的概率密度 f(x)的對稱性有(見下圖)解得其中 是 的無偏估計。例4.假設輪胎的壽命服從正態分布。為估計某種輪胎的平均壽命,現隨機地抽12只輪胎試用,測得它們的壽命(單位:萬千米)如下:4.684.854.324.854.615.025.204.604.584.724.384.70試求平均壽命的0.95置信區間。收集于網絡,如有侵權請聯系管理員刪除精品文檔解此處正態總體標準差未知,可使用 t分布求均值的置信區間。本例中經計算有 =4.7092,s2=0.0615。取α=0.05,查表知t0.025(11)=2.2010,于是平均壽命的0.95置信區間為(單位:萬千米)。的置信區間此時雖然也可以就 是否已知分兩種情況討論 的置信區間,但在實際問題中 未知時 已知的情況是極為罕見的,所以我們只在 未知的條件下討論 的置信區間。設x1,x2,x3,?,xn為來自總體 X的樣本,樣本方差 s2可作為 的點估計。由,中包含未知參數 ,又它的分布與 無關,以 作為估計函數,可用于的區間估計。由于 分布是偏態分布,尋找平均長度最短區間很難實現,一般都改為尋找等尾置信區間:把 α平分為兩部分,在 分布兩側各截面積為 的部分,即采用 的的兩個分位數它們滿足 。(見下圖)收集于網絡,如有侵權請聯系管理員刪除精品文檔將上式開方即可得標準差 的置信區間。例5.某廠生產的零件質量 X服從正態分布 。現從該廠生產的零件中抽取9個,測得其質量為(單位: g)45.345.445.145.345.545.745.445.345.6試求總體標準差 的0.95置信區間。解由數據可算得 s2=0.0325,(n-1)s2=8×0.0325=0.26,這里α=0.95,查表知 代入公式可得 的0.95置信區間為。從而 的0.95置信區間為[0.1218,0.3454]。以上關于正態總體參數的區間估計的討論列表如下表所示。收集于網絡,如有侵權請聯系管理員刪除精品文檔本章小結本章考核要求:(一)點估計1)知道點估計的概念2)會用矩法求總體參數的矩估計值,主要依據是(3)會用最大似然估計法求總體參數的估計值。基本方法是由樣本 x1,x2,x3,?,xn構造一個似然函數或似然函數的對數L(x1,x2,x3,?,xn,)=P(X=x1)P(X=x2)?P(X=xn)L(x1,x2,x3,?,xn,)=f(x1)f(x2)?f(xn)然后由lnL(x1,x2,x3,?,xn,)取最大的值時的 值 為的值,即。 是L的最大值點。(二)點估計量的評價標準(1)若 ,則 是的無偏估計。收集于網絡,如有侵權請聯系管理員刪除精品文檔(2)若 都是 的無偏估計,且 就說 有效。(3)若 。就說是 的相合估計以上三條標準中主要掌握無偏估計和有效估計(三)區間估計(1)知道區間估計的概念(2)會求一個正態總體 的參數 的置信區間。公式見表7-1第三章 假設檢驗本章主要介紹統計假設檢驗的基本思想和概念以及參數的假設檢驗方法。第一節 假設檢驗的基本思想和概念教學目的:要求學生了解假設檢驗的基本思想,理解假設檢驗的基本概念,認識假設檢驗問題,熟悉假設檢驗的基本步驟。教學重點:基本概念,假設檢驗的基本步驟 .教學難點:基本概念的理解.一、統計假設的概念為了引入統計假設的概念,先請看例 8-1。例1.味精廠用一臺包裝機自動包裝味精,已知袋裝味精的重量,機器正常時,其均值 =0.5(0.5,0.015的單位都是公斤)。某日開工后隨機抽取 9袋袋裝味精,其凈重(公斤)為:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512問這臺包裝機是否正常?此例隨機抽樣取得的9袋味精的重量都不正好是0.5公斤,這種實際重量和標準重量不完全一致的現象,在實際中是經常出現的。造成這種差異不外乎有兩種原因:一是偶然因素的影響,收集于網絡,如有侵權請聯系管理員刪除精品文檔二由于偶然因素而發生的(例如電網電壓的波動、金屬部件的不時伸縮、衡量儀器的誤差而引起的)差異稱為隨機誤差;由于條件因素(生產設備的缺陷、機械部件的過度損耗)而產生的差異稱為條件誤差。若只存在隨機誤差,我們就沒有理由懷疑標準重量不是0.5公斤;如果我們有十足的理由斷定標準重量已不是0.5公斤,那么造成這種現象的主要原因是條件誤差,即包裝機工作不正常,那么,怎樣判斷包裝機工作是否正常呢?我們通過解例 1來找出解假設檢驗問題的思想方法。解已知袋裝味精重 ,假設現在包裝機工作正常,即提出如下假設:,這是兩個對立的假設,我們的任務就是要依據樣本對這樣的假設之一作出是否拒絕的判斷。由于樣本均值 是 的一個很好的估計,故當 為真時, 應很小。當 過分大時,我們就應當懷疑 不正確而拒絕 。怎樣給出 的具體界限值 呢?當 為真時,由于 ,對于給定的很小的數 0<α<1,例如取=0.05,考慮,其中 是標準正態分布上側 分位數,而事件是一個小概率事件,小概率事件在一次試驗中幾乎不可能發生。我們查附表1得 ,又n=9,=0.015,由樣本算得 ,又由上式得:收集于網絡,如有侵權請聯系管理員刪除精品文檔小概率事件居然發生了,這與實際推斷原理相矛盾,于是拒絕 ,而認為這臺包裝機工作不正常。從上面的例1中,我們看出為了對總體的某一參數進行檢驗,通常提出兩個假設:。然后引入一個與被檢參數有關的服從某種分布的統計量,根據事先給出的一概率標準α(叫顯著水平)用反證法進行判斷,由于小概率事件一般是不會發生的,如果引進的樣本是一個小概率事件,因為它的確出現了,則可認為假設不能接受,否則便接受。(二)假設檢驗的程序根據以上的討論與分析,可將假設檢驗的基本步驟概括如下:(1)根據實際問題提出原假設 及備擇假設 。這里要求 與 有且僅有一個為真。(2)選取合適的統計量,即要求所選的統計量與假設 無關且服從某種分布,常見的有標準正態分布 t(n-1)分布, (n-1)分布及F(m,n)公布。3)規定小概率標準α的大小,也叫顯著水平,通常可取α=0.01,α=0.05或α=0.。14)在顯著水平α下,根據統計量的分布將樣本空間劃分為兩部分,其一是接受的叫接受域,另一個是拒絕 的叫拒絕域,記為 W。5)根據樣本值計算統計量的大小。6)作出判斷:若統計量的觀測值落在拒絕域W內。則知小概率事件發生了,拒絕,接受 。若統計量的觀測值落在接受域則認為小概率事件沒有發生,可以接受 拒絕 。第二節總體均值的假設檢驗教學目的:理解和掌握單個以及兩個正態總體均值的假設檢驗的方法與思想,掌握正態總體方差檢驗的方法,能用 R軟件來完成這些檢驗。教學重點:檢驗方法的掌握,檢驗方法思想的理解。教學難點:檢驗方法的掌握。本節討論的總體均值的假設檢驗,多數是在正態總體下進行的。一、u檢驗收集于網絡,如有侵權請聯系管理員刪除精品文檔方差已知時,單個正態總體均值檢驗2. 設x1,?,xn是從正態總體 中抽取的一個樣本, 是已知常數,欲檢驗假設:,其中 為已知數,它的程序:1)提出假設2)引入統計量3)規定顯著水平α,查標準正態分布表求的上側分位數為臨界值,寫出相應的拒絕域其中常用的有 α=0.1時,=0.05時,=0.01時,(4)根據樣本值 x1,x2,?,xn計算統計量u。(5)判斷:若 u落入拒絕域W內時,則拒絕 接受,若u落入接受域內時,則接受 ,拒絕。例2.某產品的重量 X~N(12,1)(單位:克),更新設備后,從新生產的產品中抽樣 100件,測試樣本均值 (克),如果產品的方差沒有改變,請問更新設備后,產品的平均重量是否有明顯變化?( α=0.01)解(1)設2)引入3)根據α=0.01,查標準正態分布函數表,得的上側分位數∴拒絕域為(-∞,-2.58),(2.58,+∞)收集于網絡,如有侵權請聯系管理員刪除精品文檔4)計算5)∵u落入拒絕域W中,故拒絕,即有明顯差別。2.方差已知時,兩個正態總體值差的檢驗設 ,其中 為已知常數。x1,?,xm和y1,?,yn分別是取自X和Y的樣本且相互獨立。欲檢驗假設:檢驗假設 ,等價于檢驗假設 。而是 的一個好估計量,且當為真時,有)于是對給定的水平 α,查附表1,可得臨界值 ,使()從而得拒絕域,若u∈W,則拒絕;否則接受。由上述討論可知,由服從標準正態分布的檢驗統計量作檢驗的方法稱為u檢驗法。例3.設 從中各抽樣25件測得=90, =89。設X,Y獨立,請問是否可以認 與 基本相同?α=0.05)解(1)(2)引進統計量收集于網絡,如有侵權請聯系管理員刪除精品文檔(3)根據α=0.05,查標準正態分布函數表將∴拒絕域W為(-∞,-1.96),(1.96,+ )∞4)計算5)∵u在接受域內,∴接受,即與差別不大。二、t檢驗方差未知時,單個正態總體均值檢驗設x1,?,xm是從正態總體 中抽取的一個樣本,其中 未知,欲檢驗(1) ,其中 為已知數。2)構造統計量3)給定顯著水平α,查t(n-1)表求分位數則拒絕域(4)根據樣本x1,x2,?,xn計算(5)若t落在拒絕域 W內,則拒絕 ,接受 。若t未落在拒絕域內,則接受 ,拒絕 。例4.車輛廠生產的螺桿直徑 X服從正態分布 ,現從中抽取 5枝,測得直徑(單位:毫米)為22.3,21.5,22.0,21.8,21.4。如果未知,試問直徑均值=21是否成立?(α=0.05)解檢驗假設(1) ,收集于網絡,如有侵權請聯系管理員刪除精品文檔由樣本觀測值算得(2) ,3)計算4)根據α=0.05,查t(n-1)分布表臨界值 。∴拒絕域為5)∵t=4.87在拒絕域內∴否定 ,接受 。即認為直徑均值不是 21。方差未知時,兩個正態總體均值檢驗設 和 分別是取自 X和Y的樣本且相互獨立。(1) ( 未知)。欲檢驗假設(2)構造統計量。t即為我們構造的檢驗統計量。這時,對給定的水平 α,查附表3可得臨界值,使,即得拒絕域。例5.在漂白工藝中考察溫度對針織品斷裂強度的影響,現在 70℃與80℃下分別作8次和6次試驗,測得各自的斷裂度 X和Y的觀測值。經計算得, 。根據以往的經驗,可認為 X收集于網絡,如有侵權請聯系管理員刪除精品文檔和Y均服從正態分布,且方差相等,在給定 α=0.10時,問70℃與80℃對斷裂強度的無顯著差異?解 由題設,可假定 ,于是若作統計假設為兩個溫度下的斷裂強度無顯著性差異,即相當于作假設(1) 。2)構造統計量3)α=0.10,查得t(m+n-2)=t(12)表,得臨界值。∴拒絕域W為(-∞,-1.782)∪(1.782,+∞)(4)計算(5)因為t落在拒絕域W內,所以拒絕 ,接受 。即認為斷裂強度有明顯差別。收集于網絡,如有侵權請聯系管理員刪除精品文檔第三節 正態總體方差的假設檢驗教學目的:了解指數分布參數的假設檢驗,比例的檢驗,大樣本檢驗,能用 R軟件來完成這些檢驗,會解決簡單的實際問題。教學重點:對于檢驗方法的理解。教學難點:解決簡單的實際問題。在實際問題中,有關方差的檢驗問題也是常遇到的,如上節介紹的 u檢驗和t檢驗中均與方差有密切的聯系。因此,討論方差的檢驗問題尤為重要。一、 檢驗設總體 未知,x1,?,nx為取自X的樣本,欲檢驗假設其中 為已知數。自然想到,看 的無偏估計s2有多大,當H0為真時,s2應在 周圍波動,如果很大或很小,則應否定 H0,因此構造檢驗統計量。對于給定的顯著水平 α,可查 (n-1)表可得分位數收集于網絡,如有侵權請聯系管理員刪除精品文檔∴拒絕域W為 。若統計量 落在拒絕域W內,則拒絕 ,接受。若統計量 落在接受域內,則接受 ,拒絕 。例6.設某廠生產銅線的折斷力 ,現從一批產品中抽查 10根測其折斷力后經計算得樣本均值 =575.2,樣本方差s2=68.16。試問能否認為這批銅線折斷2力的方差仍為 8(公斤)(取 α=0.05)?(1) ,2)引進統計量3)根據α=0.05,查(n-1)=(9)表得臨界值于是得拒絕域(4) 。(5)計算由于 不在拒絕域W內,故不拒絕 ,即可認為該批銅線折斷力的方差與 82(公斤)無顯著差異。二、F檢驗前面介紹的用t檢驗法檢驗兩個獨立正態總體的均值是否相等時,曾假定它們的方差是相等的。一般說來,兩個正態總體方差是未知的,那么,如何來檢驗兩獨立正態總體方差是否相等呢?為此介紹F檢驗法。設有兩正態總體 和 分別是取自X和Y的樣本且相互獨立。欲檢驗統計假設。由于 是 的無偏估計, 是 的無偏估計,當 為真時,自然想到 和 應該差不多,其比值 不會太大或大小,現在關鍵在于統計量 服從什么分布。由§6.3節定理收集于網絡,如有侵權請聯系管理員刪除精品文檔6-4推論我們知道,當 為真時,這樣,取F為檢驗統計量,對給定的水平 α,查附表5,確定臨界值使。即得拒絕域 。若由樣本觀測值算得 F值,當F∈W時,拒絕 ,即認為兩總體方差有顯著差異。否則認為與 相容,即兩總體方差無顯著差異。例7.設甲、乙兩臺機床加工同一種軸,從這兩臺機床加工的軸中分別抽取若干根,測得直徑數據如下假定各臺機床加工軸的直徑X,Y分別服從正態分布,試比較甲、乙兩臺機床加工軸的精度有無顯著差異(取α=0.05)。解 按題意,本題是要檢驗兩正態總體的方差 是否相等,即要檢驗統計假設1)2)引入統計量3)根據α=0.05查F(7,6)表得于是,∴拒絕域W為(0,0.195)∪(5.70,+∞)4)計算5)∵F不在拒約域W內,∴接受 ,即方差無明顯差別。收集于網絡,如有侵權請聯系管理員刪除精品文檔第四節 單邊檢驗實際問題中,有時我們只關心總體的均值是否會增大,例如,試驗新工藝以提高產品的質量,如材料的強度、元件的使用壽命等,當然,總體的均值越大越好,此時,需要檢驗假設。。其中 是已知常數。類似地,如果只關心總體的均值是否變小,就需要檢驗假設,下面以單個正態總體方差已知情況為例,來討論均值 的單邊檢驗的拒絕域。設總體 為已知。x1,?,xn,是取自X的一個樣本,給定檢驗水平,α考慮單邊假設問題。,由于是 的無偏估計,故當 為真時, 不應太大,而當 u偏大時應拒絕 ,故拒絕域的形式為: ,c待定,由于 ,故可找臨界值 α,收集于網絡,如有侵權請聯系管理員刪除精品文檔使當成立時,,因此,。由事件 是一個小概率事件知,事件 更是一個小概率事件。如果根據所給的樣本觀測值, x1,?,xn算出 ,則應該否定原假設,即拒絕域為W=(uα,+∞)。當 時,我們不否認原假設類似地,對于單邊假設檢驗問題:,仍取 為檢驗統計量,但拒絕域為W=(-∞,-uα),即當由樣本觀測值算出 時,則應拒絕原假設 。我們已注意到,上 單邊檢驗問題,與單個正態總體方差情況的均值 的雙邊檢驗述 問題一樣,其所用的檢驗統計量和檢驗步驟完全相同,不同的只是拒絕域。我們著重指出:單邊檢驗問題的拒絕域,其不等式的取向,與備擇假設的不等式取向完全一致。這一特有的性質使我們無需特別記憶單邊檢驗的拒絕 因此,若遇上本章 §8.2,§8.3中相應的單邊檢驗問域。 題,則只要作類似的處理就行了,例如:設總體 ,欲檢驗統計假設收集于網絡,如有侵權請聯系管理員刪除精品文檔,其中 為已知數。這時,由雙邊檢驗問題中的 檢驗知。檢驗統計量可取 。若由樣本觀測值算出 ,則當 時拒絕 ,即拒絕域為,此不等式取向與備擇假設取向一致。若欲檢驗則檢驗統計量仍取 ,拒絕域為: ,即W=(0, )類似地,兩個總體 和 分別是取自X和Y的樣本且相互獨立。欲檢驗統計假設。這時,類似于雙邊檢驗問題,檢驗統計量可取 ,拒絕域為,即 。各種統計假設檢驗情況(檢驗水平為 α)如下表所示。收集于網絡,如有侵權請聯系管理員刪除精品文檔例8.用某種農藥施入農田中防治病蟲害,經三個月后土壤中如有5ppm以上的濃度時,認為仍有殘效,現在一大田施藥區隨機取10個土樣進行分析,其濃度為:4.8,3.2,2.0,6.0,5.4,7.6,2.1,2.5,3.1,3.5(單位:ppm)。問該農藥經三個月是否仍有殘效(土壤殘余農藥濃度服從正態分布α=0.05)?解顯然,我們關心的只是總體均值 是否小于 ,這時若用雙邊檢驗是不恰當有,所以我們應該檢驗 。這時,檢驗統計量應取 ,對于給定的顯著性水平α=0.05,查t分布表得由樣本算得 T的觀測值t=-1.45>-1.83,不能拒絕H0,即沒有理由懷疑該農藥已無殘效。收集于網絡,如有侵權請聯系管理員刪除精品文檔例9.某類鋼板每塊的重量X服從正態分布,其一項質量指標是鋼板重量的方差不得超過0.016kg2。現從某天生產的鋼板中隨機抽取25塊,得其樣本方差解這是一個關于正態總體方差的單側檢驗問題,原假設 ,備擇假設為 ,此處n=25。若取α=0.05,則查表知 ,現計算可得。由此,在顯著水平0.05下,我們拒絕原假設,認為該天生產的鋼板重量的方差不符合要求。例10.有一批槍彈,其初速度 ,其中 =950m/s, =10m/s。經過較長時間儲存后,現取出 9發槍彈試射,測其初速度,得樣本值如下(單位:m/s):914,920,910,934,953,945,912,924,940。問這批槍彈在顯著性水平α=0.05下,其初速度是否起了變化(假定 沒有變化)?解由題設,要檢驗的假設為 ,因為槍彈儲存后初速度不可能增加,所以是(左側)單邊檢驗問題,由 n=9,易另算出,查表知-uα=-u0.05=-1.65,所以u=-6.6<-1.65=-uα,故應拒絕H0而接受 ,即認為這批槍彈經過較長時間儲存后初速度已經變小了。收集于網絡,如有侵權請聯系管理員刪除精品文檔第五節 兩類錯誤通過上面分析可知,一個假設檢驗問題,是要先給定一個原假設 H0與備擇假設H1,選出一個合適的檢驗統計量T,由此給出拒絕域W內。再根據在總體抽樣得到的樣本值(x1,x2,?,xn),看它是否落入由檢驗統計量T定出的拒絕域W內。當(x1,x2,?,xn)∈W時,就拒絕 H0(即接受H1);而當(x1,x2,?,xn)∈W時,接受H0。這樣的假設檢驗有可能犯錯誤。數理統計的任務本來是用樣本去推斷總體,即從局部去推斷整體,當然有可能犯錯誤。我們來分析會犯什么類型的錯誤。一類錯誤是:在 H0成立的情況下,樣本值落入了 W,因而H0被拒絕,稱這種錯誤為第一類錯誤,又稱為拒真錯誤,一般記犯第一類的概率為 α。另一類錯誤是:在 H0不成立的情況下,樣本值未落入拒絕域 W,因而H0被接受,稱這種錯誤為第二類錯誤,又稱為取偽錯誤,并記犯第二類錯誤的概率為 。第一類錯誤在例 8-1中我們分析過。因為,在H0成立條件下,根據樣本值算得的u滿足“”,即樣本值落入拒絕域W,從而拒絕了H0。由此可見,犯第一類錯誤的概率即為α,而α即為顯著性水平。一般地,有,要尋找合適的檢驗統計量 T,使得由它定出的拒絕域 W滿足犯第一類錯誤的概率不超過 α,犯第二類錯誤的概率為現列表說明兩類錯誤,見下表:人們當然希望在假設檢驗問題中犯兩類錯誤的概率 都盡可能小,然而在樣本容量固定時是做不到的。人們發現:1)兩類錯誤的概率是相互關聯的。當樣本容量n固定時,一類錯誤的概率的減少將導致另一類錯誤的概率的增加。2)要同時降低兩類錯誤的概率,需要增大樣本容量n。收集于網絡,如有侵權請聯系管理員刪除精品文檔本章小結(一)理解假設檢驗的基本思想,知道假設檢驗的步驟。(二)知道兩類錯誤(三)掌握單個正態總體的均值和方差的檢驗方法,并會簡單應用,這是本章主要重點。(四)兩個正態總體 會檢驗(1) ,(2) ,收集于網絡,如有侵權請聯系管理員刪除精品文檔第四章 回歸分析教學目的:理解變量間的兩類關系,認識一元線性和非線性回歸模型,熟悉回歸系數的估計方法,熟練掌握回歸方程的顯著性檢驗。能用 R軟件來進行回歸分析,會解決簡單的實際問題。教學重點:回歸系數的估計方法,回歸方程的顯著性檢驗 .教學難點:回歸方程的顯著性檢驗 .在現實世界中,不少變量之間是存在著一定的關系的,一般來說,這種關系大體上可分為兩類,一類是確定性的,即函數關系。例如,電路中的電壓 V,電流I,電阻R三者間有關系 。另一類是非確定性的,這類變量之間雖有一定的關系卻又并不完全確定,例如人的血壓與年齡有關,煉鋼過程中含碳量與精煉時間有關,農作物產量與施肥量和單位面積的播種量有關??這些變量之間雖有一定聯系,但又不能用普通函數關系式來表達。例如對給定的施肥量和確定的播種量,農作物的產量還是不能完全確定的。事實上,這些變量是隨機變量或至少其中一個是隨機變量。這種非確定性的關系稱為相關關系。回歸分析是研究相關關系的一種數學工具,是數理統計學中最常用的統計方法之一,在生產實踐和科學研究中有著廣泛的應用。本章僅簡單介紹一元線性回歸分析。第一節 回歸直線方程的建立為了說明一元線性回歸的數學模型,我們先看一個實際例子。例1.某種合金的抗拉強度y(kg/mm2)與其中的含碳量x(%)有關,現測12對數據如表1所示。表1x0.100.110.120.130.140.150.160.170.180.200.210.23y42.043.545.045.545.047.549.053.050.055.055.060.0為了了解其相關關系的表達式,在坐標上以(xi,yi),i=1,2,?,12為點,畫出散點圖如圖9-1所示,這些點大體上散布在某條直線的周圍,又不完全在一條直線上,從而可認為y與x的關系基本上是線性的,而這些點與直線的偏離是由其他一切隨機因素的影響造成的。一般說來,含碳量x是一個可觀測或可控制的普通變量,而對任意一個含碳量x,相應的抗拉強度是一個隨機變量Y,實際觀測值y是Y的一個可能取值。隨x的變化,Y的觀測值線性變化的趨勢可表示為收集于網絡,如有侵權請聯系管理員刪除xi與yi之間有如下關系精品文檔。其中表示Y隨x的變化而線性變化的部分,是一切隨機因素影響的總和,稱為隨機誤差項,它是不可觀測其值的隨機變量,在Y的方差時,是一個E()=0,D()的隨機變量,在涉及分布時,可進一步假定。一般地,將1,x2,?,xn,通過試驗得到對應的Yx取一組不同的值,x的值y1,y2,?,yn,這樣就得到 n對觀測值(xi,yi),i=1,2,?,n。可把y的值看成由兩部分疊加而成,一部分是 x的線性函數 ,另一部分系試驗過程中其他一切隨機因素的影響。因此,由上式可認為,(i=1,2,?,n),且各相互獨立。此式就是一元線性回歸的數學模型。回歸分析的基本問題是依據樣本( xi,yi),i=1,2,?,n解決如下問題:(1)未知參數 及 的點估計,若 分別為 的估計,由此得。上式是抽述 Y與x之間關系的經驗公式。我們稱上式為 Y關于x的一元線性回歸方程,它就是我們要求的 y與x之間的定量關系的表達式,其圖像便是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江西省贛州市章貢區2025屆初三第四次月考(生物試題)試題含解析
- 內蒙古工業大學《植物造景技術(一)》2023-2024學年第二學期期末試卷
- 四川傳媒學院《設計素描(一)》2023-2024學年第二學期期末試卷
- 惠民縣2024-2025學年四下數學期末經典模擬試題含解析
- 昆明學院《模具制造工藝及設備》2023-2024學年第二學期期末試卷
- 浙江旅游職業學院《文創設計》2023-2024學年第二學期期末試卷
- 清華大學《文化政策與法規》2023-2024學年第一學期期末試卷
- 樂山職業技術學院《品牌與消費研究》2023-2024學年第二學期期末試卷
- 江西省贛州市寧都縣三中2025年高三第三次階段考試英語試題含解析
- 陜西省興平市華興中學2024-2025學年初三統一質量檢測試題生物試題試卷含解析
- MT 191-1989煤礦井下用橡膠管安全性能檢驗規范
- JJF 1319-2011傅立葉變換紅外光譜儀校準規范
- GB/T 4857.4-2008包裝運輸包裝件基本試驗第4部分:采用壓力試驗機進行的抗壓和堆碼試驗方法
- GB/T 25174-2010飼料添加劑4,7-二羥基異黃酮
- GB/T 17421.2-2000機床檢驗通則第2部分:數控軸線的定位精度和重復定位精度的確定
- GB/T 17311-1998標準音量表
- 耳鼻咽喉15種臨床路徑(整理完整版)
- GB 26851-2011火災聲和/或光警報器
- 司法鑒定人執業能力評估業務理論知識考試題庫
- 110KV 線路保護調試報告
- Xie-AI-第2章-知識表示方法
評論
0/150
提交評論