第四章 統(tǒng)計推斷_第1頁
第四章 統(tǒng)計推斷_第2頁
第四章 統(tǒng)計推斷_第3頁
第四章 統(tǒng)計推斷_第4頁
第四章 統(tǒng)計推斷_第5頁
已閱讀5頁,還剩88頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章統(tǒng)計推斷第一頁,共九十八頁,2022年,8月28日總體與樣本之間的關(guān)系包括兩個方面:從總體到樣本的研究;由樣本推斷總體,它是以各種樣本統(tǒng)計量的抽樣分布為基礎(chǔ)的,一般是正態(tài)分布、t分布、χ2分布和F分布。對總體做統(tǒng)計推斷有兩種途徑,在實際應(yīng)用時可互相參照使用首先對所估計的總體做一假設(shè),然后通過樣本數(shù)據(jù)推斷這個假設(shè)是否接受,這種途徑稱為統(tǒng)計假設(shè)檢驗通過樣本統(tǒng)計量估計總體參數(shù),稱為總體參數(shù)估計第二頁,共九十八頁,2022年,8月28日總體樣本統(tǒng)計量(X)估計&檢驗第三頁,共九十八頁,2022年,8月28日總體抽樣樣本(實驗結(jié)果)檢驗(抽樣分布規(guī)律)接受拒絕小概率事件未發(fā)生小概率事件發(fā)生某種假設(shè)統(tǒng)計假設(shè)檢驗圖解第四頁,共九十八頁,2022年,8月28日總體我相信人的平均血紅蛋白含量是126g(零假設(shè))Mean

X=136隨機樣本接受零假設(shè)!

拒絕備擇!4.1單個樣本的統(tǒng)計假設(shè)檢驗一、一般原理及兩種類型的錯誤基本思想抽樣分布P50第五頁,共九十八頁,2022年,8月28日m

=126H0我們能得到一個均值是136樣本因而我們接受零假設(shè)

=126樣本平均數(shù)136P=0.114第六頁,共九十八頁,2022年,8月28日假設(shè)零(無效)假設(shè):記為H0,假設(shè)總體的平均數(shù)μ等于某一給定的值μ0,即μ-μ0=0,記為

H0:μ-μ0=0(零假設(shè)是針對實驗考查的內(nèi)容提出的,就是處理無效,在P50例子中考查的內(nèi)容是:在這種藥物下能否提高血紅蛋白含量,所以在例子中零假設(shè)記為,H0:μ=μ0(126g)備擇假設(shè):與零假設(shè)相對的假設(shè)記為HA,它是在拒絕H0的情況下,可供選擇的假設(shè)如HA:μ>μ0,HA:μ<μo及HA:μ≠μ0。備擇假設(shè)的選定視實際情況而定。

在例子中備擇假設(shè)記為,HA:μ≠μ0(126g)第七頁,共九十八頁,2022年,8月28日小概率原理小概率的事件是指在一次試驗中,幾乎是不會發(fā)生的事件。若根據(jù)一定的假設(shè)條件計算出來的該事件發(fā)生的概率很小,而在一次試驗中它竟然發(fā)生了,則可認為原假設(shè)條件不正確,給予否定。根據(jù)小概率原理所建立起來的檢驗方法稱為顯著性檢驗。在生物統(tǒng)計工作中,通常規(guī)定5%或1%以下為小概率,稱為顯著性水平,記為“α”。檢驗統(tǒng)計量:u

t

χ2

F

等第八頁,共九十八頁,2022年,8月28日例4.1用實驗動物作實驗材料,現(xiàn)從一批動物中抽取含量n=10的樣本并已經(jīng)計算出平均值為10.23克。要求動物滿足平均體重μ=10.00g,σ=0.4的正態(tài)分布總體,若μ<10.00g需再飼養(yǎng),若μ>10.00g則應(yīng)淘汰,問此批動物材料是否淘汰(顯著性水平α=0.05)?

從正態(tài)分布表查出P=0.03438<0.05,或查α=0.05時的uα=1.645<1.82,表明這是一個小概率事件。結(jié)果:該樣本幾乎不可能抽自μ=10.00g的總體。結(jié)論?解:該樣本平均數(shù)滿足正態(tài)分布。零假設(shè)H0:μ=μ0=10.00(g)備擇假設(shè)HA:μ>10.00(g)第九頁,共九十八頁,2022年,8月28日單側(cè)檢驗(one-sidedtest)上尾檢驗:拒絕H0后,接受μ>μ0,如左圖。下尾檢驗:拒絕H0后,接受μ<μ0,如右圖。樣本統(tǒng)計量樣本統(tǒng)計量樣本統(tǒng)計量臨界值第十頁,共九十八頁,2022年,8月28日雙側(cè)檢驗

在生物學問題中,有時只要考慮μ是否等于μ0,并不關(guān)心究竟是大于還是小于μ0,這時就要使用雙側(cè)檢驗。在α水平上,H0的拒絕域由P(∣U∣>uα/2)=α

決定。拒絕域包括大于uα/2或小于-uα/2的區(qū)域,這兩個尾區(qū)的曲線下面積之和為α。由于單側(cè)檢驗時利用了已知有一側(cè)是不可能的這一條件,從而提高了它的辨別力,所以單側(cè)檢驗比雙側(cè)檢驗的辨別力更強些。實際應(yīng)用時,要盡量選用單側(cè)檢驗,但也要根據(jù)實際情況而定。第十一頁,共九十八頁,2022年,8月28日兩種類型的錯誤Ⅰ型錯誤(α錯誤):當μ=μ0時假設(shè)是正確的,卻錯誤地拒絕了它。犯Ⅰ型錯誤的概率不會大于α。(以真為假——

棄真錯誤)Ⅱ型錯誤(β錯誤):當μ≠μ0但錯誤地接受了μ=μ0的假設(shè)時所犯的錯誤。(以假為真——

存?zhèn)五e誤)第十二頁,共九十八頁,2022年,8月28日關(guān)于兩種類型錯誤的三點解釋為了同時降低α和β就需增加樣本含量,當樣本含量增加后,樣本標準誤降低,曲線就會變得陡峭,則犯兩種錯誤的概率都會降低。樣本含量不變時,你不能同時減少兩類錯誤!當μ1越接近于μ0時,犯Ⅱ型錯誤的概率愈大;當μ1越遠離μ0時,犯Ⅱ型錯誤的概率愈小。在樣本含量和樣本平均數(shù)都固定時,為了降低犯Ⅰ型錯誤的概率α(就應(yīng)將上圖中的豎線右移),必然增加犯Ⅱ型錯誤的概率。第十三頁,共九十八頁,2022年,8月28日兩點說明通常把P<α時,拒絕Ho稱為差異是顯著的。這一結(jié)論嚴格的說應(yīng)當是“由樣本推斷出的總體平均數(shù)μ與μo之間的差異有統(tǒng)計學意義”,即它們屬于兩個不同總體(冒α風險)。統(tǒng)計推斷的目的:?因此,所謂μ和μ0之間的差異有統(tǒng)計學意義是指在給定的樣本含量下推斷出該總體的平均數(shù)μ與μ0來自不同總體。太小的樣本有可能檢驗不出總體之間真正存在的差異,太大時又會在人力物力上投入過多,如何確定合理的樣本含量,是試驗設(shè)計中應(yīng)認真對待的問題。nup結(jié)論第十四頁,共九十八頁,2022年,8月28日二、單個樣本顯著性檢驗的程序1、假設(shè)零假設(shè):根據(jù)經(jīng)驗或?qū)嶒灲Y(jié)果;依據(jù)某種理論或模型;依據(jù)預先的規(guī)定。備擇假設(shè):除零假設(shè)以外的值;擔心會出現(xiàn)的值;希望會出現(xiàn)的值;有重要意義或其他意義的值。2、顯著性水平α=0.10試驗條件下不易控制或易產(chǎn)生較大誤差α=0.05α=0.01容易產(chǎn)生嚴重后果的一些試驗,如藥物的毒性實驗兩種類型的錯誤:α不宜定得太嚴,太嚴會增加β。在條件許可的情況下盡量增加樣本含量n3、確定檢驗方法:u檢驗、t檢驗、X2檢驗、F檢驗等。第十五頁,共九十八頁,2022年,8月28日4、建立在α水平上的Ho的拒絕域(注意單側(cè)或雙側(cè))單側(cè)檢驗時,拒絕域只在零假設(shè)的一側(cè)有一區(qū)間;做雙側(cè)檢驗時,拒絕域在零假設(shè)的兩側(cè)各有一個區(qū)間。5、對推斷的解釋:若統(tǒng)計量的值落在接受域內(nèi),決不是說總體參數(shù)一定等于零假設(shè)的值。對于接受θ=θ0。這一零假設(shè)可以有以下幾種解釋:①零假設(shè)的值是真實的,并產(chǎn)生一個正如我們所見到的樣本。②θ可能非常接近于θ0

。③抽樣結(jié)果符合零假設(shè)的值θ0

,樣本統(tǒng)計量的值與θ0之間的不符合是由于偶然因素造成。第十六頁,共九十八頁,2022年,8月28日三、在σ已知情況下,單個平均數(shù)的顯著性檢驗——u檢驗1、假設(shè)從σ已知的正態(tài)或近似正態(tài)總體中抽出含量為n的樣本。零假設(shè)H0:μ=μ0

備擇假設(shè)HA:①μ>μ0②μ<μ0③μ≠μ02、顯著性水平在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著3、檢驗統(tǒng)計量4、得出結(jié)論并給予解釋第十七頁,共九十八頁,2022年,8月28日例4.3已知豌豆籽粒重量服從正態(tài)分布N(377.2,3.32)在改善栽培條件后,隨機抽取9粒,其籽粒平均重為379.2,若標準差仍為3.3,問改善栽培條件是否顯著提高了豌豆籽粒重量?解①假設(shè):H0:μ=377.2

HA:μ>377.2②顯著性水平:α=0.05③σ已知,使用u檢驗

④H0的拒絕域:因HA:μ>μ0,故為上尾檢驗,當u>u0.05時拒絕H0。u0.05=1.645。⑤結(jié)論:u>u0.05,即P<0.05,所以拒絕零假設(shè)。栽培條件的改善,顯著地提高了豌豆籽粒重量。第十八頁,共九十八頁,2022年,8月28日四、σ未知時平均數(shù)的顯著性檢驗——

t檢驗1、假設(shè)從σ未知的正態(tài)或近似正態(tài)總體中抽出含量為n的樣本。零假設(shè):H0:μ=μ0

備擇假設(shè):HA:①μ>μ0②μ<μ0③μ≠μ02、顯著性水平:在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著3、檢驗統(tǒng)計量:當σ未知時以s代替之,標準化的變量稱為t,服從n-1自由度的t分布。4、相應(yīng)于1中各備擇假設(shè)之H0的拒絕域:①t>tα②t<-tα③|t|>tα/25、得出結(jié)論并給予解釋。

t檢驗不如u檢驗精確第十九頁,共九十八頁,2022年,8月28日例4.4已知某玉米種群的平均穗重μ0=300g,σ0=9.5g。噴藥后,隨機抽取9個果穗,其穗重為:308、305、311、298、315、300、321、294、320g。問噴藥前后的果穗重差異是否顯著?解:①假設(shè):H0:μ=300HA:μ≠300

藥物濃度適合時可促進生長,濃度過高反而會抑制生長,所以噴藥的效果未知,需采用雙側(cè)檢驗。②顯著性水平:α=0.05③σ未知應(yīng)使用t檢驗,已計算出=308,s=9.62④H0的拒絕域:因HA:μ≠μ0,故為雙側(cè)檢驗,當|t|>t0.025時拒絕H0。t0.025=2.306。⑤結(jié)果:因|t|>t0.025,即P<0.05,所以拒絕零假設(shè)。噴藥前后果穗重的差異是顯著的。若規(guī)定α=0.01,t0.01/2=3.355,t<t0.005,因此噴藥前后果穗重的差異尚未達到“極顯著”。第二十頁,共九十八頁,2022年,8月28日五、變異性的顯著性檢驗-χ2檢驗

1、假設(shè)從正態(tài)總體中隨機抽取含量為n的樣本,計算出樣本s2。零假設(shè):H0:σ=σ0

備擇假設(shè):HA:①σ>σ0②σ<σ0③σ≠σ02、顯著性水平:在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著3、檢驗統(tǒng)計量:4、相應(yīng)于1中各備擇假設(shè)之H0的拒絕域:①χ2>χ2α②χ2<χ21-α③χ2<χ21-α/2和χ2>χ2α/25、得出結(jié)論并給予解釋。第二十一頁,共九十八頁,2022年,8月28日例4.5一個混雜的小麥品種,株高標準差σ0=14cm,經(jīng)提純后隨機抽出10株,它們的株高為:90、105、101、95、100、100、101、105、93、97cm,考查提純后的群體是否比原群體整齊?

解①株高服從正態(tài)分布,μ未知,對未知總體的方差做檢驗②假設(shè):H0:σ=14cm

HA:σ<σ0

小麥經(jīng)提純后株高只能變得更整齊,因而使用下側(cè)檢驗。③顯著性水平:在α=0.01水平上做檢驗④檢驗統(tǒng)計量:

0.990.99⑤相應(yīng)于備擇假設(shè)HA:σ<σ0,H0的拒絕域為χ2<χ21-α,從附表4中可以查出χ20.99=2.09⑥結(jié)論:因χ2<χ20.99,即P<0.01,所以拒絕H0。結(jié)論是植株經(jīng)提純后變得非常整齊。第二十二頁,共九十八頁,2022年,8月28日單個樣本的平均數(shù)、標準差的顯著性檢驗小結(jié):本節(jié)的顯著性檢驗,是通過樣本值對總體做推斷,即推斷該樣本是否從零假設(shè)總體得出來,在小概率原理的基礎(chǔ)上通過判定u

,t,χ2值是否具有顯著性差異來得出結(jié)論。第二十三頁,共九十八頁,2022年,8月28日4.2兩個樣本的差異顯著性檢驗單個樣本的顯著性檢驗需要事先能夠提出合理的參數(shù)假設(shè)值和對參數(shù)有某種意義的備擇值。然而,實際工作中很難提出,故限制了實際應(yīng)用。在實際應(yīng)用時,常常選用兩個樣本,一個作為處理,一個作為對照,在這兩個樣本之間作比較,判定它們之間的差異能否用偶然性誤差解釋,若不能用偶然性解釋時,則認為它們之間存在足夠顯著的差異,從而判斷這兩個樣本來自兩個不同的總體。第二十四頁,共九十八頁,2022年,8月28日一、兩個方差的檢驗(方差齊性分析)—F檢驗1、從兩個正態(tài)或近似正態(tài)總體中,獨立地抽取含量分別為n1和n2的兩個隨機樣本,計算出s12和s22。與總體平均數(shù)μi無關(guān)。2、零假設(shè):H0:σ1=σ2

備擇假設(shè):HA:①σ1>σ2②σ1<σ2③σ1≠σ23、顯著性水平:在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著4、檢驗統(tǒng)計量:在抽樣分布一章中已經(jīng)給出F的定義在零假設(shè)σ1=σ2下,統(tǒng)計量F變?yōu)榈诙屙摚簿攀隧摚?022年,8月28日5、相應(yīng)于2中各備擇假設(shè)之H0的拒絕域:①相應(yīng)于HA:σ1>σ2,做上尾單側(cè)檢驗,當F>Fα時拒絕H0。

②相應(yīng)于HA:σ1<σ2,做下尾單側(cè)檢驗,當F<F1-α時拒絕H0,F(xiàn)的下側(cè)分位數(shù)F1-α由下式給出一種變通的辦法是把s

2中較大者稱為s12(分子),這時只會用上側(cè)檢驗,處理起來更方便些,對于結(jié)果無影響。③相應(yīng)于HA:σ1≠σ2,應(yīng)做雙側(cè)檢驗,當F>Fα/2和

F<F1-α/2時拒絕H0。6、得出結(jié)論并給予生物學解釋。第二十六頁,共九十八頁,2022年,8月28日例4.6測定了20位青年男子和20位老年男子的血壓值(收縮壓mmHg)如表5-2所示。問老年人血壓值個體間的波動是否顯著高于青年人?解:1)人類血壓值是正態(tài)分布的隨機變量,而且兩樣本為獨立獲得。2)假設(shè):H0:σ1=σ2

HA:σ1<σ2(老年人血壓值的波動只會大于青年人,單側(cè))

以s

2較大者作為分子,備擇假設(shè)則變?yōu)镠A:σ2>σ1,成為上尾檢驗3)顯著性水平:根據(jù)問題的要求(是否顯著),選α=0.05。4)統(tǒng)計量的值:5)結(jié)論:F0.05=2.18,F(xiàn)>F0.05,P<0.05

,所以結(jié)論是拒絕H0,接受HA。即老年人的血壓值在個體間的波動高于青年人。第二十七頁,共九十八頁,2022年,8月28日第二十八頁,共九十八頁,2022年,8月28日二.標準差(σi)已知時,兩個平均數(shù)間差異顯著性的檢驗1、從σ1和σ2已知的正態(tài)或近似正態(tài)總體中抽出含量分別為n1和n2的樣本。2、零假設(shè)H0:μ1=μ2

備擇假設(shè)HA:①μ1>μ2,若已知μ1不可能小于μ2;②μ1<μ2,若已知μ1不可能大于μ2;③μ1≠μ2,包括μ1>μ2和μ1<μ2。3、顯著性水平在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著

第二十九頁,共九十八頁,2022年,8月28日4、檢驗統(tǒng)計量在σi已知時兩平均數(shù)差的標準化變量:在H0:μ1=μ2下,檢驗統(tǒng)計量為:

上式的分母稱為平均數(shù)差的標準誤差,記為5、相應(yīng)于2中各備擇假設(shè)之H0的拒絕域①u>uα②u<-uα③|u|>uα/26、得出結(jié)論并給予生物學解釋第三十頁,共九十八頁,2022年,8月28日例4.7

調(diào)查兩個不同漁場的馬面鲀魚的體長,每一漁場調(diào)查20條魚。平均體長分別為:=19.8cm,=18.5cm。σ1=σ2=7.2cm。問在α=0.05水平上,第一號漁場的馬面鲀魚是否顯著高于第二號漁場的馬面鲀魚的體長?

解①馬面鲀體長是服從正態(tài)分布的隨機變量,σ1和σ2已知。②假設(shè):H0:μ1=μ2

HA:μ1>μ2③顯著性水平:已規(guī)定為α=0.05④統(tǒng)計量的值:

⑤建立H0的拒絕域:上尾單側(cè)檢驗,當u>u0.05時拒絕H0。從表中查出u0.05=1.645.⑥結(jié)論:u<u0.05,即P>0.05,不能拒絕H0,第一號漁場馬面鲀體長并不比第二號的長。第三十一頁,共九十八頁,2022年,8月28日三、標準差(σi)未知但相等時兩平均數(shù)間差異顯著性檢驗——成組數(shù)據(jù)t檢驗

先做方差齊性檢驗(F-雙側(cè)檢驗)判斷σi

是否相等I.方差齊性檢驗:1、從兩個正態(tài)或近似正態(tài)總體中,獨立地抽取含量分別為n1和n2的兩個隨機樣本,分別計算出s12和s22。2、零假設(shè):H0:σ1=σ2

備擇假設(shè):HA:σ1≠σ23、顯著性水平:α=0.054、檢驗統(tǒng)計量:5、建立H0的拒絕域:

對于方差齊性做雙側(cè)檢驗,當F>Fα/2和F<F1-α/2時拒絕H0。6、得出結(jié)論判斷方差是否相等。第三十二頁,共九十八頁,2022年,8月28日Ⅱ.平均數(shù)差異顯著性檢驗1、從σ1和σ2未知的正態(tài)或近似正態(tài)總體中抽出含量分別為n1和n2的樣本。2、零假設(shè):H0:μ1=μ2

備擇假設(shè):HA:①μ1>μ2;②μ1<μ2;③μ1≠μ23、顯著性水平:在α=0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著4、檢驗統(tǒng)計量:在標準差未知時,平均數(shù)差的標準化變量在抽樣分布一章中已經(jīng)給出。5、相應(yīng)于2中各備擇假設(shè)之H0的拒絕域:①t>tα;②t<-tα;③|t|>tα/26、得出結(jié)論并給予解釋。第三十三頁,共九十八頁,2022年,8月28日例4.8兩個小麥品種從播種到抽穗所需天數(shù)如下表,問兩者所需的天數(shù)差異是否顯著?解:I.方差齊性檢驗:使用雙側(cè)F檢驗。①小麥生長天數(shù)是服從正態(tài)分布的隨機變量。

②假設(shè):H0:σ1=σ2

HA:σ1≠σ2③顯著性水平:α=0.05④檢驗統(tǒng)計量:⑤建立H0的拒絕域:

F9,9,0.025=4.026,F(xiàn)9,9,0.975=0.248⑥結(jié)論:F0.975<F<F0.025,即P>0.05。方差具齊性。兩者所需的天數(shù)差異不顯著。第三十四頁,共九十八頁,2022年,8月28日第三十五頁,共九十八頁,2022年,8月28日II.平均數(shù)差異顯著性檢驗①小麥生長天數(shù)是服從正態(tài)分布的隨機變量。②假設(shè):H0:μ1=μ2

HA:μ1≠μ2③顯著性水平:α=0.05④檢驗統(tǒng)計量:⑤建立H0的拒絕域:本例為雙側(cè)檢驗,當|t|>tα/2時拒絕H0,從附表4中查出t18,

0.025=2.10。⑥結(jié)論:t<t0.025,即P>0.05,接受H0。兩個小麥品種從播種到抽穗所需天數(shù)差異不顯著。第三十六頁,共九十八頁,2022年,8月28日例4.9

研究兩種激素類藥物對腎組織切片氧消耗的影響,研究第一種藥物樣本數(shù)為9,平均數(shù)為27.92,樣本方差為8.673;第二種的樣本數(shù)為6,平均數(shù)為25.11,樣本方差為1.843。問兩種藥物對腎組織切片氧消耗的影響差異是否顯著?解I.方差齊性檢驗

H0:σ1=σ2,HA:σ1≠σ2;α=0.05F<F0.025,即P>0.05。可以接受σ1=σ2的假設(shè),即方差齊性

II.平均數(shù)間差異顯著性檢驗

H0:μ1=μ2

,HA:μ1≠μ2

;α=0.05t0.025=2.160,t>t0.025,

即P<0.05。結(jié)論:在α=0.05水平上,兩種藥物對腎組織切片氧消耗的影響差異顯著。

第三十七頁,共九十八頁,2022年,8月28日四、標準差(σi)未知且可能不相等時,兩個平均數(shù)間差異顯著性的檢驗(Aspin-Welch檢驗,近似t檢驗)

若經(jīng)F(雙尾)檢驗得出的結(jié)論是σ1≠σ2,這時可用近似t檢驗判定平均數(shù)之間的差異顯著性。檢驗程序類似成組數(shù)據(jù)t檢驗該檢驗的臨界值仍由t表查出自由度由公式得出:t檢驗統(tǒng)計量公式:第三十八頁,共九十八頁,2022年,8月28日例4.10

兩組類似的大鼠,一組對照,另一組藥物處理,然后測定血糖。其中對照組樣本數(shù)為12,平均數(shù)109.17,樣本方差97.430。經(jīng)催產(chǎn)素處理組的樣本數(shù)為8,平均數(shù)為106.88,樣本方差為7.268。問藥物對大鼠血糖含量的影響是否顯著?解:Ⅰ、方差齊性檢驗:

H0:σ1=σ2,HA:σ1≠σ2

;α=0.05F11,7=97.430/7.268=13.41,F(xiàn)11,7,0.025=4.714F>F0.025,結(jié)論是方差不具齊性,即σ1≠σ2

Ⅱ、平均數(shù)之間差異顯著性檢驗

H0:μ1=μ2,HA:μ1≠μ2

,α=0.05;計算出k=0.899→df=13.35,

用線性內(nèi)插法可以求出t13.35,0.05(雙側(cè))=2.15,t<t0.05(雙側(cè))。結(jié)論是催產(chǎn)素藥物對大鼠的影響是不顯著的。第三十九頁,共九十八頁,2022年,8月28日性質(zhì)相同的兩個供試單位配成一對,并設(shè)多個配對,然后對每一配對的兩個供試單位分別隨機地給予不同處理,所得的觀察值為成對數(shù)據(jù)。每對材料其他各種條件盡可能一致,然后做不同處理例如:同一個人服藥前后的數(shù)據(jù);同一窩動物的不同處理檢驗的統(tǒng)計對象為每對材料測量值的差,作單樣本檢驗檢驗程序同單個樣本的t檢驗基本相同。五、配對數(shù)據(jù)的顯著性檢驗-成對數(shù)據(jù)t檢驗第四十頁,共九十八頁,2022年,8月28日

例下表為不同組合的雜種F1籽粒蛋白質(zhì)含量父本母本(a)母本(b)d=(a)-(b)d2

瑪納斯紅8.4787.9940.4840.234紅菲特瑞他7.5127.1410.3710.138忻粱77.2228.267–1.0451.092平羅娃娃頭8.0538.280–0.2270.052平頂冠7.6896.7400.9490.901洋大粒8.5287.6320.8960.803忻粱526.9725.9131.0591.121東海紅公雞7.7318.169–0.7980.637板農(nóng)15.7607.570–1.8103.276歪脖黃7.9307.5690.3610.131千斤紅7.2556.3220.9330.870忻粱716.7956.4170.3780.143總計1.5119.397第四十一頁,共九十八頁,2022年,8月28日1、配對數(shù)據(jù),求出差以后即轉(zhuǎn)變?yōu)閱螛颖荆淦骄鶖?shù)為。2、零假設(shè):H0:備擇假設(shè):HA:①;②;③3、顯著性水平:在α=

0.05水平上拒絕H0稱為差異顯著在α=0.01水平上拒絕H0稱為差異極顯著4、檢驗統(tǒng)計量:標準化變量t

在零假設(shè)μ=0下,

t服從n-1自由度的t分布,其中的n為數(shù)據(jù)的對數(shù)。5、相應(yīng)于2中各備擇假設(shè)之H0的拒絕域:①t>tα;②t<-tα;③|t|>tα/26、得出結(jié)論并給予解釋。上例的推斷如下:H0:μd

=0,HA:μd

≠0;α=0.05

t11,0.025=2.201,|t|<t0.025,即P>0.05,接受H0。結(jié)論:用不同的母本所配成的高粱雜交種籽粒蛋白質(zhì)含量差異不顯著。第四十二頁,共九十八頁,2022年,8月28日配對法與成組法的比較配對法比成組法更容易檢出兩組數(shù)據(jù)平均數(shù)之間的差異。平均數(shù)及樣本含量均相同的條件下,s愈小則t值愈大,從而拒絕H0的可能性越大(即差異顯著)。而配對法比成組法的樣本方差小,所以配對法比成組法更容易檢出兩組數(shù)據(jù)平均數(shù)之間的差異。用配對法比較時,可排除數(shù)據(jù)之間可能存在的相關(guān),提高檢驗的能力,從而達到事半功倍的效果。第四十三頁,共九十八頁,2022年,8月28日兩個樣本間差異顯著性檢驗的小結(jié)第四十四頁,共九十八頁,2022年,8月28日對總體參數(shù)的估計可分為點估計和區(qū)間估計。統(tǒng)計推斷假設(shè)檢驗參數(shù)估計4.3參數(shù)估計第四十五頁,共九十八頁,2022年,8月28日估計過程均值未知總體我有95%的置信度認為介于40和60之間樣本隨機樣本均值

X=50第四十六頁,共九十八頁,2022年,8月28日一、點估計我們試驗的目的就是希望獲得有關(guān)試驗處理總體的認識。用由樣本數(shù)據(jù)所計算出來的單個數(shù)值對總體參數(shù)所做的估計稱為點估計。樣本平均數(shù)是總體平均數(shù)的估計值;樣本百分數(shù)是總體百分數(shù)P的估計值二、區(qū)間估計點估計沒有考慮抽樣誤差和試驗誤差的影響,也未指出這種估計的可靠程度。對總體平均數(shù)和總體百分數(shù)P更合理的估計是在一定概率保證下,給出總體平均數(shù)和標準差及總體百分數(shù)P的可能范圍,這種估計方法叫區(qū)間估計,所給出的可能范圍叫置信區(qū)間。第四十七頁,共九十八頁,2022年,8月28日

例如:要調(diào)查某市全體成人脈搏的平均數(shù)。

雖然不能知道某市全體成人脈搏均數(shù)的確切數(shù)值,但有95%的把握說該市全體成人脈搏均數(shù)在73.9次/分--75.1次/分之間,有99%的把握說該市全體成人脈搏均數(shù)在73.7次/分--75.3次/分之間。用樣本推斷總體平均數(shù)不能簡單地以樣本平均數(shù)單一值做為結(jié)論。第四十八頁,共九十八頁,2022年,8月28日1、在σ已知時,μ的1-α置信區(qū)間可由下式導出。三、μ的置信區(qū)間μ的置信區(qū)間依σ已知和未知而不同。第四十九頁,共九十八頁,2022年,8月28日2、σ未知,用s代替,得出μ的1-α置信區(qū)間3、區(qū)間估計與假設(shè)檢驗的關(guān)系假設(shè)檢驗中,零假設(shè)的參數(shù)值若不包含在1-α置信區(qū)間內(nèi),則在α水平拒絕H0。玉米噴藥試驗(例4.5)的有關(guān)數(shù)據(jù)n=9,=308,s=9.62,α=0.05(查表得t0.05(雙)=2.306)代入上式,得出0.95置信區(qū)間為:300.6,315.4。這里不包括零假設(shè)的300,因而應(yīng)當拒絕H0,與假設(shè)檢驗的結(jié)果是一致的。第五十頁,共九十八頁,2022年,8月28日例4.5

已知某玉米種群的平均穗重μ0=300g。噴藥后,隨機抽取9個果穗,其穗重為:308、305、311、298、315、300、321、294、320g。問噴藥前后的果穗重差異是否顯著?解①σ未知②假設(shè):H0:μ=300HA:μ≠300

藥物濃度適合時可促進生長,濃度過高反而會抑制生長,所以噴藥的效果未知,需采用雙側(cè)檢驗。③顯著性水平:α=0.05④σ未知應(yīng)使用t檢驗,已計算出=308,s=9.62⑤H0的拒絕域:因HA:μ≠μ0,故為雙側(cè)檢驗,當|t|>t0.025時拒絕H0。t0.025=2.306。⑥結(jié)論:因|t|>t0.025,即P<0.05,所以拒絕零假設(shè)。噴藥前后果穗重的差異是顯著的。第五十一頁,共九十八頁,2022年,8月28日四、σ的置信區(qū)間根據(jù)可以建立σ的1-α置信區(qū)間第五十二頁,共九十八頁,2022年,8月28日將小麥提純試驗(例4.6)的有關(guān)數(shù)據(jù)s=4.92,n=10及上下側(cè)分位數(shù)(χ29,0.005=23.589,χ29,0.995=1.735)代入上式,得出σ的0.99置信區(qū)間為:3.04,11.21。

H0:σ=14不包含在置信區(qū)間內(nèi),應(yīng)拒絕H0。在做假設(shè)檢驗時得出χ2=1.11,χ29,0.995=1.735,結(jié)論是拒絕H0。與區(qū)間估計的結(jié)論一致。第五十三頁,共九十八頁,2022年,8月28日例4.6

一個混雜的小麥品種,株高標準差σ0=14cm,經(jīng)提純后隨機抽出10株,它們的株高為:90、105、101、95、100、100、101、105、93、97cm,考查提純后的群體是否比原群體整齊?

解①株高服從正態(tài)分布,μ未知,對未知總體的方差做檢驗②假設(shè):H0:σ=14cm0

HA:σ<σ0

小麥經(jīng)提純后株高只能變得更整齊,因而使用下側(cè)檢驗。③顯著性水平:在α=0.01水平上做檢驗

④檢驗統(tǒng)計量:

⑤相應(yīng)于備擇假設(shè)HA:σ<σ0,H0的拒絕域為χ2<χ21-α,從附表6中可以查出χ20.99=2.09⑥結(jié)論:因χ2<χ20.99,即P<0.01,所以拒絕H0。結(jié)論是植株經(jīng)提純后變得非常整齊。第五十四頁,共九十八頁,2022年,8月28日五、平均數(shù)差的置信區(qū)間

1σi已知由式導出μ1-μ2的1-α置信區(qū)間2σi未知但相等用類似的方法可以得到μ1-μ2的1-α置信區(qū)間

例:第四章例4.9將小麥播種天數(shù)例子中的有關(guān)數(shù)據(jù)及臨界值代入上式,得出μ1-μ2的1-α置信區(qū)間為:-0.54,1.14。其中包括0(H0:μ1-μ2=0),應(yīng)接受零假設(shè)。與假設(shè)檢驗的結(jié)果一致。第五十五頁,共九十八頁,2022年,8月28日例4.9

兩個小麥品種從播種到抽穗所需天數(shù)如表,問兩者所需的天數(shù)差異是否顯著?

I.方差齊性檢驗:H0:σ1=σ2

HA:σ1≠σ2

,α=0.05

F9,9,0.025=4.026,結(jié)論:F<F0.025,即P>0.05。方差具齊性。

II.平均數(shù)差異顯著性檢驗

H0:μ1=μ2

HA:μ1≠μ2

α=0.05

當|t|>tα/2時拒絕H0,從附表4中查出t18,

0.025=2.10。結(jié)論:t<t0.025,即P>0.05,接受H0。兩個小麥品種從播種到抽穗所需天數(shù)差異不顯著。第五十六頁,共九十八頁,2022年,8月28日3σi未知但不等可求出μ1-μ2的1-α的置信區(qū)間:例4.11將經(jīng)兩種處理方式的鼠血糖的數(shù)據(jù)帶入上式,得出μ1-μ2的1-α置信區(qū)間為:(-4.185,8.765)。因為這兩個界分別為正和負,即H0:μ1-μ2=0的假設(shè)包含在這兩個界內(nèi),所以在α=0.05水平上接受零假設(shè)。與假設(shè)檢驗的結(jié)果一致。第五十七頁,共九十八頁,2022年,8月28日例4.11

兩組類似的大鼠,一組對照,另一組藥物處理,然后測定血糖。其中對照組樣本數(shù)為12,平均數(shù)109.17,樣本方差97.430。經(jīng)催產(chǎn)素處理組的樣本數(shù)為8,平均數(shù)為106.88,樣本方差為7.268。問藥物對大鼠血糖含量的影響是否顯著?解:Ⅰ方差齊性檢驗:

H0:σ1=σ2,HA:σ1≠σ2

;α=0.05F11,7=97.430/7.268=13.41,F(xiàn)11,7,0.025=4.714F>F0.025,結(jié)論是方差不具齊性,即σ1≠σ2

Ⅱ平均數(shù)之間差異顯著性檢驗

H0:μ1=μ2,HA:μ1≠μ2

,α=0.05;計算出k=0.899→df=13.35,

用線性內(nèi)插法可以求出t13.35,0.05(雙側(cè))=2.15,t<t0.05(雙側(cè))。結(jié)論是催產(chǎn)素藥物對大鼠的影響是不顯著的。第五十八頁,共九十八頁,2022年,8月28日六、配對數(shù)據(jù)的置信區(qū)間:例:表4-3高粱蛋白質(zhì)分析實驗,將數(shù)據(jù)帶入,得0.95置信區(qū)間為:-0.452,0.710,其中包含0,所以應(yīng)接受H0:=0。七、方差比的置信區(qū)間

所以,σ1/σ21-α置信區(qū)間:

第五十九頁,共九十八頁,2022年,8月28日第六十頁,共九十八頁,2022年,8月28日一、t分布的計算實例TDIST粘貼函數(shù):單尾或雙尾概率TINV粘貼函數(shù):臨界t值(二尾概率)4.4用到的EXCEL的統(tǒng)計功能第六十一頁,共九十八頁,2022年,8月28日用TDIST粘貼函數(shù)計算二尾概率本計算也可直接在編緝欄中輸入TDIST(2,60,2)例如現(xiàn)要計算自由度等于60,t值與平均數(shù)相差2以上的2尾概率X:為需要計算分布的數(shù)字。第六十二頁,共九十八頁,2022年,8月28日用TINV粘貼函數(shù)計算臨界值

請計算自由度為10且二尾概率為0.05時的臨界t值本計算也可直接在編緝欄中為TINV(0.05,10)第六十三頁,共九十八頁,2022年,8月28日CHIDIST粘貼函數(shù):計算單尾概率CHIINV粘貼函數(shù):計算臨界值CHIDIST函數(shù)積分公式為:

CHIINV函數(shù)積分公式為:

二、卡方分布第六十四頁,共九十八頁,2022年,8月28日用CHIDIST粘貼函數(shù)計算概率請計算自由度等于1及卡方值等于3.84時的右尾概率本計算在編緝欄中為CHIDIST(3.84,1)第六十五頁,共九十八頁,2022年,8月28日用CHIINV粘貼函數(shù)計算臨界值請計算自由度為10及右尾概率為0.01時的2臨界值本計算在編緝欄中為CHIINV(0.01,10)第六十六頁,共九十八頁,2022年,8月28日FDIST粘貼函數(shù):計算單尾概率FINV粘貼函數(shù):計算臨界值FDIST函數(shù)積分公式為:

FINV函數(shù)積分公式為:三、F分布第六十七頁,共九十八頁,2022年,8月28日用函數(shù)FDIST計算一尾概率請計算第一自由度等于2、第二自由度等于4及F值等于18時的右尾概率本計算在編緝欄中為FDIST(18,2,4)第六十八頁,共九十八頁,2022年,8月28日用函數(shù)FINV計算臨界F值請計算df1=3,df2=10及右尾概率為0.05時的臨界F值

本計算在編緝欄中為FINV(0.05,3,10)第六十九頁,共九十八頁,2022年,8月28日四、EXCEL電子表格的模擬運算功能模擬運算表是可以顯示公式中某些值的變化對計算結(jié)果的影響。模擬運算表為同時求解某一運算中所有可能的變化值的組合提供了捷徑,并且還可以將所有不同的計算結(jié)果同時顯示在工作表中,便于查找和比較。模擬運算表有兩種類型:單變量模擬運算表雙變量模擬運算表第七十頁,共九十八頁,2022年,8月28日例利用模擬運算計算臨界t值表單變量模擬運算表:第七十一頁,共九十八頁,2022年,8月28日單變量模擬計算結(jié)果第七十二頁,共九十八頁,2022年,8月28日例利用模擬運算計算臨界F值表雙變量模擬運算表第七十三頁,共九十八頁,2022年,8月28日雙變量模擬計算結(jié)果第七十四頁,共九十八頁,2022年,8月28日習題:小麥株高服從N(63.33,2.882),求下列概率(利用插入函數(shù)和模擬計算表)(1)株高小于60cm;(2)株高大于69cm;(3)株高在62—64cm之間;(4) 株高落在μ±1.96σ之間;(5) 株高在多少cm以上的占全體的95%?習題:小麥株高服從N(63.33,2.882),求下列概率(利用插入函數(shù)和模擬計算表)(1)株高小于60cm;0.123789511(2)株高大于69cm;0.024490833(3)株高在62—64cm之間;0.269868645(4) 株高落在μ±1.96σ之間;0.95000435(5) 株高在多少cm以上的占全體的95%?58.59282199第七十五頁,共九十八頁,2022年,8月28日5.6、利用Excel由樣本推斷總體利用Excel的幾個函數(shù)組合,如求平均函數(shù)AVERAGE、標準差函數(shù)STDEV、T分布函數(shù)TINV等組合的使用可以構(gòu)造出一個專門用于實現(xiàn)單樣本推斷總體的Excel工作表.一、推斷置信區(qū)間例如:第七十六頁,共九十八頁,2022年,8月28日第七十七頁,共九十八頁,2022年,8月28日1.構(gòu)造工作表。如上圖:首先在各個單元格輸入以下的內(nèi)容,其中左邊是變量名,右邊是相應(yīng)的計算公式。2.為表格右邊的公式計算結(jié)果定義左邊的變量名。選定A4:B6,A8:B8和A10:B15單元格(先選擇第一部分,再按住CTRL鍵選取另外兩個部分),選擇“插入”菜單的“名稱”子菜單的“指定

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論