擬合優度檢驗課件_第1頁
擬合優度檢驗課件_第2頁
擬合優度檢驗課件_第3頁
擬合優度檢驗課件_第4頁
擬合優度檢驗課件_第5頁
已閱讀5頁,還剩119頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第十三章檢驗與方差分析我們前面已經比較系統地討論了雙樣本的參數和非參數檢驗的問題。現在,我們希望利用一般的方法來檢驗三個以上樣本的差異,檢驗法和方差分析法就是解決這方面問題的。檢驗法可以對擬合優度和獨立性等進行檢驗,方差分析法則可以對多個總體均值是否相等進行檢驗。后者由于通過各組樣本資料之間的方差和組內方差的比較來建立服從F分布的檢驗統計量,所以又稱F檢驗。第一節:擬合優度檢驗第二節:無關聯性檢驗第三節:方差分析第四節:回歸方程與相關系數的檢驗第十三章檢驗與方差分析我們前面1第一節擬合優度檢驗運用Z檢驗、t檢驗等討論假設檢驗的問題,一般要求總體服從正態分布,或者在大樣本條件下可以利用漸近正態分布理論來描述抽樣分布。也就是說,我們都要直接或間接地假定對象總體具有已知的分布形式,然后對總體的未知參數進行假設檢驗。如果不知道總體的分布形式,就無法運用t檢驗法等對總體參數進行假設檢驗。于是,這里有一個前面留下來的尚未討論的問題很重要,就是怎樣檢定總體是否具有正態或其他分布形式?擬合優度檢驗正是就這一問題而言的檢驗方法。第一節擬合優度檢驗運用Z檢驗2第十一章最后一節,我們將累計頻數檢驗用于經驗分布與理論分布的比較,實際已經提供了擬合優度檢驗的一種方法。擬合優度檢驗與累計頻數擬合優度檢驗相對應,在評估從經驗上得到的頻數和在一組特定的理論假設下期望得到的頻數之間是否存在顯著差異時,是一種更普遍的檢驗方法。現在我們再來看看第七章提到的著名的孟德爾豌豆試驗。根據孟德爾提出的分離規律,純種豌豆雜交后的子二代出現分化,紅花植株與白花植株的數目應為3∶1。但由于隨機性,觀察結果與3∶1理論值總有些差距。因此有必要去考察某一大小的差距是否已構成否定3∶l理論的充分根據。這正是我們所討論的擬合優度檢驗的問題。解決這類問題的工具,是卡·皮爾遜在1900年發表的一篇文章中引進的所謂檢驗法。

1.問題的導出第十一章最后一節,我們將累計頻數檢驗用于經驗分布與理3首先把問題表述成一般模式。設一總體包含c種可區別的個體。根據某種理論或純粹的假設,第i

種個體出現的概率應為某個已知的數Pi

(i=1,2,…,c),有Pi

>0,=1。這一組概率(P1,P2,…,Pc)就構成了我們的理論分布。現在在該總體中隨機地抽取一個容量為n的樣本,發現其中第i

種個體的數目為fi(i

=1,2,…,c),并有=n。我們要據此檢驗理論分布。用概率論的語言可以這樣說,設對象總體中隨機變量X有c種取值。當X的取值是xi時,按零假設,其總體分布等于理論分布,即P()=Pi

(i=1,2,…,c)

例如,就孟德爾的3∶1理論來說,c=2,P(x1)=3/4,P(x2)=1/4。現在從該總體中隨機地抽取一個容量為n的樣本,發現其中xi(i=1,2…,c)出現的次數為fi(i

=1,2,…,c),并有=n。知道了頻數也就知道了頻率,即:出現的頻率為,并有=1。

現在我們就是要據此經驗分布來檢驗總體分布等于理論分布的零假設。2.擬合優度檢驗(比率擬合檢驗)首先把問題表述成一般模式。設一總體包含c種可區別的個體。根4擬合優度檢驗如何進行?

關鍵是確定合適的檢驗統計量以及該統計量所服從的概率分布。這里不可避免地要引進某種人為因素,即人們設計出下面這樣的綜合性可比指標:

其中k1,k2,…,kc是適當選取的常數。仔細觀察不難發現,L值大,意味著經驗分布與理論分布偏離大;L值小,意味著經驗分布與理論分布偏離小。當在某個選定的水平上,經驗分布顯著偏離理論分布,那么對象總體具有某種分布形式的零假設便被否定。擬合優度檢驗如何進行?關鍵是確定合5擬合優度檢驗課件6結論:用作為檢定Ho成立的檢驗統計量,理論證明,當n足夠大

時,該統計量服從分布,它是一種具有已知的并制成表的概率

分布,因此對給定的顯著性水平α,可求得臨界值,與比

較,進而作出檢驗結論。顯而易見,理論頻數fe與觀測頻數fo越接近,統計值越小,經驗分布與理論分布擬合程度越好。反之,fe與fo差距越大,值越大,經驗分布與理論分布擬合程度越差,擬合優度檢驗由此得名。結論:用作為檢定Ho成立的檢驗7[例]孟德爾遺傳定律表明:在純種紅花豌豆與白花豌豆雜交后所生的子二代豌豆中,紅花對白花之比為3:1。某次種植試驗的結果為;紅花豌豆176株,白花豌豆48株。試在α=0.05的顯著性水平上,對孟德爾定律作擬合優度檢驗。(參見下表)應用舉例[例]孟德爾遺傳定律表明:在純種紅花豌8擬合優度檢驗課件9

3.正態擬合檢驗[例]試對下表所給男青年身高分布的數據作正態擬合檢驗,選取α=0.05。3.正態擬合檢驗[例]10[解]

[解]11擬合優度檢驗課件12

檢驗的另一個重要應用是對交互分類資料的獨立性檢驗,即列聯表檢驗。在上一章,我們曾多次提到過性別與收入高低有無關聯的問題,在實際中類似的問題很多。例如受教育程度與投票行為有無關聯?吸煙與壽命長短有無關聯?家庭小孩多少與收入多少有無關聯?受教育時間長短與收入多少有無關聯?血型與某種性格上的差異有無關聯?等等,把這類問題上升到一般,就是在列聯表的基礎上考察變量X與Y有無關聯。由于列聯表一般是按品質標志把兩個變量的頻數進行交互分類的,所以:

①檢驗法用于對交互分類資料的獨立性檢驗,有其它方法無法比擬的優點;②如何求得列聯表中的理論頻數就成了獨立性檢驗的關鍵。第二節無關聯性檢驗檢驗的另一個重要應用131、獨立性、理論頻數及自由度應用此式,不必計算理論頻數計算與這個檢驗統計量相聯系的自由度算出統計量之值并定出其自由度后,就可以依前述的方法,在給定了顯著性水平之后,來對X,Y屬性無關聯的零假設進行檢驗了。1、獨立性、理論頻數及自由度應用此式,不必14應用舉例

檢驗也適用于定類變量和定類變量的相關統計,即可以用它檢定λ和τ系數是否顯著。就下表所示資料,試以檢驗檢定性別與收入之間的相關程度是否顯著(α取0.001)。

應用舉例檢驗也適用于定類變量和定類變量15[解]

[解]16故拒絕H0,即認為總體上性別與收入高低之間不獨立,有顯著相關關系。故拒絕H0,即認為總體上性別與收入高低之間不17

[例]在某種流行病流行的時候,共有120個病人進行了治療,其中40個病人按標準劑量服用某種新藥,另有40個病人按標準劑量的2倍服用了這種新藥,其余40個病人只按病狀治療(而不是按病因治療),治療結果按迅速痊愈、緩慢痊愈、未痊愈分為三類,最后交叉分類的情況列于下表,試問這三種療法之間有沒有差別(α取0.05)。[例]在某種流行病流行的時候18[解]

H0:這三種療法之間沒有差別

H1:這三種療法之間有差別

由于α=0.05;自由度k=(c―l)(r―l)=2×2=4,查分布表得臨界值:

在零假設下,計算檢驗統計量,計算過程參見后表。

因此>,故拒絕零假設,即三種療法之間有顯著差別。[解]

H0:這三種療法之間沒有差別

H1:這三種療法之間19擬合優度檢驗課件20第三節方差分析

方差分析,是一種很重要的分析方法,它可以檢驗兩個以上樣本均值之差。方差分析是均值差檢驗的推廣,一般用于處理自變量是一個(或多個)定類變量和因變量是一個定距變量之間的關系。方差分析所包含的假定與均值差檢驗所包含的假定差不多,例如正態分布、獨立隨機樣本、等方差性等,但檢驗本身卻很不相同。方差分析直接涉及的是方差而不是均值和標準差。同時,比較也不取兩種估計量之差,而是取兩種估計量的比率。在兩種估計量彼此獨立的前提下,兩種估計量之比率F具有已知的抽樣分布,因而可進行很簡單的檢驗。第三節方差分析方差分析,是一種很重要的21

1.總變差及其分解

總變差:在方差分析中記作SST,它表示對于總均值的偏差之平方和。即:

SST=式中:ni是第i個樣本的容量,n=

為什么會形成總變差這個散布度呢?一是三個樣本可能不同,這使全部數據有三個“中心”;二是隨機抽樣誤差的影響,使數據在每個中心附近有散布。

1.總變差及其分解總變差:在方差22總變差分解

總變差分解23可以看出,總變差分解成兩部分:第一部分是各觀測值對其所屬類別均值的偏差的平方和,稱為組內變差(Within-groupsSumofSquares),記作SSW。組內變差反映了數據圍繞各“中心”的散布程度,即反映了因隨機波動所產生的變異,與自變量因素無關。換言之,SSW是自變量因素所沒有解釋的的變異。因此,又稱之為殘差。第二部分是組間平方和(Between-groupsSumofSquares),記作SSB

,它涉及到諸類別均值對總均值的偏差,反映了前表中數據的c個“中心”的散布程度。可以看出,總變差分解成兩部分:24

弄清了組間變差和組內變差,檢驗“A1≠A2≠A3”(也就是零假設μ1=μ2=μ3)的思路也就梳理出來了:關鍵是比較兩種變差是否有顯著差異。若第一種變差明顯大于第二種變差,則認為家庭因素對孩子圖書消費是有影響的;若第一種變差與第二種變差之間無顯著區別,則不能認為家庭因素對孩子圖書消費有影響。但在統計學上,方差分析不取兩者之差而取兩者之比來進行這種比較。而且,方差分析不是直接用SSB/SSW作為檢驗統計量,而是用可以解釋的方差/不能解釋的方差作為檢驗統計量,即:

2.關于自由度弄清了組間變差和組內變差,檢驗“A125

組間平方和代表c個樣本均值對總均值的偏差。也就是每個可看作為一個單位,c個可看作為c個單位,有c個自由度,求用去一個自由度。因而,與組間平方和相聯系的自由度為c―1。再看組內平方和,計算時每列失去一個自由度。因而,與組內平方和相聯系的自由度為n―c。最后看總平方和,計算總均值時失去一個自由度。因而,與總平方和相聯系的自由度為n―l。總的來看有:

n―l=(n―c)+(c―1)總自由度=組內自由度+組間自由度

組間平方和代表c個樣本均值對總均值的偏26

上式是在在零假設(H0:μ1=μ2=…=μc)之下,檢驗統計量Fo的計算公式。

理論證明:上式服從分子自由度為k1=c―1、分母自由度為k2=(n―c)的F分布。于是,給定顯著性水平α,我們就可以很方便地從F分布表中查到臨界值Fα(c―1,n―c)。如果出現Fo>Fα的情況,我們將在這個顯著性水平上拒絕零假設。在實際運用中,方差分析的結果常用一種稱為“方差分析表”的標準形式的表格表示出來,其基本形式如表后所示。上式是在在零假設(H0:μ1=μ2=…=μc)之下,檢27

為了簡化檢驗統計量Fo的計算,有必要將SST、SSW、SSB這三個定義式展開,其方法與分解總變差的方法相同。于是有:

3.關于檢驗統計量Fo的計算

注意,由于總變差等于另兩個變差之和,所以三個變差中僅需求出兩個變差。求出組內平方和比求另兩個平方和繁瑣得多,故通常我們都是從總平方和減去組間平方和來求組內平方和的。為了簡化檢驗統計量Fo的計算,有必要將28[例]試對下表中的資料,計算SST

、SSW、SSB

,并檢驗μ1=μ2=μ3的零假設(α取0.05)。[例]試對下表中的資料,計算SST、SS29解:據題意,n1=n2=n3=8,n1+n2+n3=24

組內自由度=n―c=24―3=21

組間自由度=c―1=3―1=2

分別計算SST和SSB,計算過程參見下表。解:據題意,n1=n2=n3=8,n1+n2+30

由于α=0.05,查F分布表得臨界值:Fα(c―1,n―c)=F0.05(2,21)=3.47>1.19故在0.05顯著性水平上不否定零假設,即沒有充分根據提出這三類家庭的孩子在圖書消費方面有顯著不同。由于α=0.05,查F分布表得臨界值:31

[例]研究某種商品銷量與品牌的關系,得下表資料,其中A1,A2,A3表示不同的品牌,數據表示銷量。試以顯著性水平10%判斷品牌對該種商品的銷量有無影響。[例]研究某種商品銷量與品牌的關系,得下表資料,其32

[解]據題意,n1=n1+n2+n3=2+4+3=9

組內自由度=n―c=9―3=6

組間自由度=c―1=3―1=2

分別計算SST和SSB,計算過程參見前表13.16。于是得MSB

MSW

MSB=SSB/(c―1)=6.89/2=3.45

MSW

=SSW/(n―c)=30/6=5.00

再根據(13.19)式求檢驗統計量Fo

Fo===0.69<1

故在0.10顯著性水平上不否定零假設,即不能判斷不同品脾對

該種商品的銷量有顯著影響。[解]據題意,n1=n1+n2+n333

4.相關比率

當方差分析的檢驗呈顯著性后,進一步討論兩變量間的相關程度是很自然的。方差分析中相關程度的測定仍采用PRE法。當不知因變量Y的取值與自變量X的取值A1,A2,…,Ac有關時,最好的預測是以總均值作為Y的估計值。此時,估計所犯的錯誤將等于SST

E1=SST=

當已知因變量Y的取值與自變量X的取值A1,A2,…,Ac有關后,自然用各樣本的均值作為各類別的預測值,此時預測所產生的誤差將等于SSW

E2=SSW=

所以消減誤差比例可寫成PRE===正是因為上式,我們把SSB稱為已解釋的變差。顯然,已解釋的變差越大,預測Y所減少的誤差就越多,X與Y之間的關系就越密切。據此,方差分析中把已解釋的變差對總變差的比值稱為相關比率,用符號表示=1―=

可用于一個定類變量與一個定距變量的相關程度的測定,當然也可以用于定序—定距變量或定距—定距變量的相關程度的測定。4.相關比率當方差分析的檢驗呈顯著34[例]試以表13.12的資料,分析孩子圖書消費與家庭類型的關系。

[解]據前面例題中已計算的結果,已知SSB=28,SST=276,因而有

=1―===10.1%

可見,就表給資料而言,利用家庭類型預測孩子圖書消費量,只能削減10.1%的預測誤差。[例]試以表13.12的資料,分析孩子圖書消費與35小結:相關比率研究的是定類—定距變量之間的相關程度。由于定類變量不具有數量大小的問題,不存在關系是否線性的問題。因此,當被用于研究定距—定距變量之間的關系時,不僅可以作為線性相關的量度,也可以作為非線性相關的量度。這意味著,對線性相關,相關比率與r2(積差系數之平方)有相同的PRE性質;但如果對非線性相關,用積差系數r來討論就不行了。對于定距—定距變量,曲線相關既然要用R來測量,那么反過來,同一資料通過相關指數R與積差系數r計算的比較,可以判斷確定兩定距變量的關系是不是直線。如果同時求出r與R,r等于或略大于R,可說明兩變量關系是直線的,用r去測量是合適的;如果r<R,則說明兩變量關系可能是曲線的。小結:相關比率研究的是定類—定距變量之間的相關36首先,MSB和MSW可以分別稱為組間方差和組內方差,其中(在等方差的假設下)組內方差總是σ2的無偏估計;而組間方差,只有當諸總體(即各樣本所代表的子總體)均值實際上相等時,它才是σ2的無偏估計。這就是說,如果零假設為真,MSB和MSW之間將沒有太大的差別。反之。如果零假設實際不正確,可以期望MSB和MSW的比值大于1。如果這個比值小于1,則不從F分布表中查找臨界值Fα就可以判斷零假設不能被否定。其次,以上兩個例題也可以用均值差檢驗來處理。均值差檢驗涉及t分布,可以做三組合的比較.即A1與A2,A2與A3,A1與A3。與均值差檢驗不同,方差分析僅進行一次檢驗來判定三種類別的家庭(或品牌)在消費(或銷售)上彼此是否有顯著性差異。方差分析的優點在于,一個檢驗可以代替多個檢驗。如果有四個類別,均值差檢驗需做(4×3)/2=6次;如果有六個類別,需做(6×5)/2=15次;如果有十個類別,需做(10×9)/2=45次。況且,如果做15次均值差檢驗。其中4次結果具有顯著性,這時應當下什么結論?可能很難回答。

5.關于方差分析的幾點討論首先,MSB和MSW可以分別稱為組間方差和組內方差37第三,方差分析中的自變量X如果是二分變量,也可以采用均值差t檢驗。在這種情況下,F的分子自由度是2―1=1,分母自由度是n―2,這與均值差檢驗中的t相同。經過計算可知,具有自由度n―2的t

2值等于具有分子自由度為1和分母自由度為n―2的F值。比較F表和t表也可以核實這一點。換言之,t是分子自由度為l的F的平方根。這當然意味著,對于樣本而言,此時不論采用方差分析或均值差檢驗,其結果完全相同。第四,本節集中討論了自變量為一個定類變量而因變量為一個定距變量的情況。如果對因變量Y影響的自變量由一個變為兩個以上,我們就將面對多元方差分析了。總變差分解的思想可以直接推廣至多因素顯著性檢驗。例如就兩個自變量(A和B)獨立對因變量Y影響的情況,可以得到下述方差分析表(表13.17)。第三,方差分析中的自變量X如果是二分變量,也可以采用38相關與回歸,由于其廣泛應用,如今在統計學中是高度發展的分支之一。而從實用的觀點來看,線性關系是最簡單也是最重要的一種關系。本書第十二章已經對積差系數與回歸直線作了比較細致的討論。但有關假設檢驗的內容,由于要借助于推論統計的知識方能闡明,所以本書將這部分內容集中放到這一節來加以補充。學過推論統計的人要克制自己免受直線的誘惑,對此,討論回歸系數和積差系數之假設檢驗將具有重要意義。

第四節回歸方程與相關系數的檢驗相關與回歸,由于其廣泛應用,如今在統計學中是39

1.回歸系數的檢驗

檢驗兩個總體變量(定距—定距變量)是否具有線性關系,主要檢驗總體的回歸系數B是否等于零。因此,對于總體線性檢驗的假設可寫成如下形式:

H0:B=0H1:B≠0

為了尋求檢驗H0的方法,我們需要對離差平方和進行分解。而這項工作,前面已經完成。我們發現,估計Y,當不知Y和X的關系時,對它的最佳估計值只能是。離差之平方和(總變差),正是不知Y和X的關系時,估計Y的全部誤差E0

E0==SST

1.回歸系數的檢驗檢驗兩個40

做了回歸預測之后.我們可以用Yc估計Y(參見下圖)。這時估計Y的誤差變為E1(剩余變差):

E1==

SSW

做了回歸預測之后.41

顯然,利用Yc去估計Y比用去估計Y要消減一些誤差。消減的誤差E0―E1就是被回歸直線解釋掉的誤差(回歸變差)。

從第十二章已經討論過的回歸變差和剩余變差的意義來看,一個回歸方程效果的好壞,取決于它們兩者之間的比較。已解釋的回歸變差越大,用Yc去估計Y比用去估計Y消減的誤差就越多,回歸預測的效果也就越好。依此,并按上一節方差分析的思想,在H0成立的條件下,檢驗回歸直線的統計量可構造為

E0―E1=Fo=~F(1,n―2)顯然,利用Yc去估計Y比用去估計Y要消減一些42自由度問題

因回歸變差中僅含一個自變量X,故自由度為l。而總變差所含自由度為(n―1),從而由總自由度=組內自由度+組間自由度,得剩余變差的自由度為(n―2)。對選定顯著性水平α,可查表得臨界值Fα。若出現Fo>Fα(1,n―2)的情況,則拒絕H0,即認為回歸方程中X變量對Y的解釋力是顯著的;若出現Fo<Fα(1,n―2)的情況,則不能拒絕H0,即認為回歸方程中X變量對Y沒有的顯著的解釋力。

自由度問題因回歸變差中僅含一個自變量X,故自由度為l43[例]對[例12.5.1]所建立的回歸方程進行回歸直線的檢驗(α取0.05)。[例]對[例12.5.1]所建立的回歸方程進行回歸44

[解]根據表12.22和[例12.5.1]的計算結果可知:=48,=252,=52.5,

=299.75,=268.5

a=0.475,b=0.975,n=12

= =299.75―0.475×52.5―0.975×268.5 =13.02

=(0.975)2×[252―] =57.04[解]根據表12.22和[例12.5.1]的計算結果可45計算檢驗統計量

Fo=

==43.81

對α=0.05,查F表得臨界值

Fα(1,n―2)=F0.05(1,10)=4.96?43.81所以拒絕H0,即可以認為對總體配置回歸直線是有意義的。計算檢驗統計量46

2.積差系數的檢驗

對于定距—定距變量,上一章討論的積差系數是就樣本而言的。如同樣本均值、成數不能完全代表總體均值、成數一樣,樣本積差系數r也不就是總體積差系數ρ。但在社會研究中,要想確切了解兩總體變量(定距—定距變量)間的積差系數是很難的。所以,通常需要通過樣本積差系數的統計檢驗來認識總體的積差系數ρ。設有兩變量X和Y,它們的積差系數記為ρ。當ρ=0時,表示X和Y不具有線性相關關系,當ρ≠0時,表示X和Y具有線性相關關系。實踐證明,樣本積差系數r值比較大時,并不等于總體積差系數ρ也比較大。尤其是樣本中所含觀測值較少時,更可能出現這種情況。例如,當X與Y各只有兩個樣本數據時,積差系數總是為1,但顯然這不能說明變量間一定完全相關。也就是說,有時即使樣本積差系數很大,也并不一定就表明總體積差系數ρ也一定很大。總體積差系數ρ的情況,只有在對樣本積差系數進行統計顯著性檢驗后,才能得出結論。2.積差系數的檢驗對于定距47

那么判斷線性相關的“顯著”與“不顯著”的檢驗統計量如何構造呢?

統計理論證明,樣本積差系數是總體積差系數的一個無偏估計量,有:

=ρ,=那么判斷線性相關的“顯著”與“不顯著”的檢驗統計量如48而且當ρ=0時,樣本容量越大,r(顯然為一隨機變量)的抽樣分布越接近于自由度為n―2的t分布(見前圖)。因而有檢驗統計量:

to=r~

t(n―2)

積差系數檢驗的假設為:

H0:ρ=0(兩總體不具有線性相關關系)

H1:ρ≠0(兩總體具有線性相關關系)

對選定的顯著性水平α,查t分布表得臨界值tα/2(n―2),與統計值to作比較。若>,則表明r在統計上是顯著的,即總體積差系數顯著地不同于零;<,則說明r在統計上不顯著,即X與Y間并不存在線性相關關系。而且當ρ=0時,樣本容量越大,r(顯然為一隨機49[例12.4.1]已對表12.21所示資料求出積差系數,試在0.05顯著性水平上作總體相關檢驗。

表12.21[例12.4.1]已對表12.21所示資料求50

[解]建立假設

H0:ρ=0H1:ρ≠0

已知r=0.902,n=12,于是得

to=r=0.902×=6.608對α=0.05,查表得臨界值

tα/2(n―2)=t0。025(10)=2.228<6.608故拒絕H0,接受H1,即認為員工的工齡和技術考核分之間存在線性相關。

但是,為了使用者的方便,上述檢驗現已簡化為使用相關系數r進行直接檢驗。附表12是以r的抽樣分布編制的相關系數表,只要給出顯著性水平α和自由度k=n―2,便可以在表中直接查出相應的臨界值rα(n―2)。[解]建立假設51[解]已知r=0.902,n=12,對α=0.05,k=12―2=10,從附表12中查得rα(n―2)=rα(10)=0.576<0.902故拒絕零假設,即在0.05顯著性水平上可以認為員工的工齡和技術考核分之間存在線性相關。例:用附表12直接對上例進行積差系數檢驗。[解]已知r=0.902,n=12,對α=52小結:上一小節,我們講的是回歸系數的檢驗,實際上那只是線性回歸方程的檢驗。而這一小節討論積差系數的檢驗,也是要確認總體線性相關的存在。因而假設H0:B=0與假設H0:ρ=0等價。也就是說,如果樣本積差系數r通過了檢驗(t檢驗),也必然導致回歸系數b能通過檢驗(F檢驗)。實際上F公式與t公式是有對應關系的。

Fo===t

2

即具有自由度n―2的t

2值等于具有分子自由度1和分母自由度n―2的F值。也正是由于這個原因,有的教科書就是用t統計量來檢驗回假設的。而如果有了r檢驗表(附表12),問題就變得更為簡單,計算Fo值并進行F檢驗也都不必要了。小結:上一小節,我們講的是回歸系數的檢驗,53

估計Y

當不知Y和X有關系時,對它的最佳估計值只能是,估計的全部誤差是;當知道Y和X有關系時,可以改用Yc來估計Y,此時估計的誤差減少為。

當知道Y和X有關系后,用Yc來估計Y固然可以消減不少估計誤差,這也不過是點估計。而如果我們能在擬合值Yc上下設置一個合適區間,那么Y被估計到的可能性便會大大增加。

3.回歸方程的區間估計

回歸方程區間估計提出的背景估計Y3.回歸方程的54在回歸線兩側設置一個估計區間總是容易做到的,但問題是我們需要對估計的信度和效度作通盤考慮。為此,我們必須了解Y在Yc兩側的分布特征以及Y在Yc兩側的分散程度。在回歸線兩側設置一個估計區間總是容易做到的55

由于誤差為正態分布的原理(即中心極限定理),當樣本容量n大于30時,我們可以作如下假定(參見前圖):1)Y的實際觀測值在對應的每個估計值Yc周圍都是正態分布,越靠近Yc的地方,Y值出現的機會越多,反之出現的機會越少;2)所有正態分布都具有相同的標準差,即所謂的同方差性。于是,除了重溫過去的知識,只有一個具體問題要解決:為了測定回歸線的代表性,有必要參照標準差的意義,引進一個離中趨勢的量度——估計標準誤差,記作SY/X,用來反映圍繞回歸線的Y值的離散程度。在這里,求算估計標準誤差具有第九章中求算抽樣平均誤差同樣的意義。由于誤差為正態分布的原理(即56當知道Y和X有關系時,用Yc

來估計Y,估計的誤差為剩余變差,即SSW。所以,估計標準誤差顯然為剩余方差MSW的平方根,即SY/X=直接采用上式來計算估計標準誤差比較麻煩,實際計算時,一般用下式(前面已經證明)

SY/X=

當知道Y和X有關系時,用Yc來估計Y,估計的誤差為57

[例]

就表12.21所示資料,在[例12.5.1]的基礎上,根據員工的工齡和技術考核分所建立的回歸直線方程,求算估計標準誤差。

[解]就表12.21所示資料,在[例12.5.1]的基礎上,參照[例l3.4.1]的計算結果,已知

==13.02

SY/X===1.14

所以,用回歸線=0.475+0.975X估計因變量Y時的估計標準誤差為1.14(分)。

[例]就表12.21所示資料,在[例12.558有了估計標準誤差,再結合回歸方程,就可以對因變量Y進行估計和推斷了。具體來說,就是建立回歸估計的置信區間(參見第九章“區間估計”一節),借以確定回歸方程預測或控制Y的范圍。現在根據上述兩個假定,并參見第七章圖7.6,的取值或預測區間可以這樣期望:有了估計標準誤差,再結合回歸方程,就可以對因變59(1)取±1SY/X,那么在散點圖上約有68.26%的觀測點落在其間(參見圖13.3)。(2)取±2SY/X,那么在散點圖上約有95.46%的觀測點落在其間(參見圖13.3)。(3)取±3SY/X,那么在散點圖上約有99.73%的觀測點落在其間(參見圖13.3)。(1)取±1SY/X,60

[例]試以表12.21中的資料為例,說明回歸置信區間建立的方法。[解]根據[例12.5.1]和上例計算的結果,已知=0.475+0.975XSY/X=1.14假定自變量工齡X為5(年),得技術考核分的擬合值=0.475+0.975×5=5.35那么+1SY/X=5.35+1.14=6.49

―1SY/X=5.35―1.14=4.21即對工齡為5年的員工,他們的技術考核分在4.21分至6.49分之間的概率為68.26%。+2SY/X=5.35+2×1.14=7.63

―2SY/X=5.35―2×1.14=3.07即對工齡為5年的員工,他們的技術考核分在3.07分至7.63分之間的概率為95.46%。

61本章結束,謝謝大家!本章結束,謝謝大家!62第十三章檢驗與方差分析我們前面已經比較系統地討論了雙樣本的參數和非參數檢驗的問題。現在,我們希望利用一般的方法來檢驗三個以上樣本的差異,檢驗法和方差分析法就是解決這方面問題的。檢驗法可以對擬合優度和獨立性等進行檢驗,方差分析法則可以對多個總體均值是否相等進行檢驗。后者由于通過各組樣本資料之間的方差和組內方差的比較來建立服從F分布的檢驗統計量,所以又稱F檢驗。第一節:擬合優度檢驗第二節:無關聯性檢驗第三節:方差分析第四節:回歸方程與相關系數的檢驗第十三章檢驗與方差分析我們前面63第一節擬合優度檢驗運用Z檢驗、t檢驗等討論假設檢驗的問題,一般要求總體服從正態分布,或者在大樣本條件下可以利用漸近正態分布理論來描述抽樣分布。也就是說,我們都要直接或間接地假定對象總體具有已知的分布形式,然后對總體的未知參數進行假設檢驗。如果不知道總體的分布形式,就無法運用t檢驗法等對總體參數進行假設檢驗。于是,這里有一個前面留下來的尚未討論的問題很重要,就是怎樣檢定總體是否具有正態或其他分布形式?擬合優度檢驗正是就這一問題而言的檢驗方法。第一節擬合優度檢驗運用Z檢驗64第十一章最后一節,我們將累計頻數檢驗用于經驗分布與理論分布的比較,實際已經提供了擬合優度檢驗的一種方法。擬合優度檢驗與累計頻數擬合優度檢驗相對應,在評估從經驗上得到的頻數和在一組特定的理論假設下期望得到的頻數之間是否存在顯著差異時,是一種更普遍的檢驗方法。現在我們再來看看第七章提到的著名的孟德爾豌豆試驗。根據孟德爾提出的分離規律,純種豌豆雜交后的子二代出現分化,紅花植株與白花植株的數目應為3∶1。但由于隨機性,觀察結果與3∶1理論值總有些差距。因此有必要去考察某一大小的差距是否已構成否定3∶l理論的充分根據。這正是我們所討論的擬合優度檢驗的問題。解決這類問題的工具,是卡·皮爾遜在1900年發表的一篇文章中引進的所謂檢驗法。

1.問題的導出第十一章最后一節,我們將累計頻數檢驗用于經驗分布與理65首先把問題表述成一般模式。設一總體包含c種可區別的個體。根據某種理論或純粹的假設,第i

種個體出現的概率應為某個已知的數Pi

(i=1,2,…,c),有Pi

>0,=1。這一組概率(P1,P2,…,Pc)就構成了我們的理論分布。現在在該總體中隨機地抽取一個容量為n的樣本,發現其中第i

種個體的數目為fi(i

=1,2,…,c),并有=n。我們要據此檢驗理論分布。用概率論的語言可以這樣說,設對象總體中隨機變量X有c種取值。當X的取值是xi時,按零假設,其總體分布等于理論分布,即P()=Pi

(i=1,2,…,c)

例如,就孟德爾的3∶1理論來說,c=2,P(x1)=3/4,P(x2)=1/4。現在從該總體中隨機地抽取一個容量為n的樣本,發現其中xi(i=1,2…,c)出現的次數為fi(i

=1,2,…,c),并有=n。知道了頻數也就知道了頻率,即:出現的頻率為,并有=1。

現在我們就是要據此經驗分布來檢驗總體分布等于理論分布的零假設。2.擬合優度檢驗(比率擬合檢驗)首先把問題表述成一般模式。設一總體包含c種可區別的個體。根66擬合優度檢驗如何進行?

關鍵是確定合適的檢驗統計量以及該統計量所服從的概率分布。這里不可避免地要引進某種人為因素,即人們設計出下面這樣的綜合性可比指標:

其中k1,k2,…,kc是適當選取的常數。仔細觀察不難發現,L值大,意味著經驗分布與理論分布偏離大;L值小,意味著經驗分布與理論分布偏離小。當在某個選定的水平上,經驗分布顯著偏離理論分布,那么對象總體具有某種分布形式的零假設便被否定。擬合優度檢驗如何進行?關鍵是確定合67擬合優度檢驗課件68結論:用作為檢定Ho成立的檢驗統計量,理論證明,當n足夠大

時,該統計量服從分布,它是一種具有已知的并制成表的概率

分布,因此對給定的顯著性水平α,可求得臨界值,與比

較,進而作出檢驗結論。顯而易見,理論頻數fe與觀測頻數fo越接近,統計值越小,經驗分布與理論分布擬合程度越好。反之,fe與fo差距越大,值越大,經驗分布與理論分布擬合程度越差,擬合優度檢驗由此得名。結論:用作為檢定Ho成立的檢驗69[例]孟德爾遺傳定律表明:在純種紅花豌豆與白花豌豆雜交后所生的子二代豌豆中,紅花對白花之比為3:1。某次種植試驗的結果為;紅花豌豆176株,白花豌豆48株。試在α=0.05的顯著性水平上,對孟德爾定律作擬合優度檢驗。(參見下表)應用舉例[例]孟德爾遺傳定律表明:在純種紅花豌70擬合優度檢驗課件71

3.正態擬合檢驗[例]試對下表所給男青年身高分布的數據作正態擬合檢驗,選取α=0.05。3.正態擬合檢驗[例]72[解]

[解]73擬合優度檢驗課件74

檢驗的另一個重要應用是對交互分類資料的獨立性檢驗,即列聯表檢驗。在上一章,我們曾多次提到過性別與收入高低有無關聯的問題,在實際中類似的問題很多。例如受教育程度與投票行為有無關聯?吸煙與壽命長短有無關聯?家庭小孩多少與收入多少有無關聯?受教育時間長短與收入多少有無關聯?血型與某種性格上的差異有無關聯?等等,把這類問題上升到一般,就是在列聯表的基礎上考察變量X與Y有無關聯。由于列聯表一般是按品質標志把兩個變量的頻數進行交互分類的,所以:

①檢驗法用于對交互分類資料的獨立性檢驗,有其它方法無法比擬的優點;②如何求得列聯表中的理論頻數就成了獨立性檢驗的關鍵。第二節無關聯性檢驗檢驗的另一個重要應用751、獨立性、理論頻數及自由度應用此式,不必計算理論頻數計算與這個檢驗統計量相聯系的自由度算出統計量之值并定出其自由度后,就可以依前述的方法,在給定了顯著性水平之后,來對X,Y屬性無關聯的零假設進行檢驗了。1、獨立性、理論頻數及自由度應用此式,不必76應用舉例

檢驗也適用于定類變量和定類變量的相關統計,即可以用它檢定λ和τ系數是否顯著。就下表所示資料,試以檢驗檢定性別與收入之間的相關程度是否顯著(α取0.001)。

應用舉例檢驗也適用于定類變量和定類變量77[解]

[解]78故拒絕H0,即認為總體上性別與收入高低之間不獨立,有顯著相關關系。故拒絕H0,即認為總體上性別與收入高低之間不79

[例]在某種流行病流行的時候,共有120個病人進行了治療,其中40個病人按標準劑量服用某種新藥,另有40個病人按標準劑量的2倍服用了這種新藥,其余40個病人只按病狀治療(而不是按病因治療),治療結果按迅速痊愈、緩慢痊愈、未痊愈分為三類,最后交叉分類的情況列于下表,試問這三種療法之間有沒有差別(α取0.05)。[例]在某種流行病流行的時候80[解]

H0:這三種療法之間沒有差別

H1:這三種療法之間有差別

由于α=0.05;自由度k=(c―l)(r―l)=2×2=4,查分布表得臨界值:

在零假設下,計算檢驗統計量,計算過程參見后表。

因此>,故拒絕零假設,即三種療法之間有顯著差別。[解]

H0:這三種療法之間沒有差別

H1:這三種療法之間81擬合優度檢驗課件82第三節方差分析

方差分析,是一種很重要的分析方法,它可以檢驗兩個以上樣本均值之差。方差分析是均值差檢驗的推廣,一般用于處理自變量是一個(或多個)定類變量和因變量是一個定距變量之間的關系。方差分析所包含的假定與均值差檢驗所包含的假定差不多,例如正態分布、獨立隨機樣本、等方差性等,但檢驗本身卻很不相同。方差分析直接涉及的是方差而不是均值和標準差。同時,比較也不取兩種估計量之差,而是取兩種估計量的比率。在兩種估計量彼此獨立的前提下,兩種估計量之比率F具有已知的抽樣分布,因而可進行很簡單的檢驗。第三節方差分析方差分析,是一種很重要的83

1.總變差及其分解

總變差:在方差分析中記作SST,它表示對于總均值的偏差之平方和。即:

SST=式中:ni是第i個樣本的容量,n=

為什么會形成總變差這個散布度呢?一是三個樣本可能不同,這使全部數據有三個“中心”;二是隨機抽樣誤差的影響,使數據在每個中心附近有散布。

1.總變差及其分解總變差:在方差84總變差分解

總變差分解85可以看出,總變差分解成兩部分:第一部分是各觀測值對其所屬類別均值的偏差的平方和,稱為組內變差(Within-groupsSumofSquares),記作SSW。組內變差反映了數據圍繞各“中心”的散布程度,即反映了因隨機波動所產生的變異,與自變量因素無關。換言之,SSW是自變量因素所沒有解釋的的變異。因此,又稱之為殘差。第二部分是組間平方和(Between-groupsSumofSquares),記作SSB

,它涉及到諸類別均值對總均值的偏差,反映了前表中數據的c個“中心”的散布程度。可以看出,總變差分解成兩部分:86

弄清了組間變差和組內變差,檢驗“A1≠A2≠A3”(也就是零假設μ1=μ2=μ3)的思路也就梳理出來了:關鍵是比較兩種變差是否有顯著差異。若第一種變差明顯大于第二種變差,則認為家庭因素對孩子圖書消費是有影響的;若第一種變差與第二種變差之間無顯著區別,則不能認為家庭因素對孩子圖書消費有影響。但在統計學上,方差分析不取兩者之差而取兩者之比來進行這種比較。而且,方差分析不是直接用SSB/SSW作為檢驗統計量,而是用可以解釋的方差/不能解釋的方差作為檢驗統計量,即:

2.關于自由度弄清了組間變差和組內變差,檢驗“A187

組間平方和代表c個樣本均值對總均值的偏差。也就是每個可看作為一個單位,c個可看作為c個單位,有c個自由度,求用去一個自由度。因而,與組間平方和相聯系的自由度為c―1。再看組內平方和,計算時每列失去一個自由度。因而,與組內平方和相聯系的自由度為n―c。最后看總平方和,計算總均值時失去一個自由度。因而,與總平方和相聯系的自由度為n―l。總的來看有:

n―l=(n―c)+(c―1)總自由度=組內自由度+組間自由度

組間平方和代表c個樣本均值對總均值的偏88

上式是在在零假設(H0:μ1=μ2=…=μc)之下,檢驗統計量Fo的計算公式。

理論證明:上式服從分子自由度為k1=c―1、分母自由度為k2=(n―c)的F分布。于是,給定顯著性水平α,我們就可以很方便地從F分布表中查到臨界值Fα(c―1,n―c)。如果出現Fo>Fα的情況,我們將在這個顯著性水平上拒絕零假設。在實際運用中,方差分析的結果常用一種稱為“方差分析表”的標準形式的表格表示出來,其基本形式如表后所示。上式是在在零假設(H0:μ1=μ2=…=μc)之下,檢89

為了簡化檢驗統計量Fo的計算,有必要將SST、SSW、SSB這三個定義式展開,其方法與分解總變差的方法相同。于是有:

3.關于檢驗統計量Fo的計算

注意,由于總變差等于另兩個變差之和,所以三個變差中僅需求出兩個變差。求出組內平方和比求另兩個平方和繁瑣得多,故通常我們都是從總平方和減去組間平方和來求組內平方和的。為了簡化檢驗統計量Fo的計算,有必要將90[例]試對下表中的資料,計算SST

、SSW、SSB

,并檢驗μ1=μ2=μ3的零假設(α取0.05)。[例]試對下表中的資料,計算SST、SS91解:據題意,n1=n2=n3=8,n1+n2+n3=24

組內自由度=n―c=24―3=21

組間自由度=c―1=3―1=2

分別計算SST和SSB,計算過程參見下表。解:據題意,n1=n2=n3=8,n1+n2+92

由于α=0.05,查F分布表得臨界值:Fα(c―1,n―c)=F0.05(2,21)=3.47>1.19故在0.05顯著性水平上不否定零假設,即沒有充分根據提出這三類家庭的孩子在圖書消費方面有顯著不同。由于α=0.05,查F分布表得臨界值:93

[例]研究某種商品銷量與品牌的關系,得下表資料,其中A1,A2,A3表示不同的品牌,數據表示銷量。試以顯著性水平10%判斷品牌對該種商品的銷量有無影響。[例]研究某種商品銷量與品牌的關系,得下表資料,其94

[解]據題意,n1=n1+n2+n3=2+4+3=9

組內自由度=n―c=9―3=6

組間自由度=c―1=3―1=2

分別計算SST和SSB,計算過程參見前表13.16。于是得MSB

MSW

MSB=SSB/(c―1)=6.89/2=3.45

MSW

=SSW/(n―c)=30/6=5.00

再根據(13.19)式求檢驗統計量Fo

Fo===0.69<1

故在0.10顯著性水平上不否定零假設,即不能判斷不同品脾對

該種商品的銷量有顯著影響。[解]據題意,n1=n1+n2+n395

4.相關比率

當方差分析的檢驗呈顯著性后,進一步討論兩變量間的相關程度是很自然的。方差分析中相關程度的測定仍采用PRE法。當不知因變量Y的取值與自變量X的取值A1,A2,…,Ac有關時,最好的預測是以總均值作為Y的估計值。此時,估計所犯的錯誤將等于SST

E1=SST=

當已知因變量Y的取值與自變量X的取值A1,A2,…,Ac有關后,自然用各樣本的均值作為各類別的預測值,此時預測所產生的誤差將等于SSW

E2=SSW=

所以消減誤差比例可寫成PRE===正是因為上式,我們把SSB稱為已解釋的變差。顯然,已解釋的變差越大,預測Y所減少的誤差就越多,X與Y之間的關系就越密切。據此,方差分析中把已解釋的變差對總變差的比值稱為相關比率,用符號表示=1―=

可用于一個定類變量與一個定距變量的相關程度的測定,當然也可以用于定序—定距變量或定距—定距變量的相關程度的測定。4.相關比率當方差分析的檢驗呈顯著96[例]試以表13.12的資料,分析孩子圖書消費與家庭類型的關系。

[解]據前面例題中已計算的結果,已知SSB=28,SST=276,因而有

=1―===10.1%

可見,就表給資料而言,利用家庭類型預測孩子圖書消費量,只能削減10.1%的預測誤差。[例]試以表13.12的資料,分析孩子圖書消費與97小結:相關比率研究的是定類—定距變量之間的相關程度。由于定類變量不具有數量大小的問題,不存在關系是否線性的問題。因此,當被用于研究定距—定距變量之間的關系時,不僅可以作為線性相關的量度,也可以作為非線性相關的量度。這意味著,對線性相關,相關比率與r2(積差系數之平方)有相同的PRE性質;但如果對非線性相關,用積差系數r來討論就不行了。對于定距—定距變量,曲線相關既然要用R來測量,那么反過來,同一資料通過相關指數R與積差系數r計算的比較,可以判斷確定兩定距變量的關系是不是直線。如果同時求出r與R,r等于或略大于R,可說明兩變量關系是直線的,用r去測量是合適的;如果r<R,則說明兩變量關系可能是曲線的。小結:相關比率研究的是定類—定距變量之間的相關98首先,MSB和MSW可以分別稱為組間方差和組內方差,其中(在等方差的假設下)組內方差總是σ2的無偏估計;而組間方差,只有當諸總體(即各樣本所代表的子總體)均值實際上相等時,它才是σ2的無偏估計。這就是說,如果零假設為真,MSB和MSW之間將沒有太大的差別。反之。如果零假設實際不正確,可以期望MSB和MSW的比值大于1。如果這個比值小于1,則不從F分布表中查找臨界值Fα就可以判斷零假設不能被否定。其次,以上兩個例題也可以用均值差檢驗來處理。均值差檢驗涉及t分布,可以做三組合的比較.即A1與A2,A2與A3,A1與A3。與均值差檢驗不同,方差分析僅進行一次檢驗來判定三種類別的家庭(或品牌)在消費(或銷售)上彼此是否有顯著性差異。方差分析的優點在于,一個檢驗可以代替多個檢驗。如果有四個類別,均值差檢驗需做(4×3)/2=6次;如果有六個類別,需做(6×5)/2=15次;如果有十個類別,需做(10×9)/2=45次。況且,如果做15次均值差檢驗。其中4次結果具有顯著性,這時應當下什么結論?可能很難回答。

5.關于方差分析的幾點討論首先,MSB和MSW可以分別稱為組間方差和組內方差99第三,方差分析中的自變量X如果是二分變量,也可以采用均值差t檢驗。在這種情況下,F的分子自由度是2―1=1,分母自由度是n―2,這與均值差檢驗中的t相同。經過計算可知,具有自由度n―2的t

2值等于具有分子自由度為1和分母自由度為n―2的F值。比較F表和t表也可以核實這一點。換言之,t是分子自由度為l的F的平方根。這當然意味著,對于樣本而言,此時不論采用方差分析或均值差檢驗,其結果完全相同。第四,本節集中討論了自變量為一個定類變量而因變量為一個定距變量的情況。如果對因變量Y影響的自變量由一個變為兩個以上,我們就將面對多元方差分析了。總變差分解的思想可以直接推廣至多因素顯著性檢驗。例如就兩個自變量(A和B)獨立對因變量Y影響的情況,可以得到下述方差分析表(表13.17)。第三,方差分析中的自變量X如果是二分變量,也可以采用100相關與回歸,由于其廣泛應用,如今在統計學中是高度發展的分支之一。而從實用的觀點來看,線性關系是最簡單也是最重要的一種關系。本書第十二章已經對積差系數與回歸直線作了比較細致的討論。但有關假設檢驗的內容,由于要借助于推論統計的知識方能闡明,所以本書將這部分內容集中放到這一節來加以補充。學過推論統計的人要克制自己免受直線的誘惑,對此,討論回歸系數和積差系數之假設檢驗將具有重要意義。

第四節回歸方程與相關系數的檢驗相關與回歸,由于其廣泛應用,如今在統計學中是101

1.回歸系數的檢驗

檢驗兩個總體變量(定距—定距變量)是否具有線性關系,主要檢驗總體的回歸系數B是否等于零。因此,對于總體線性檢驗的假設可寫成如下形式:

H0:B=0H1:B≠0

為了尋求檢驗H0的方法,我們需要對離差平方和進行分解。而這項工作,前面已經完成。我們發現,估計Y,當不知Y和X的關系時,對它的最佳估計值只能是。離差之平方和(總變差),正是不知Y和X的關系時,估計Y的全部誤差E0

E0==SST

1.回歸系數的檢驗檢驗兩個102

做了回歸預測之后.我們可以用Yc估計Y(參見下圖)。這時估計Y的誤差變為E1(剩余變差):

E1==

SSW

做了回歸預測之后.103

顯然,利用Yc去估計Y比用去估計Y要消減一些誤差。消減的誤差E0―E1就是被回歸直線解釋掉的誤差(回歸變差)。

從第十二章已經討論過的回歸變差和剩余變差的意義來看,一個回歸方程效果的好壞,取決于它們兩者之間的比較。已解釋的回歸變差越大,用Yc去估計Y比用去估計Y消減的誤差就越多,回歸預測的效果也就越好。依此,并按上一節方差分析的思想,在H0成立的條件下,檢驗回歸直線的統計量可構造為

E0―E1=Fo=~F(1,n―2)顯然,利用Yc去估計Y比用去估計Y要消減一些104自由度問題

因回歸變差中僅含一個自變量X,故自由度為l。而總變差所含自由度為(n―1),從而由總自由度=組內自由度+組間自由度,得剩余變差的自由度為(n―2)。對選定顯著性水平α,可查表得臨界值Fα。若出現Fo>Fα(1,n―2)的情況,則拒絕H0,即認為回歸方程中X變量對Y的解釋力是顯著的;若出現Fo<Fα(1,n―2)的情況,則不能拒絕H0,即認為回歸方程中X變量對Y沒有的顯著的解釋力。

自由度問題因回歸變差中僅含一個自變量X,故自由度為l105[例]對[例12.5.1]所建立的回歸方程進行回歸直線的檢驗(α取0.05)。[例]對[例12.5.1]所建立的回歸方程進行回歸106

[解]根據表12.22和[例12.5.1]的計算結果可知:=48,=252,=52.5,

=299.75,=268

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論