




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
卡方擬合優(yōu)檢驗第1頁/共63頁
擬合優(yōu)度檢驗的意義
判斷實際觀察的屬性類別分配是否符合已知屬性類別分配理論或學說的假設檢驗。
簡單的說:*用于檢驗總體是否服從某個指定分布。
Ⅰ.檢測觀察數(shù)與理論數(shù)之間的一致性;Ⅱ.通過檢測觀察數(shù)與理論數(shù)之間的一致性來判定事物之間的獨立性。
§7.1、擬合優(yōu)度檢驗的一般原理7.1.1什么是擬合優(yōu)度檢驗(P92)第2頁/共63頁
一、2統(tǒng)計量的意義
為了便于理解,現(xiàn)結合一實例說明2(讀作卡方)統(tǒng)計量的意義。根據(jù)遺傳學理論,動物的性別比例是1:1。統(tǒng)計某一年所產(chǎn)的876只實驗動物,有雄性428只,雌性448只。按1:1的性別比例計算,雌雄均應為438只。以Oi表示實際觀察次數(shù),Ti
表示理論次數(shù),可將上述情況列成下表。7.1.2擬合優(yōu)度檢驗的統(tǒng)計量(P92)第3頁/共63頁
表動物性別實際觀察次數(shù)與理論次數(shù)性別實際觀察次數(shù)Oi理論次數(shù)TiOi-Ti(Oi-Ti)2/Ti雌428438-100.2283雄448438100.2283合計87687600.4563第4頁/共63頁
從上表可以看到,實際觀察次數(shù)與理論次數(shù)存在一定的差異。這個差異是屬于抽樣誤差、還是其性別比例發(fā)生了實質性的變化?
要回答這個問題:①首先需要確定一個統(tǒng)計量用以表示實際觀察次數(shù)與理論次數(shù)偏離的程度;②然后判斷這一偏離程度是否屬于抽樣誤差,即進行顯著性檢驗。第5頁/共63頁為了度量實際觀察次數(shù)與理論次數(shù)偏離程度:A:最簡單的辦法是求出實際觀察次數(shù)與理論次數(shù)的差數(shù)。如上表:O1-T1=-10,O2-T2=10,由于這兩個差數(shù)之和為0,顯然此方法不可行;B:計算∑(O-T)2,其值越大,實際觀察次數(shù)與理論次數(shù)相差亦越大,反之則越小。但尚有不足。例如某一組實際觀察次數(shù)為505、理論次數(shù)為500,相差5;而另一組實際觀察次數(shù)為26、理論次數(shù)為21,相差亦為5。第6頁/共63頁為了彌補B這一不足,將各差數(shù)平方除以相應的理論次數(shù)后再相加,并記之為2
,即也就是說2是度量實際觀察次數(shù)與理論次數(shù)偏離程度的一個統(tǒng)計量,2越小,表明實際觀察次數(shù)與理論次數(shù)越接近;2=0,表示兩者完全吻合;2越大,表示兩者相差越大。第7頁/共63頁二、2分布上面引入了統(tǒng)計量2,它近似地服從統(tǒng)計學中一種連續(xù)型隨機變量的概率分布2分布。下面對統(tǒng)計學中的2分布作一簡略介紹。設有一平均數(shù)為μ、方差為的正態(tài)總體。現(xiàn)從此總體中獨立隨機抽取n個隨機變量:x1、x2、…、xn,并求出其標準正態(tài)離差:
第8頁/共63頁
記這n個相互獨立的標準正態(tài)離差的平方和為2
:
它服從自由度為n的2分布,記為~2(n);第9頁/共63頁
若用樣本平均數(shù)代替總體平均數(shù)μ,則隨機變量
服從自由度為n-1的2分布,記為~第10頁/共63頁
顯然,2≥0,即2的取值范圍是[0,+∞;2分布密度曲線是隨自由度不同而改變的一組曲線。隨自由度的增大,曲線由偏斜漸趨于對稱;df≥30時,接近正態(tài)分布。下面給出了幾個不同自由度的2概率分布密度曲線。
第11頁/共63頁
的連續(xù)性矯正
由公式計算的2只是近似地服從連續(xù)型隨機變量2分布。在對次數(shù)資料進行2檢驗利用連續(xù)型隨機變量2分布計算概率時,常常偏低,特別是當自由度為1時偏差較大。
Yates(1934)提出了一個矯正公式,矯正后的2值記為:
=(7-2)第12頁/共63頁
當自由度大于1時,原公式的2分布與連續(xù)型隨機變量2分布相近似,這時,可不作連續(xù)性矯正,但要求各組內(nèi)的理論次數(shù)不小于5。若某組的理論次數(shù)小于5,則應把它與其相鄰的一組或幾組合并,直到理論次數(shù)大于5為止。
第13頁/共63頁統(tǒng)計量:
使用條件:各理論值均大于5。
若自由度為1,則應作連續(xù)性矯正:第14頁/共63頁方法為:把x的值域分為r個不相重合的區(qū)間,再計算在指定的分布下,x落入每一區(qū)間的概率pi統(tǒng)計樣本含量為n的抽樣中,觀察值落入各區(qū)間的次數(shù)Oi用統(tǒng)計量進行檢驗,步驟如下:
§7.2、擬合優(yōu)度檢驗7.2.1一般程序(P93)第15頁/共63頁*檢驗步驟如下:(一)提出無效假設與備擇假設(二)選擇計算公式(三)計算理論次數(shù)(四)計算2值
(五)查臨界2值,作出統(tǒng)計推斷第16頁/共63頁說明:(一)
H0:實際觀察的屬性類別分配符合已知屬性類別分配的理論或學說;HA:實際觀察的屬性類別分配不符合已知屬性類別分配的理論或學說。(二)選擇計算出2還是2c。(三)在無效假設成立的條件下,按已知屬性類別分配的理論或學說計算各屬性類別的理論次數(shù)。第17頁/共63頁(四)計算出2或2c。(五)根據(jù)自由度k-1(若屬性類別分類數(shù)為k,則適合性檢驗的自由度為k-1)查2值表(附表)所得的臨界2值:20.05、20.01,將所計算得的2或2c值與其比較,作出統(tǒng)計推斷:若2(或2c)<20.05,P>0.05,表明實際觀察次數(shù)與理論次數(shù)差異不顯著,可以認為實際觀察的屬性類別分配符合已知屬性類別分配的理論或學說;若20.05≤2(或2c)<20.01,若2(或2c)≥20.01,第18頁/共63頁
下面結合實例說明適合性檢驗方法。(總體參數(shù)已知)【例】在研究牛的毛色和角的有無兩對相對性狀分離現(xiàn)象時,用黑色無角牛和紅色有角牛雜交,子二代出現(xiàn)黑色無角牛192頭,黑色有角牛78頭,紅色無角牛72頭,紅色有角牛18頭,共360頭。試問這兩對性狀是否符合孟德爾遺傳規(guī)律中9∶3∶3∶1的遺傳比例?7.2.2對二項分布的檢驗(P93)第19頁/共63頁
檢驗步驟:
(一)提出無效假設與備擇假設
H0:實際觀察次數(shù)之比符合9∶3∶3∶1的理論比例。
HA:實際觀察次數(shù)之比不符合9∶3∶3∶1的理論比例。
(二)選擇計算公式
由于本例的屬性類別分類數(shù)k=4:自由度df=k-1=4-1=3>1,故計算2。
(三)計算理論次數(shù)
依據(jù)各理論比例9:3:3:1計算理論次數(shù):第20頁/共63頁
黑色無角牛的理論次數(shù)T1:360×9/16=202.5;黑色有角牛的理論次數(shù)T2:360×3/16=67.5;紅色無角牛的理論次數(shù)T3:360×3/16=67.5;紅色有角牛的理論次數(shù)T4:360×1/16=22.5。或T4=360-202.5-67.5-67.5=22.5
(四)列表計算2
第21頁/共63頁
表2計算表第22頁/共63頁=0.5444+1.6333+1.6333+0.9=4.711
(五)查臨界2值,作出統(tǒng)計推斷
當df=3時,20.05(3)=7.81,因2<2005(3),P>0.05,不能否定H0
,表明實際觀察次數(shù)與理論次數(shù)差異不顯著,可以認為毛色與角的有無兩對性狀雜交二代的分離現(xiàn)象符合孟德爾遺傳規(guī)律中9∶3∶3∶1的遺傳比例。例7.1;7.2(P93;94)第23頁/共63頁總體參數(shù)未知例P95,表7-1不同之處:要由樣本估計出總體參數(shù)。7.2.3對正態(tài)分布的檢驗(P96)7.2.4其他類型問題的檢驗(P97)第24頁/共63頁
一、獨立性檢驗的意義
對次數(shù)資料,除進行擬合優(yōu)度檢驗外,有時需要分析兩類因子是相互獨立還是彼此相關。如研究兩類藥物對實驗動物某種疾病治療效果的好壞,先將動物分為兩組,一組用第一種藥物治療,另一組用第二種藥物治療,然后統(tǒng)計每種藥物的治愈頭數(shù)和未治愈頭數(shù)。
§7.3、獨立性檢驗7.3.1列聯(lián)表2
檢驗(P97)第25頁/共63頁這時需要分析藥物種類與療效是否相關,若兩者彼此相關,表明療效因藥物不同而異,即兩種藥物療效不相同;若兩者相互獨立,表明兩種藥物療效相同。這種根據(jù)次數(shù)資料判斷兩類因子彼此相關或相互獨立的假設檢驗就是獨立性檢驗。*獨立性檢驗實際上是基于次數(shù)資料對因子間相關性的研究。
第26頁/共63頁
獨立性檢驗與擬合優(yōu)度檢驗是兩種不同的檢驗方法,除了研究目的不同外,還有以下區(qū)別:
(一)
獨立性檢驗的次數(shù)資料是按兩因子屬性類別進行歸組。根據(jù)兩因子屬性類別數(shù)的不同而構成2×2、2×c、r×c列聯(lián)表(r為行因子的屬性類別數(shù),c為列因子的屬性類別數(shù))。而適合性檢驗只按某一因子的屬性類別將如性別、表現(xiàn)型等次數(shù)資料歸組。第27頁/共63頁
(二)擬合優(yōu)度檢驗按已知的屬性分類理論或學說,計算理論次數(shù)。獨立性檢驗在計算理論次數(shù)時沒有現(xiàn)成的理論或學說可資利用,理論次數(shù)是在兩因子相互獨立的假設下進行計算。(三)在擬合優(yōu)度檢驗中確定自由度時,只有一個約束條件:各理論次數(shù)之和等于各實際次數(shù)之和,自由度為屬性類別數(shù)減1。而在r×c列聯(lián)表的獨立性檢驗中,共有rc個理論次數(shù),但受到以下條件的約束:第28頁/共63頁
1、rc個理論次數(shù)的總和等于rc個實際次數(shù)的總和;
2、r個橫行中的每一個橫行理論次數(shù)總和等于該行實際次數(shù)的總和。獨立的行約束條件只有r-1個;
3、類似地,獨立的列約束條件有c-1個。因而在進行獨立性檢驗時,自由度為rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(橫行屬性類別數(shù)-1)×(直列屬性類別數(shù)-1)。第29頁/共63頁二、獨立性檢驗的方法
(一)2×2列聯(lián)表的獨立性檢驗
2×2列聯(lián)表的一般形式如下表所示,其自由度df=(
c-1)(r-1)=(2-1)(2-1)=1,在進行2檢驗時,需作連續(xù)性矯正,應計算值。
表2×2列聯(lián)表的一般形式其中Aij為實際觀察次數(shù),Tij為理論次數(shù)。第30頁/共63頁其理論數(shù)的計算為:第31頁/共63頁
例7.3
下表是不同給藥方式與給藥效果表給藥方式與給藥效果的2×2列聯(lián)表給藥方式有效(A1)無效(A2)總數(shù)有效率口服(B1)注射(B2)58644031989559.2%67.4%總數(shù)12271193
上表稱為2×2列聯(lián)表(2×2contingencytable)。
2×2列聯(lián)表的c2檢驗一般需經(jīng)以下各步:第32頁/共63頁
(1)提出零假設:認為有效或無效與給藥方式并無關聯(lián)。實際觀察的結果與在兩者之間并無關聯(lián)的前提下,從理論上推導出的理論數(shù)之間無差異。即H0:O-T=0。
(2)根據(jù)概率乘法法則,若事件A和事件B是相互獨立的,或者說它們之間并無關聯(lián),這時事件A和事件B同時出現(xiàn)的概率等于它們分別出現(xiàn)的概率乘積。
反過來,若事件A和事件B同時出現(xiàn)的概率等于它們分別出現(xiàn)的概率的乘積,那么事件A和事件B是獨立的兩者無關聯(lián)。若事件A和事件B同時出現(xiàn)的概率不等于它們分布出現(xiàn)的概率的乘積,則這兩個事件間是有關聯(lián)的。第33頁/共63頁例7.3的零假設是給藥方式與給藥效果之間無關聯(lián),則口服與有效同時出現(xiàn)的理論頻率應為口服的頻率與有效的頻率的乘積,P(BA)=P(B)P(A)=(98/193)(122/193)。其理論數(shù)T1應當用理論頻率乘以總數(shù)得出,T1=(98/193)(122/193)(193)=(98)(122)/193=61.15。同樣可以計算出另外三種情況的理論數(shù)。
(3)如吻合度檢驗那樣計算c2值。若c2<c2α,則觀察數(shù)與理論數(shù)是一致的,給藥方式與給藥效果間無關聯(lián)的假設可以成立。若c2>c2α,則觀察數(shù)與理論數(shù)不一致,說明給藥方式與給藥效果間是有關聯(lián)的,不同的給藥方式產(chǎn)生不同的效果。第34頁/共63頁
(4)確定自由度,2×2列聯(lián)表的自由度不再是4-1=3,而是(r-1)(c-1)或者寫為(行-1)(列-1)。因為每一行的各理論數(shù)受該行總數(shù)的約束,每一列的各理論數(shù)受該列總數(shù)的約束,所以總的自由度只有(r-1)(c-1)。下面計算例1.11的c2并做推斷。首先計算各格的理論數(shù),從下表中可以看出,任何一格的理論數(shù)等于這格所在的行總數(shù)乘以這格所在的列總數(shù),再除以總數(shù)。在實際計算時,算出T1以后,可以用列總數(shù)減去T1得T3,用行總數(shù)減去T1得T2,列總數(shù)減去T2得T4。第35頁/共63頁有效無效總數(shù)口服O1=58T1=(98)(122)/193=61.95O2=40T2=(98)(71)/193=36.0598
注射O3=64T3=(95)(122)/193=60.05O4=31T4=(95)(71)/193=34.9595總數(shù)12271193第36頁/共63頁
結論是用口服方式與注射方式給藥的效果沒有顯著不同。因為已經(jīng)接受H0,不必再矯正。第37頁/共63頁
【例】某研究用80頭實驗動物檢驗某種疫苗是否有預防效果。結果是注射疫苗的44頭中有12頭發(fā)病,32頭未發(fā)病;未注射的36頭中有22頭發(fā)病,14頭未發(fā)病,問該疫苗是否有預防效果?
1、先將資料整理成列聯(lián)表(2×2列聯(lián)表)第38頁/共63頁
2、提出無效假設與備擇假設
H0:發(fā)病與否和注射疫苗無關,即二因子相互獨立。
HA:發(fā)病與否和注射疫苗有關,即二因子彼此相關。
3、計算理論次數(shù)
根據(jù)二因子相互獨立的假設,由樣本數(shù)據(jù)計算出各個理論次數(shù)。二因子相互獨立,就是說注射疫苗與否不影響發(fā)病率。也就是說注射組與未注射組的理論發(fā)病率應當相同,均應等于總發(fā)病率34/80=0.425=42.5%。依此計算出各個理論次數(shù)如下:第39頁/共63頁
注射組的理論發(fā)病數(shù):
T11=44×34/80=18.7
注射組的理論未發(fā)病數(shù):
T12=44×46/80=25.3,
或T12=44-18.7=25.3;第40頁/共63頁
未注射組的理論發(fā)病數(shù):
T21=36×34/80=15.3,或T21=34-18.7=15.3;未注射組的理論未發(fā)病數(shù):
T22=36×46/80=20.7,或T22=36-15.3=20.7。第41頁/共63頁
從上述各理論次數(shù)Tij的計算可以看到,理論次數(shù)的計算利用了行、列總和,總總和,4個理論次數(shù)僅有一個是獨立的。(括號內(nèi)的數(shù)據(jù)為相應的理論次數(shù))。
4、計算值
將表7-11中的實際次數(shù)、理論次數(shù)代入公式得:第42頁/共63頁第43頁/共63頁
5、由自由度df=1查臨界2值,作出統(tǒng)計推斷因為20.01(1)=6.63,而=7.944>20.01(1),P<0.01,否定H0,接受HA,表明發(fā)病率與是否注射疫苗極顯著相關,這里表現(xiàn)為注射組發(fā)病率極顯著低于未注射組,說明該疫苗是有預防效果的。
第44頁/共63頁
(二)2×c列聯(lián)表的獨立性檢驗
2×c列聯(lián)表是行因子的屬性類別數(shù)為2,列因子的屬性類別數(shù)為c(c3)的列聯(lián)表。其自由度df=(2-1)(c-1)=(c-1),因為c3,所以自由度大于2,在進行2檢驗時,不需作連續(xù)性矯正。2×c表的一般形式見表:第45頁/共63頁例見P99例7.4第46頁/共63頁
此外,在畜牧、水產(chǎn)科學研究中,有時需將數(shù)量性狀資料以等級分類,如剪毛量分為特等、一等、二等,產(chǎn)奶量分為高產(chǎn)與低產(chǎn)等,這些由數(shù)量性狀資料轉化為質量性狀的次數(shù)資料檢驗,也可用2檢驗。
第47頁/共63頁A、B兩個品種產(chǎn)仔數(shù)的分類統(tǒng)計第48頁/共63頁
(三)r×c列聯(lián)表的獨立性檢驗
r×c表是指行因子的屬性類別數(shù)為r(r>2),列因子的屬性類別數(shù)為c(c>2)的列聯(lián)表。其一般形式見表7-17。
第49頁/共63頁
其中Aij(i=1,2,…r;j=1,2,…c)為實際觀察次數(shù)。
r×c列聯(lián)表各個理論次數(shù)的計算方法與上述(2×2)、(2×c)表適合性檢驗類似。
【例】對三組實驗動物(每組39頭)分別喂給不同的飼料,各組發(fā)病次數(shù)統(tǒng)計如下表,問發(fā)病次數(shù)的構成比與所喂飼料是否有關?第50頁/共63頁
表三組動物的發(fā)病次數(shù)資料第51頁/共63頁
檢驗步驟如下:
1、提出無效假設與備擇假設
H0:發(fā)病次數(shù)的構成比與飼料種類無關,即二者相互獨立。
HA:發(fā)病次數(shù)的構成比與飼料種類有關,即二者彼此獨立。
2、計算理論次數(shù)對于理論次數(shù)小于5者,將相鄰幾個組加以合并(見表7—19),合并后的各組的理論次數(shù)均大于5。第52頁/共63頁
表資料合并結果(注:括號內(nèi)為理論次數(shù))第53頁/共63頁3、計算2值利用公式計算2值,得:第54頁/共63頁4、查臨界2值,進行統(tǒng)計推斷由自由度df=(4-1)(3-1)=6,查臨界2值得:
20..05(6)=12.59
因為計算所得的2<
20.05(6),P>0.05,不能否定HO,可以認為發(fā)病次數(shù)的構成比與飼料種類相互獨立,即用三種不同的飼料飼喂動物,各組動物發(fā)病次數(shù)的構成比相同。第55頁/共63頁7.3.22×2列聯(lián)表的精確檢驗(P99)2×2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 忻州師范學院《體育學科通識閱讀與寫作》2023-2024學年第二學期期末試卷
- 新疆維吾爾自治區(qū)阿克蘇地區(qū)庫車縣烏尊鎮(zhèn)中學2025年3月高三年級綜合模擬測試生物試題含解析
- 江蘇省淮安市淮安區(qū)達標名校2025屆初三下學期期末教學質量檢測試題試卷生物試題含解析
- 四川文化傳媒職業(yè)學院《商務英語基礎》2023-2024學年第一學期期末試卷
- 永州職業(yè)技術學院《汽輪機原理及設備》2023-2024學年第一學期期末試卷
- 山東省濟南歷下區(qū)重點名校2024-2025學年初三化學試題下學期一模預考試題含解析
- 廈門演藝職業(yè)學院《食品質量檢測技術》2023-2024學年第二學期期末試卷
- 山東臨清2025屆初三數(shù)學試題模擬試卷(一)試題含解析
- 山西省運城市稷山縣2025屆初三下學期5月考試卷化學試題試卷含解析
- 威海職業(yè)學院《血液流變學與人體健康》2023-2024學年第一學期期末試卷
- 砼構件預制件的模具設計與制造技術考核試卷
- 2025中煤鄂爾多斯能源化工有限公司高校畢業(yè)生招聘98人筆試參考題庫附帶答案詳解
- 導游知識培訓課件
- 眼科“一科一品”特色護理服務
- 銀行內(nèi)控案防警示教育
- 2024年基金應知應會考試試題
- 湖北省武漢市洪山區(qū)2023-2024學年八年級下學期期中考試物理試題
- 質量整改通知單(樣板)
- 材料合同結清證明版本
- 重慶理工大學工程制圖習題集答案—第九章零件圖1
- 投標報價分數(shù)計算器
評論
0/150
提交評論