非參數檢驗卡方檢驗_第1頁
非參數檢驗卡方檢驗_第2頁
非參數檢驗卡方檢驗_第3頁
非參數檢驗卡方檢驗_第4頁
非參數檢驗卡方檢驗_第5頁
已閱讀5頁,還剩18頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

非參數檢驗卡方檢驗第一頁,共二十三頁,編輯于2023年,星期五類別數據的分析類別數據的產生原發性類別數據:當被測定的變量的本質是名義性的屬性,例如性別數據操作性類別數據:以人為操作的手段所獲致的分類性數據,例如實驗操作的分類結果虛擬化類別數據:由其它類型的數據型態轉換成類別形式的數據,例如由連續變量轉換來的類別變量類別數據的處理形態:次數與百分比類別數據的呈現:次數分布表與列聯表類別數據的分析:卡方檢驗與其它關聯性分析法第二頁,共二十三頁,編輯于2023年,星期五卡方檢驗的主要內容配合度檢驗某一個變量是否與某個理論分布或總體分布相符合檢驗的內容僅涉及一個變量,是一種單因子檢驗獨立性檢驗同時檢測兩個類別變量﹙X與Y﹚之間的關系時,其目的在于檢測從樣本得到的兩個變量的觀察值,是否具有特殊的關聯。檢測同一個樣本的兩個變量的關聯情形第三頁,共二十三頁,編輯于2023年,星期五配合度檢驗例1:某大學二年級的公共體育課是球類課,根據自己的愛好,學生只需在籃球、足球和排球三種課程中選擇一種。據以往的統計,選擇這三種課程的學生人數是相等的。今年開課前對90名學生進行抽樣調查,選擇籃球的有39人,選擇足球的28人,選擇排球的23人,那么,今年學生對三種課程選擇的人數比例與以往不同?第四頁,共二十三頁,編輯于2023年,星期五籃球足球排球觀察次數(fo)392823期望次數(fe)303030第五頁,共二十三頁,編輯于2023年,星期五卡方檢驗的統計原理卡方檢驗所檢測的是樣本觀察次數﹙或百分比﹚與理論或總體次數﹙或百分比﹚的差異性。理論或總體的分布狀況,可用統計的期望值(理論值)來體現卡方的統計原理,是取觀察值與期望值相比較??ǚ街翟酱?,代表統計量與理論值的差異越大,一旦卡方值大于某一個臨界值,即可獲得顯著的統計結論

第六頁,共二十三頁,編輯于2023年,星期五籃球足球排球觀察次數(fo)392823期望次數(fe)303030接受零假設,即選擇三種課程的學生數相等。第七頁,共二十三頁,編輯于2023年,星期五獨立性檢驗例2為了解男女在公共場所禁煙上的態度,隨機調查100名男性和80名女性。男性中有58人贊成禁煙,42人不贊成;而女性中則有61人贊成,19人不贊成。那么,男女在公共場所禁煙的問題所持態度不同?第八頁,共二十三頁,編輯于2023年,星期五贊成不贊成行總和男性fo11=58fo12=42R1=100女性fo21=62fo22=18R2=80列總和C1=120C2=60T=180第九頁,共二十三頁,編輯于2023年,星期五贊成不贊成行總和男性fo11=58fo12=42R1=100Fe11=66.7Fe12=33.3女性fo21=62fo22=18R2=80Fe21=53.3Fe22=26.7列總和C1=120C2=60T=180拒絕零假設,即男女對公共場所禁煙的態度有顯著差異。第十頁,共二十三頁,編輯于2023年,星期五四格表的簡易算法贊成不贊成男A58B42A+B=100女C62D18C+D=80A+C=120B+D=60N=A+B+C+D=180第十一頁,共二十三頁,編輯于2023年,星期五卡方檢驗基本前提各小格之期望次數﹙或理論次數﹚不得小于5。不滿足假設時的處理方法小格合并法增加樣本數去除樣本法

使用Yate’s校正公式第十二頁,共二十三頁,編輯于2023年,星期五非參數檢驗χ2擬合優度檢驗一、χ2檢驗概念χ2檢驗是檢驗樣本測量頻數與期望頻數的差異性。例如:在某次考試結束后,對不同成績進行統計的結果:分數段期望頻數Ei測量頻數Qi0-60分0160-75分4675-85分8885-100分43按照公式:經過查表可得到PP>α不顯著

P<=α顯著第十三頁,共二十三頁,編輯于2023年,星期五H0假設:樣本的測量頻數Qi與期望頻數Ei差異不顯著。二、操作步驟執行[Analyze][NonparametricTest][Chi-Square]選擇檢驗變量到“TestVariables”檢驗變量窗口中回答期望值“Expectedvalues”:“Allcategoriesequal”表示均勻分布,即每項的頻數都相等。缺省選項:總頻數/分組數,這是一種平均分布“Values”為指定各個項的頻數。檢驗變量取值范圍“ExpectedRange”:“Getfromdata”為不限定。“Usespeciedrange”指定上下限。第十四頁,共二十三頁,編輯于2023年,星期五“Exact”可以定義各種不同分布下的顯著性檢驗,使計算更精確:“Asymptoticonly”適合于漸進分布的大樣本分布。“MonteCarlo”適合不滿足漸進分布的大樣本分布?!癈onfidence”指定置信區間?!癗umberof”指定近似法計算中的個案數。“Exact”精確計算統計概率?!癘ptions”中可以設置選項:“Descriptive”中將計算描述統計:均值、標準差、最大值、最小值等?!癚uartiles”四等分百分位數的計算。缺失值“MissingValue”:“Excludecasestestbytest”表示排除在做統計分析的變量中含有缺失值的個案?!癊xcludecaseslistwise”表示排除在檢驗變量列表中開列的變量中含有缺失值的個案。第十五頁,共二十三頁,編輯于2023年,星期五三、命令語句NPARTEST/CHISQUARE=檢測變量

/EXPECTED=對應的期望頻數

/MISSINGANALYSIS.四、應用舉例某地區的人口消費結構在83年和90年的統計數字如下:食品衣物住房燃料日用品非商品支出83年5312.811.75.614.12.890年44.210.815.14.716.29.0建立一個數據文件:變量cost為44個1、11個2、15個3、16個5、9個6檢測變量:cost期望值定義:5313126143分析結果:Asymp.sig=.010,所以85年的消費結構同90年的消費結構差異顯著。第十六頁,共二十三頁,編輯于2023年,星期五二項分布檢驗一、二項分布檢驗概念對于某分布,假定低于某指定值V的百分比占P0。如果該假設成立,則分布將滿足一個規律。H0假設:樣本組中低于等于某值V的個案占百分比P0。二、操作步驟執行:[Analyze][Nonparametric][Binomial]選擇變量(必須是數值型變量)到TestVariables檢驗變量窗口定義分界值“DefineDichotomy”:“Getfromdata”為自動分界,即變量值中只有兩類數值?!癈utpoint”定義分界值,檢驗小于該值的觀測值?!癟est”定義檢驗百分比,例如:.10,.50或.75等。第十七頁,共二十三頁,編輯于2023年,星期五“Exact”可以定義各種不同分布下的顯著性檢驗,使計算更精確:“Asymptoticonly”適合于漸進分布的大樣本分布。“MonteCarlo”適合不滿足漸進分布的大樣本分布?!癈onfidence”指定置信區間。“Numberof”指定近似法計算中的個案數?!癊xact”精確計算統計概率。按鈕“Options”中可以設置選項:統計描述“Descriptive”中將計算:均值、標準差、最大值、最小值等?!癚uartiles”四等分百分位數的計算。缺失值“MissingValue”:“Excludecasestestbytest”表示排除在做統計分析的變量中含有缺失值的個案?!癊xcludecaseslistwise”表示排除在檢驗變量列表中開列的變量中含有缺失值的個案。第十八頁,共二十三頁,編輯于2023年,星期五三、命令語句NPARTEST/BINOMIAL(檢驗百分比)=檢驗變量(分界值)/MISSINGANALYSIS.四、應用舉例:設有若干塊實驗田,畝產(公斤)如下:623702674680736695801638721690655741H0假設:產量低于650公斤的地只占10%。CategoryNObservedProp.TestProp.ExactSig.(1-Tailed)<=6502.166667.1.341>65010.8

分析結果:ExactSig.為.341,表明H0假設,即:產量低于650公斤的地只占10%的結論可以接受。第十九頁,共二十三頁,編輯于2023年,星期五單樣本游程檢驗一、游程檢驗概念Runs游程:樣本測量值(變量值取值)相同取值的連續串。變量值分布可能有兩類最有規則情況:比如一班同學的成績全部在前面,而二班的全部在后面。也可能是兩個班成績不分上下,名次上是一個班一個,名次交替出現。隨機分布情況:名次分布完全沒有規律。H0假設:樣本分布是隨機的,即游程不是最大或最小二、操作步驟執行[Analyze][Nonparametric][RunsTest]選擇檢驗變量到TestVariables窗口中定義分界值“Cutpoint”:可以用中位數“Median”、眾數“Mode”、平均值“Mean”以及自定義“Custom”為分界值。第二十頁,共二十三頁,編輯于2023年,星期五“Exact”作用與前面相同“Options”作用與前面相同三、命令語句NPARTEST/Runs(分界值)=變量名/MISSINGANALYSIS.四、應用舉例有兩個班級各選拔出20名選手進行數學競賽,賽后成績排序的班級分布如下:1221121222112112212121221211111221211212H0假設:兩班的成績隨機分布的。檢驗結果:Asymp.Sig.(2-tailed).144結論:總個案數“TotalCases”40個,游程“NumberofRuns”26個,漸進顯著度水平“Asymp.Sig.(2-tailed)”為0.144>0.05。表明游程既不是最大,也不是最小,樣本的班級分布是隨機分布的。第二十一頁,共二十三頁,編輯于2023年,星期五

K-S分布的擬合優度檢驗一、K-S檢驗概念K-S檢驗是檢驗:實際分布與理論分布的差異是否顯著。Kolmogorov:樣本分布是否滿足某理論分布(均勻、正態、泊松)Smirnov:比較兩種統計推斷是否相同二、操作步驟執行[Analyze][NonparametricTest][1-SampleK-S]

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論