大數(shù)據(jù)正態(tài)性檢驗及正態(tài)轉(zhuǎn)化在spss中地實現(xiàn)_第1頁
大數(shù)據(jù)正態(tài)性檢驗及正態(tài)轉(zhuǎn)化在spss中地實現(xiàn)_第2頁
大數(shù)據(jù)正態(tài)性檢驗及正態(tài)轉(zhuǎn)化在spss中地實現(xiàn)_第3頁
大數(shù)據(jù)正態(tài)性檢驗及正態(tài)轉(zhuǎn)化在spss中地實現(xiàn)_第4頁
大數(shù)據(jù)正態(tài)性檢驗及正態(tài)轉(zhuǎn)化在spss中地實現(xiàn)_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、標(biāo)準(zhǔn)實用文案數(shù)據(jù)正態(tài)性檢驗及正態(tài)轉(zhuǎn)換在spss中的實現(xiàn)1數(shù)據(jù)正態(tài)性檢驗1.1觀察分布,預(yù)先判斷主要觀察直方圖,以及根據(jù)峰度和偏度粗略估計研究變量的分布。采用spss中描述統(tǒng)計中的頻率分析來實現(xiàn),具體操作如下:(1) 在spss中打開數(shù)據(jù)資料文件,依次點擊分析一描述統(tǒng)計一頻率”,如下圖:(2) 在彈出的對話框中,選擇左邊方框中要研究的變量,點擊中間的箭頭,將其選入右邊的對話框,本文選擇“脛圍”作示例分析,如下圖:文檔 imn ira , Wit n -n- m Hhw “ N i Um,|m nrj . v -i -半鮎弍-it耘辺謹(jǐn)I3W WihJajeii4rto-KrijIMIH* ?Fi

2、*3wrnl?MHFfmaIUCJQMLH44IRIK吃1)a if-kjuijrigUlU|mcalM w|LIFJWMW 99nwHIJIIRhlUwMEWdIWKsiHuhduiilJJuAfl|1IM*)j-ir LiITTWTHT JJrTLtWlZisarj4W5UJlljlil:IWMHMMBHIM ttJV-(3) 之后,選擇最右邊五個選項卡中的“統(tǒng)計”選項卡,在彈出的對話框中的右下角勾選“偏度”和“峰度”選項,點擊“繼續(xù)”,如下圖:(4) 再點擊“圖表”選項卡,在彈出的對話框中勾選“直方圖”和“在直方圖中顯示正態(tài)曲線”選項,點擊“繼續(xù)”,如下圖: 暉MH R佝 *!屮和i 枷

3、機I申g 口財 Hirfpii 中 匚 “m* BTht hk-*iim q a wK4PJMWIJTW%霄* Mpriw-ahjjQfflIjhih)J|-鼻序PM1Jhi&BrC1兇4)U|JIJi*4h4iXIb-A EUCMJ知Xi H3I-MIlIJ JQ|咽厲1屯*XI7iKaUijC-FINiLHJJLtutIW)*的斟41IfE3ff7Cma沁口注LIIIS7MUlCMUT*口ikijgAIQillMM*口EWd*lLUtukkKIZCJCi4J-45Hr裙HiriiuiIM1AJnrM略1449Hlfr Md.LTfeiKCCinsa*41 KT lUiwpji祁Mlillr

4、LWfeTHn|3HH1Vfl押 OMH-OE11fJSMtWC*ww*49J HPitn-B*vainiMIMris20 H-?rM-rsliraurJSQt(5)然后點擊“確定”選項,得出如下結(jié)果:統(tǒng)計一欄中包括有偏度及其標(biāo)準(zhǔn)誤差、峰度及其標(biāo)準(zhǔn)誤差。由結(jié)果可知:2.486(偏度)1.96*0.061(偏度標(biāo)準(zhǔn)誤差);23.951 (峰度)1.96*0.126(峰度標(biāo)準(zhǔn)誤差),推測該脛圍數(shù)據(jù)不符合正態(tài)分布。 怦卄”:-I *川 fin Hl . “m HMM*+ Ml KMHII 4站 w brrilXl - VW XP5E Um nH*昭K LEE丹3口劄18事CRti% *31MSTWU

5、* HHWlR nsEB tnB* *Abf y*55 iwi.mt n T=MUnlEQ VFMEJ *!C-Wli3 L5T211i.tj IL1網(wǎng)iu45 43AU3-11*WJL4g砂It J,JkW IL胡鼻L!HUzX JO*I.TLJ; qI htlaLI14VJ_SiJJ3HlS* WjJJW* iaI.J整E4 J4.Jk44 /L3 1.1MT4.H-JJ.1JIJEW Brr1 iw.1盯.1KiDB-144 01.2正態(tài)分布顯著性檢驗采用spss中非參數(shù)分析方法對數(shù)據(jù)資料進行正態(tài)性檢驗,具體步驟如下:(1) 在spss中打開數(shù)據(jù)資料文件,依次點擊“分析一非參數(shù)檢驗一單樣

6、本k-s ”,如下圖: * t I幷spss si !=. nwua*D-b:C|竺空蟲Fdm.冒wM甲尸SMW1193 n斗艮A mUK斗liMilllWiIM-J Rh1*輯llljIIbriMi i|ii41A3*!IliJAVbWLKUSiifiuJ J4H*-Li Xi4MidISldidJi?IhL*kb時Mg*T K3lU|-nKC齢IX斗17肋iuiuidiriW罠IW-K71,Hki-44s-Mid也aCJLUiit-Lia幷IUIMIMJlMEu*a4加盤idUMinPBIM-ki加E|.KklH1也U7J1UJI-LiUrjucIKJJO147JflnoLIVk疋IMAM

7、14f J4utiAip-HKTUwJFHntkl-UaR-HOiIU1MLU7MHl阿疋111心pmtitUfa肝rn raF1Fui-jnarn-wIJ3IB?臨uzo霧舸oiiirtK#JLitfckKIWFJP|l JQ|.F5BIX:r mS3?JSRBurrFLtx1 J?netUlHdlmoiIWNKMy hirrntlHFTbWwwT3CnwEJJOHFTCS鼻JEH3SJ辭Ilrx:MT川 Kin攔幌卩呂A Bn:viai.(2) 在彈出的對話框中,選擇左邊方框中要研究的變量,點擊中間的箭頭,將其選入右邊的對話框,本文選擇“脛圍”作示例分析,如下圖: IPM iH 宴如 *H

8、VllftD) ttlicil 殊鈕町r嘰囲額鼻匡盡申孔|Llftl MKIHI & * T g *! a* q 3 空H昌B b c邑需爭 H嚀誦請交兩M半|lhiII I H*理打臂倉骷電!(賣秸* M14肋JlM-KC35JUMUfliiaia14hU4IWK171;E-iftUIAHCJL4m耳IHBUfllUIMLHfliMUMUmgG|raaxiicjjaUEiut!IXJMA |gtilVI lHfi|.FWW:T r.i!TJ5尋IJQ9-3MBUFJLCI!iJpDetUiMjd|i|”的Mt|1 IfvnPMfl igIHrrrI21K!3i? E?lawujq172MXm

9、o-cDuj?1!材呵 iMi tonanw ww(3) 之后,點擊最右邊的“精確”選項卡,在彈出的對話框中有三個選項,1、“僅漸進法”:是基于漸進分布的顯著性水平的檢驗指標(biāo),適用于大樣本,如果樣本過小或者分布不好, 就會影響檢驗的效力;2、“蒙特卡洛法”:適用于精確顯著 性水平的無偏估計,如果樣本過大,數(shù)據(jù)處理過程太長,就應(yīng)該使用這個選項; 3、“精確”:精確計算概率值,可以設(shè)定數(shù)據(jù)處理的時間,如果數(shù)據(jù)處理時間超過了所設(shè)定時間 30分鐘,就應(yīng)該使用“蒙特卡洛法”。本文選擇“僅漸進法” 進行正態(tài)顯著性檢驗,點擊繼續(xù),如下圖:(4) 然后,點擊“選項”的選項卡,在彈出的對話框中勾選要輸出的參數(shù),

10、可以全部勾選,本文僅勾選“描述”和“按檢驗排除個案”,點擊“繼續(xù)”,如下圖: vi士i申川itI 姻w 宙聞 轉(zhuǎn)Humhiitlft* !l113 3 DIIJ3|HiMil?IZVfHie*iHWM V*R-*a* Vt|.VV|Fi|fl|W4W1甩知iJ5UKliMlllin|W* hi41taPXd-i ai24jimeM-U1 4 !TlLUA凹肋Ul1irW4I?|Jki|1s-r * iiKIMCJL1UI-1幷nmlUIMUl*jJ2MA1HUM用M-H-1E|.KHXC1也33uu |丹町IXEMrm-xIXJM147 XihkNnajuiIMIMJJMLrt*-IUH-iW

11、nuunBliXllflbliaigSi n ranJGnulH IBM密離R星聞槪.和于呼 W yn|Lflf ZffF(5) 點擊“確定”,彈出如下結(jié)果。由結(jié)果可知:漸近顯著性(雙尾)=0.000. r Bl r; * 嗚簡 “ 円 BJ “ 眄 n ; z :“ r,宅 = .ELHKTM i . IkM 5DSL-S&rjKea KH鼻眾 p j b 丁 f -塑缶弍i* 自 夕厶也 辛 T(r詛0 口縣 it Hriv-44eu-# dtfH T|1.n?*8 1WV Itltl-SIMWtk l=m rs叩 i Jii jlv ctw* i rle Euawci *u.iraai.

12、* NF*rltrl R!*!F*|i F # !l .I 呂V-HI* 斥轉(zhuǎn)IJ ft 泄口Qf nDMl2數(shù)據(jù)正態(tài)轉(zhuǎn)換2.1數(shù)據(jù)正態(tài)轉(zhuǎn)換的方法變量數(shù)據(jù)轉(zhuǎn)化為正態(tài)分布,需要根據(jù)原始變量及其分布形狀確定相應(yīng)的轉(zhuǎn)換公式,常用的變量正態(tài)變換方法有對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等。1、 對數(shù)變換:即將原始數(shù)據(jù) X的對數(shù)值作為新的分布數(shù)據(jù): X =lgX。當(dāng)原始數(shù)據(jù)中 有小值及零時,亦可取X=lg (X+1),還可根據(jù)需要選用 X =lg (X+k)或X =lg(k-X )。 對數(shù)變換常用于:(1)使服從對數(shù)正態(tài)分布的數(shù)據(jù)正態(tài)化。如環(huán)境中某些污染物的分布,人體中某些微 量元素的分布等

13、,可用對數(shù)正態(tài)分布改善其正態(tài)性。(2) 使數(shù)據(jù)達到方差齊性,特別是各樣本的標(biāo)準(zhǔn)差與均數(shù)成比例或變異系數(shù)CV接近 于一個常數(shù)時。2、 平方根變換:即將原始數(shù)據(jù)X的平方根作為新的分布數(shù)據(jù):X =sqrt ( X)。平方根變換常用于:(1)使服從泊松分布的計數(shù)資料或輕度偏態(tài)資料正態(tài)化,可用平方根變換使其正態(tài)化。(2 )當(dāng)各樣本的方差與均數(shù)呈正相關(guān)時,可使資料達到方差齊性。3、 倒數(shù)變換:即將原始數(shù)據(jù) X的倒數(shù)作為新的分析數(shù)據(jù):X =1/X。倒數(shù)變換常用于 資料兩端波動較大的資料,可使極端值的影響減小。4、 平方根反正弦變換:即將原始數(shù)據(jù)X的平方根反正弦值作為新的分析數(shù)據(jù):X=sin-1sqrt (

14、X)。平方根反正弦變換常用于服從二項分布的率或百分比資料。一般認(rèn)為等總體率較小如V 30%時或較大(如70%時),偏離正態(tài)較為明顯,通過樣本率的平方根反正 弦變換,可使資料接近正態(tài)分布,達到方差齊性的要求。上述公式只能減輕或消除變量的正偏態(tài),但如果用于負偏態(tài)的變量(即不觀察偏態(tài)和峰度),則會使負偏態(tài)變得更加嚴(yán)重。 如果是負偏態(tài)的分布,則需要先對原始變量做反向轉(zhuǎn)換, 即將所有的值反過來,如將最大值變成最小值、最小值變成最大值等等。一般而言,根據(jù)原 始數(shù)據(jù)分布來選擇轉(zhuǎn)換方法:(1 )如果是中度偏態(tài)(如偏度為其標(biāo)準(zhǔn)誤差的2-3倍),可以考慮取根號值來轉(zhuǎn)換。(2 )如果是高度偏態(tài)(如偏度為其標(biāo)準(zhǔn)誤差的

15、 3倍以上),則可以取對數(shù),其中又可 分為自然對數(shù)和以10為基數(shù)的對數(shù),兩者區(qū)別在于以 10為底數(shù)的對數(shù)比自然對數(shù)的糾偏 作用更強,甚至?xí)⒄珣B(tài)轉(zhuǎn)換為負偏態(tài)。2.2數(shù)據(jù)正態(tài)轉(zhuǎn)換在spss中的實現(xiàn)(1)以上文的脛圍數(shù)據(jù)為例,在spss中打開脛圍數(shù)據(jù)資料,依次點擊“轉(zhuǎn)換 -計算變量”,如下圖:常菲卜IM巧 刈因MfHAl AKm: 曹鈿1 k mf舊aI*-AMiniju 卉啊S *舉篙丸M *Lm BQ 竹If 卄計的,f 麗“”皿亠mjr ui1h -Ll 11. L!CJL? bC- I*IJMH電JIPMAlUi-swn*TP-mLi4v-llhi*tr h國HgkjirJ ui31AJ

16、JHIK atttrMiijHIW*LMjar |AK4*4114眸瑞弓|KWI|T BlOMf nriPIL* MHBU.IbLIE1 ft* tlL Er jiEblIJffl Rlj M|T JX-V 冉一iiFf hfl和.HW 11.|1*|理SHPH,屈h tTl4幅*iiEEm Auf 4rnnr-w wItiliMV tkMMU *0丄u iLI皿里1 Ul hiHLUJ JFbbKLlJd円亠|理.*Min丘訊|.TI-IA Ci-k-KIXJ IE-LI MT -McEJlA1 FW VIb筑4MVIIA卻7 Jihi-La HiwxmwuJi MHribifaj4f lu

17、* irH理X?J丄峠UKkl場啦kiJuPIbWifIMP*r ilWf.lAJf!| RM IIUM-4蜀5.科理罰IHwin| M HI I#*nKTNHMJXljan-n-U !M JOpl*跡t It(2 )彈出如下對話框。首先,在“目標(biāo)變量”對話框中填入所要轉(zhuǎn)換成的變量名稱,方便理解,本文以脛圍為例,將轉(zhuǎn)換成的變量名稱設(shè)為“脛圍(轉(zhuǎn)換)”;然后,在“函數(shù)組”對話框中選擇“全部”;其次,在“函數(shù)和特殊變量”對話框中根據(jù)需要選擇函數(shù),本文脛圍的偏度為2.486,遠大于其標(biāo)準(zhǔn)誤差 0.061,因此本文選用糾偏作用最強的函數(shù),即以10為底數(shù)的對數(shù),因此選擇“函數(shù)和特殊變量”對話框中的函數(shù)“Lg10 ”,點擊本對話

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論