




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Spss的數(shù)據(jù)預(yù)處理一、 數(shù)據(jù)預(yù)處理的目的:在數(shù)據(jù)文件建立好后,通常還要對(duì)待分析的數(shù)據(jù)進(jìn)行必要的預(yù)加工處理,這是數(shù)據(jù)分析過程中不可缺少的一個(gè)關(guān)鍵環(huán)節(jié)。數(shù)據(jù)的預(yù)加工處理是服務(wù)與數(shù)據(jù)分析和建模的,需要解決的問題如下:1、缺失值和異常數(shù)據(jù)的處理。2、數(shù)據(jù)的轉(zhuǎn)換處理。數(shù)據(jù)的轉(zhuǎn)換處理是在原有數(shù)據(jù)的基礎(chǔ)上,計(jì)算產(chǎn)生一些含有更豐富信息的新數(shù)據(jù)或?qū)?shù)據(jù)原有分布進(jìn)行轉(zhuǎn)換等。3、數(shù)據(jù)抽樣。從實(shí)際問題、算法或效率等方面考慮,并非收集到的所有數(shù)據(jù)(個(gè)案)在某項(xiàng)分析中都有用途,有必要按照一定的規(guī)則從大量數(shù)據(jù)中選取部分樣本參與分析。4、選取變量。并非所有數(shù)據(jù)項(xiàng)(變量)在某項(xiàng)分析中均有意以,選取部分變量參與分析是必要的。S
2、pss提供了一些專門的功能輔助用戶實(shí)現(xiàn)數(shù)據(jù)的預(yù)加工處理工作,通過預(yù)處理還可以使用戶對(duì)數(shù)據(jù)的總體分布有所了解。二、數(shù)據(jù)預(yù)處理步驟:1、數(shù)據(jù)的排序: (1)數(shù)據(jù)排序的目的: a、通常數(shù)據(jù)編輯窗口中個(gè)案的前后次序是由數(shù)據(jù)數(shù)錄入的先后順序決定的,數(shù)據(jù)排序便于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)取值狀況、缺失值數(shù)量的多少。 b、通過數(shù)據(jù)排序能夠快速找到最大值和最小值,進(jìn)而可以計(jì)算出數(shù)據(jù)的全距,快速把握和比較數(shù)據(jù)的離散程度。 c、通過數(shù)據(jù)排序能夠快速發(fā)現(xiàn)數(shù)據(jù)的異常值。 (2)、數(shù)據(jù)排序的步驟: a、選擇菜單:【Date】【Sort Cases】 b、指定主排序量到【Sort by】框中,并選擇【Sort Order
3、】框中的選項(xiàng)指出該變量按升序還是降序排序排序。【Ascending】表示升序,【Descending】表示降序。 c、如果是多重排序,還要依次指定第二、第三排序變量及相應(yīng)的排序規(guī)則。否則本部可略。排序窗口如下圖: 圖12、變量計(jì)算:(1)變量計(jì)算的目的: a、通過數(shù)據(jù)的轉(zhuǎn)換處理,在原有數(shù)據(jù)的基礎(chǔ)上,計(jì)算產(chǎn)生一些含量更豐富的新數(shù)據(jù)。 b、對(duì)數(shù)據(jù)的原有分布狀態(tài)進(jìn)行轉(zhuǎn)換,由于數(shù)據(jù)分析和建模中某些模型對(duì)數(shù)據(jù)分布 有一定的要求,因此可以利用變量計(jì)算對(duì)原有數(shù)據(jù)的分布進(jìn)行轉(zhuǎn)換。 c、spss變量計(jì)算是在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶給出的spss的算術(shù)表達(dá)式以及函數(shù),對(duì)所有個(gè)案或滿足條件的部分個(gè)案,計(jì)算產(chǎn)生一系
4、列新變量。(2)變量計(jì)算的操作步驟: a、選擇菜單:【Transform】【Compute Variable】 出現(xiàn)如圖2所示窗口: 圖2 b、在【Numeric Exepression】框給出spss算術(shù)表達(dá)式和函數(shù)。可以手工輸入也可以按窗口的按鈕算數(shù)表達(dá)式和函數(shù)的輸入工作。c、在【Target Variable】框中輸入存放結(jié)果的變量名。d、如果用戶只希望對(duì)符合一定條件的個(gè)案計(jì)算產(chǎn)生變量,則按if按鈕,出現(xiàn)如圖3所示的窗口。選擇【Include if case satisfies condition】選項(xiàng),然后輸入條件表達(dá)式,否則本步略去。 圖3 3、變量的選取: (1)數(shù)據(jù)選取的目的:
5、a、提高數(shù)據(jù)的分析效率。 b、檢驗(yàn)?zāi)P汀?(2)數(shù)據(jù)選取的步驟:a、【Date】【Select Case】 b、在【Select】框中選擇選取方法。如圖4所示: 圖4 4、計(jì)數(shù): (1)計(jì)數(shù)的目的: 把握個(gè)案各方面的特征。 (2)計(jì)數(shù)的步驟: a、選擇菜單:【Transform】【Count Values within Cases】如圖5所示: b、選擇參與計(jì)數(shù)的變量到【Numeric Variables】框中。 c、在【Target Variable】框中輸入存放技術(shù)結(jié)果的的變量名,并在【Target Label】框中輸入相應(yīng)的變量名標(biāo)簽。 圖5d、按Define Values 按鈕定義計(jì)數(shù)
6、區(qū)間,出現(xiàn)圖6所示窗口。通過Add、Change、Remove按鈕完成計(jì)數(shù)區(qū)間的增加、修改和刪除。 e、如果僅希望對(duì)滿足條件的個(gè)案進(jìn)行計(jì)數(shù),則按if按鈕并輸入spss相應(yīng)表達(dá)式。否則本部可略。 圖65、分類匯總: (1)【Date】【Aggregate】 (2)指定分類變量到【Break Variables】框中,指定匯總變量到【aggregated Variables】 框中,如圖7: (3)按function按鈕指定對(duì)匯總變量計(jì)算那些統(tǒng)計(jì)量。Spss默認(rèn)計(jì)算均值。 (4)制定將匯總結(jié)果保存到何處。 (5)按name&Lab按鈕重新指定匯總結(jié)果中的變量名或變量名標(biāo)簽。 (6)如果希望
7、在結(jié)果文件中保存各分類組的個(gè)案數(shù)則選擇【Number of cases】.6、數(shù)據(jù)分組: (1)【Transform】【Recode into Dfferent Variables】 (2)選擇分組變量到【Numeric Variable>Output】框中。 (3)在【Numeric Variable】框中的【name】后輸入存放分組結(jié)果的變量名,并按change按鈕確認(rèn)。 (4)按old and new Values按鈕進(jìn)行分組區(qū)間定義。如圖8所示: (5)如果只對(duì)符合條件的個(gè)案進(jìn)行分組,則按if按鈕輸入spss條件表達(dá)式。 7、數(shù)據(jù)轉(zhuǎn)置: (1)【Date】【transpose】如
8、圖9所示: (2)指定數(shù)據(jù)轉(zhuǎn)置后保留那些變量,將它們們選入【Variables】框中。 (3)指定數(shù)據(jù)轉(zhuǎn)置后應(yīng)保留那些變量名。8、加權(quán)處理: (1)【Date】【W(wǎng)eight Cases】 (2)選擇【W(wǎng)eight Cases by】選項(xiàng),并選擇某變量作為加權(quán)變量到【Frequency Variable】框中。如圖10所示:9、數(shù)據(jù)拆分: (1)數(shù)據(jù)拆分的目的: 根據(jù)指定變量對(duì)數(shù)據(jù)進(jìn)行分組,它將為以后進(jìn)行的分組統(tǒng)計(jì)分析提供便利。 (2)數(shù)據(jù)分組的步驟: a、【Date】【Split File】如圖11所示: b、選擇拆分變量到【Groups based on】框中。 c、拆分會(huì)使后面的分組統(tǒng)計(jì)
9、產(chǎn)生兩種不同格式的結(jié)果。 d、如果數(shù)據(jù)編輯窗口中的數(shù)據(jù)已經(jīng)事先安所指定的拆分變量進(jìn)行了排序,則可以選擇【File is already sorted】項(xiàng),他可以提高拆分執(zhí)行的速度,否則選擇【Sort the file by grouping Variables】項(xiàng)。三、spss數(shù)據(jù)預(yù)處理應(yīng)注意的事項(xiàng): 1、數(shù)據(jù)排序時(shí)須注意的事項(xiàng): (1)數(shù)據(jù)排序是整行數(shù)據(jù)排序,而不只是對(duì)某列變量進(jìn)行排序 。 (2)多重排序中指定排序變量的次序很關(guān)鍵。 (3)數(shù)據(jù)排序以后,原有數(shù)據(jù)的排列必然別打亂。 2、變量計(jì)算: (1)如果指定存放計(jì)算結(jié)果的變量為新變量,spss會(huì)自動(dòng)創(chuàng)建它,如果指定產(chǎn)生的變量已經(jīng)存在,sp
10、ss會(huì)提問用戶是否以計(jì)算出的新值覆蓋原有舊值。(2)對(duì)不滿足指定條件的個(gè)案,spss不進(jìn)行變量值計(jì)算。對(duì)新變量取值為系統(tǒng)缺失值,對(duì)已有舊變量,變量值保持不變。 3、數(shù)據(jù)選取: (1按上述操作步驟完成數(shù)據(jù)選取后,以后的spss分析操作僅針對(duì)那些被選中的個(gè)案直到用戶再次改變數(shù)據(jù)選取為止。 (2)采用按指定條件選取和隨機(jī)選取方法進(jìn)行數(shù)據(jù)選取后,spss將在數(shù)據(jù),編輯窗口中自動(dòng)生成一個(gè)名為filter_$的新變量,取值為1或0。1表示本條個(gè)案被選中,0表示為別選中。該變量是spss產(chǎn)生的中間變量,如果刪除它,則自動(dòng)取消樣本選取。 4、分類匯總:(1)分類匯總中的分類變量可以是多個(gè),此時(shí)的分類匯總陳偉多重分類匯總。(2)類似與數(shù)據(jù)排序,在多重分類匯總中,指定多個(gè)分類變量的先后次序是關(guān)鍵的。5、數(shù)據(jù)的分組: 在定義分組區(qū)間時(shí),應(yīng)遵循補(bǔ)充不漏的原則。6、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 單位食堂改造合同范本
- 房屋租賃合同范本 商用
- 新開超市供貨合同范本
- 超市柜臺(tái)轉(zhuǎn)讓合同范本
- 搬運(yùn)服務(wù)協(xié)議合同范本
- 2025年春一年級(jí)語文上冊(cè) 14 文具的家(+公開課一等獎(jiǎng)創(chuàng)新教案+素材)
- 教師校園安全知識(shí)
- 韻達(dá)快遞年終總結(jié)
- 遼寧省葫蘆島2025年高三下學(xué)期六校(4月)聯(lián)考數(shù)學(xué)試題試卷含解析
- 宜賓學(xué)院《嵌入式系統(tǒng)設(shè)計(jì)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 內(nèi)部設(shè)施零星維修服務(wù) 投標(biāo)方案(技術(shù)方案)
- 血液透析室內(nèi)瘺針滑脫pdca匯報(bào)
- 水利安全生產(chǎn)風(fēng)險(xiǎn)防控“六項(xiàng)機(jī)制”右江模式經(jīng)驗(yàn)分享
- FZ∕T 25005-2021 底網(wǎng)造紙毛毯
- 2024年淮北職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案解析
- 2023全國(guó)高考四套文言文真題挖空訓(xùn)練(答案)
- 姓吳的研究報(bào)告
- 神經(jīng)外科常見引流管護(hù)理課件
- 自縊的護(hù)理查房
- 安全生產(chǎn)費(fèi)用使用臺(tái)賬
- 精神障礙社區(qū)康復(fù)服務(wù)投標(biāo)方案
評(píng)論
0/150
提交評(píng)論