spss-復習資料-可直接打印版_第1頁
spss-復習資料-可直接打印版_第2頁
spss-復習資料-可直接打印版_第3頁
spss-復習資料-可直接打印版_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

創立/翻開方式:手工:File—new/open—syntax自動:Editor—options—opensyntaxwindowsatstart-up語句窗口組成:窗口主菜單、工具欄、spss程序編輯區、狀態欄四局部組成SPSS數據文件組成:數據結構和內容兩項任務,即描述數據的結構〔變量視圖〕和錄入編輯數據〔數據視圖〕。首字符應以英文字母開頭,后面可以跟除了!、?、*之外的字母或數字。下劃線、圓點不能為變量名的最后一個字符。SPSS允許用漢字作為變量名。2.變量名的字符個數最好不多于8個;變量名不區分大小寫字母。3.SPSS有默認的變量名,以字母“VAR〞開頭,后面補足5位數字,如VAR00001,VAR00012等。變量名不能ALL,BY,AND,NOT,OR等。三種根本數據類型:數值型、字符型和日期型標準型〔Numeric〕列寬8位,包括正負號、小數點和小數位在內字符型數據的默認顯示寬度為8個字符,不能進行算術運算,區分大小寫字母。數值型變量默認為右對齊,字符型變量默認為左對齊。定距型數據通常指連續型數據,如身高、體重;定序型數據職稱、職務、對某事物的贊同程度定類型民族、宗教信仰、性別、黨派。按變量值定位:Edit+Find恢復刪除或修改前數據Edit+UndoWritevariablesnamestospreadsheet寫入Excel工作表的第一行上。Indicatecasesourceasvariable默認source01取值0〔第一份數據〕或1(第二份數據)的變量。第三章條件表達式:簡單條件表達式和復合條件表達式。NOT>AND>ORfilter_$的新變量,取值為1或0。1表示本個案被選中,0表示未被選中。Filtered:未被選中的個案號碼上打一個“\〞標記成績為優:90throughhighest,成績為良:80through89,不及格:Lowestthrough59數據分組方法:單項式分組;組距分組全距:最大值與最小值之差組距=全距÷組數。Lowestvalue表示升序;Highestvalue表示降序。數據轉置行列互換Data-Transpose加權處理例用戶滿意度測評Data-WeightCases。[frequency](1)一旦指定了加權變量,那么以后的分析處理中加權是一直有效的,直到取消加權為止。取消加權應選擇Donotweightcases選項。(2)加權后,數據編輯窗口中的數據并沒有變化,僅在狀態欄有已經加權〔weighton〕的提示信息。數據拆分Data-SplitFile。排序和分組。數據拆分將對后面的分析一直起作用SPSS變量集包括系統變量集和用戶變量集。SetinUse框中應至少有一個變量集。SPSS缺失值處理〔1〕選擇菜單Transform-replacemissingvalues〔2〕將需要插補的變量單擊按鈕送到NewVariables框中,該變量自動會生成一個新的變量,變量名為原變量名_1〔3〕在Method中選擇插補方法。第四章頻數分析根本任務〔1〕編制頻數分布表:頻數〔Frequency〕;百分比〔Percent〕:即各頻數占總樣本數的百分比;有效百分比〔ValidPercent〕;累計百分比〔CumulativePercent〕〔2〕繪制統計圖Chart計算其他根本描述統計量〔1〕描述集中趨勢。1〕均值〔Mean〕〔2〕中位數〔Median〕〔3〕眾數〔Mode〕次數最多的數據值〔2〕描述離散程度。1〕全距〔Range〕:也稱極差。數據的最大值與最小值之間的絕對離差2〕方差〔Variance〕:3〕標準差〔3〕描述分布形態。〔1〕偏度〔Skewness〕:①對稱分布時,正負總偏差相等,偏度值等于0;②偏度值大于0,右偏;偏度值小于0,左偏。③偏度絕對值越大,表示數據分布形態的偏斜程度越大。〔2〕峰度〔Kurtosis〕:①與標準正態分布的陡峭程度相同,峰度值等于0;②峰度大于0數據分布更陡峭,尖峰分布;③峰度小于0數據分布平緩,平峰分布。交叉分組下的頻數分析的根本操作〔1〕菜單項選擇項Analyze-DescriptiveStatistics-CrosstabsCounts框中的Expected期望頻數反映的是行列變量互不相干下的分布。Unstandardized為非標準化剩余,定義為:觀測頻數-期望頻數卡方統計量觀測值的大小取決于兩個因素:①列聯表的單元格子數;②觀測頻數與期望頻數的總差值。值越大時,卡方值越大,實際分布與期望分布的差距越大,說明行列變量之間越相關;反之,說明行列變量之間越獨立。統計推斷做決策通常有兩種方式:①卡方觀測值>臨界值,②觀測值的概率p值和顯著性水平Analyze-MultipleResponseDichotomies表示以多項選擇二分法categories表示以多項選擇分類法〔1〕多項選擇二分法時:1,0,1,1,1,0,1,1,0。〔2〕多項選擇分類法時:1,3,4,5,7,8,0,0,0。在進行多項選擇項分析時,需將設置的變量組成一個集合,即多項選擇項變量集(Set),然后對多項選擇項變量集的各種取值進行分析PctofResponses〔占總答復數的%〕;PctofCase〔占總個案數%〕。比率分析的根本步驟Analyze-DescriptiveStatistics-Radio分子選擇到Numerator分母選到Denominator比率分析:適用于定距型變量。根本描述統計量均值、中位數、標準差、全距①加權比率均值〔Weightedmean〕:兩變量均值的比,屬集中趨勢描述指標②AAD〔AverageAbsoluteDeviation〕平均絕對離差M是比率變量的中位數,N為樣本數③COD〔CoefficientofDispersion〕離散系數④PRD〔Price-relatedDifferential〕相關價格微分⑤COV變異系數:比率變量離散程度的描述:均值;中位數單樣本的T檢驗Analyze-Comparemeans-One-SamplesTtest總體均值的檢驗(2未知小樣本)t統計量兩獨立樣本的T檢驗樣本容量可以相等,也可以不相等(12、22)12、22未知,大樣本檢驗統計量為12、22未知但相等,小樣本配對樣本的t檢驗Analyze-Comparemeans-Paired-SamplesTTest〔3〕要求:①樣本容量相等,順序一一對應;②樣本來自的總體服從或近似服從正態分布。檢驗統計量D0:假設的差值。。自由度df=nD-1方差分析的原理假設前提:①觀測變量各總體服從正態分布②觀測變量各總體的方差相同分類:①根據控制變量的個數可將方差分析分為單因素方差分析、多因素方差分析;②根據觀測變量的個數可將方差分析分為一元方差分析〔單因變量方差分析〕和多元方差分析〔多因變量方差分析〕。單因素方差分析Analyze-Comparemeans-One-WayANOVA[MeansPlot]輸出各水平下觀測變量均值的折線圖如果均值相等—效勞質量沒有顯著差異;如果均值不全相等—效勞質量有顯著差異。SST—總離差平方和;SSA—組間平方和:由控制變量不同水平造成SSE—組內平方和:由抽樣隨機性引起。SPSS多重比擬檢驗的方法①LSD最小顯著性差異方法適用于各總體方差相等的情況,特點是比擬靈敏②Tukey方法和S-N-K方法適用于各水平下觀測變量個數相等的情況;③Scheffe方法單因素方差分析進一步分析:1.方差齊性檢驗2.多重比擬檢驗。〔采用LSD,Bonferroni,Tukey,Scheffe,S-N-K五種方法〕3.趨勢檢驗4.先驗比照檢驗6.3多因素方差分析Analyze-GeneralLinearModel-Univariate,獨立影響;交互作用SSAB為控制變量A、B兩兩交互作用引起的變差均值檢驗:①多重比擬檢驗〔PostHoc〕②比照檢驗〔Contrast〕1〕如果控制變量之間無交互作用,各水平對應的直線是近于平行的;2〕如果控制變量間存在交互作用,各水平對應的直線會相互交叉6.4協方差分析Analyze-GeneralLinearModel-Univariate(1〕方差分析中的控制變量都是定性變量〔包括定類和定序變量〕〔2〕線性回歸分析中的解釋變量都是定量變量。〔3〕協方差分析中的控制變量是定性變量,協變量一般是定量變量。協方差分析中要求多個協變量之間無交互作用,且觀測變量與協變量之間有顯著的線性關系。非參數檢驗——總體分布的卡方檢驗[Analyze]-[NonparametricTests]-[Chi-Square]二項分布檢驗[Analyze]-[NonparametricTests]-[Binomial]單樣本K-S檢驗1-sampleK-S7.2兩獨立樣本的非參數檢驗:曼-惠特尼U檢驗、K-S檢驗、W-W游程檢驗、極端反響檢驗等多獨立樣本的非參數檢驗:中位數檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗兩配對樣本的非參數檢驗[Analyze]-[NonparametricTests]-[2relatedsamples]McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗多配對樣本的非參數檢驗:Friedman檢驗、CochranQ檢驗、Kendall協同系數檢驗。第八章SPSS的相關分析計算相關系數②r>0正線性相關;r<0負線性相關③r=1完全正相關;r=-1表完全負相關;r=0不相關④|r|>0.8有較強的線性關系;|r|<0.3線性關系較弱相關系數主要有:Pearson簡單相關系數〔適用于兩個變量都是數值型的數據〕、Spearman等級相關系數〔定序變量〕和Kendall相關系數〔定序變量〕等一元線性回歸模型的數學模型X的變化引起的y的線性變化局部:其他隨機因素引起的y的變化局部:用最小二乘法求解方程中的兩個參數,得到:2.多元線性回歸方程β1、β2、…βp為偏回歸系數。平均變動.可決系數對于多元線性回歸方程回歸方程的顯著性檢驗是要檢驗被解釋變量與所有的解釋變量之間的線性關系是否顯著。對于一元線性回歸方程,檢驗統計量為:對于多元線性回歸方程,檢驗統計量為回歸系數的顯著性檢驗是要檢驗回歸方程中被解釋變量與每一個解釋變量之間的線性關系是否顯著。對于一元線性回歸方程,檢驗統計量為一元線性回歸中,回歸方程顯著性檢驗和回歸系數顯著性檢驗的作用相同,可相互替代,且回歸方程顯著性檢驗的F統計量等于回歸系數顯著性檢驗t統計量的平方多元線性回歸方程,檢驗統計量為回歸方程顯著性檢驗—檢驗所有偏回歸系數是否同時為零。回歸系數顯著性檢驗對每個偏回歸系數是否為零逐一進行檢驗。兩種檢驗不能相互替代殘差序列中不包含明顯的規律性和趨勢性。殘差分析包括:①殘差是否服從均值為零的正態分布;②殘差是否為等方差的正態分布;③殘差序列是否獨立;④借助殘差探測樣本中的異常值。殘差序列獨立性:殘差序列前期和后期數值之間不存在相關關系,即:DW檢驗用來檢驗殘差的自相關DW=2,——無自相關,DW=4,——完全負自相關DW=0,——完全正自相關DW在0-2之間——存在正自相關,DW在2-4之間——存在負的自相關。一般情況下,DW值在之間即可說明無自相關現象異方差的后果〔1〕參數的最小二乘估計不再是最小方差、無偏、有效估計〔2〕導致回歸系數顯著性檢驗的t值偏高,進而容易拒絕原假設,使無用變量保存下來,增大模型的預測偏差。①殘差與預測值的平方根成比例變化—對解釋變量作開方處理②殘差與預測值成比例變化—對解釋變量取對數③殘差與預測值的平方成比例變化—對解釋變量求倒數標準化殘差:對殘差進行標準化,根據準那么,的絕對值大于3的為異常值測度多重共線性一般有以下方式〔1〕容忍度容忍度的取值范圍在0-1之間,越接近0表示多重共線性越強,越接近1表示多重共線性越弱。〔2〕方差膨脹因子VIF①方差膨脹因子是容忍度的倒數。②VIF越大多重共線性越強,當VIF大于等于10時,說明存在嚴重的多重共線性。〔3〕特征根和方差比最大的特征根遠遠大于其他特征根,那么說明這些解釋變量間具有相當多的重復信息。〔4〕條件指數①指最大特征根與第i個特征根比的平方根。②當條件指數在0-10之間時說明多重共線性較③當條件指數在10-100之間說明多重共線性較強;④當條件指數大于100時說明存在嚴重的多重共線性多重共線性的后果:〔1〕偏回歸系數估計困難〔2〕偏回歸系數的估計方差隨解釋變量相關性的增大而增大〔3〕偏回歸系數的置信區間增大〔4〕偏回歸系數估計值不穩定性增大〔5〕偏回歸系數假設檢驗的結果不顯著Estimates:SPSS默認輸出項,輸出與回歸系數相關的統計量:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論