




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第四章 基本統計分析基本統計分析功能包括:主要講描述性統計分析(Descriptive Statistics)一、基本統計分析功能描述性統計分析(Descriptive Statistics)1. Frequencies 頻數分析2. Descriptive 描述性統計分析3. Explore 探索分析(自學)4. Crosstabs 列聯表分析5. Ratio 比率分析(自學)二、頻數分析(一)頻數的定義 頻數就是一個變量在各個變量值上取值的個案數。 可編制頻數分布表和繪制統計圖,把握數據分布的基本特征。(二)命令 Analyze/Descriptive statistics/Frequen
2、cies 選擇一個或多個變量右移入Variable(s)框。統計量顯示頻數分布表統計圖頻數輸出的順序Frequences主對話框輸出統計量對話框Chart 對話框Format 對話框按各個變量組織輸出,輸出結果將按照每個變量一張表的形式顯示按頻數的升序輸出按變量值的升序輸出統計表中變量的各項分析結果在一張表并列顯示控制頻數表輸出范圍類型的最大數目為某頻數分析結果演示統計量條形圖餅圖(圓餅圖)直方圖三、計算基本描述統計量(一)功能: 對變量進行描述性統計分析,計算均值、標準差、全距和均值標準誤差等,并可將原始數據轉換成Z分數。(二)調用命令: 按Analyze/Descriptive Stati
3、stics/ Descriptives順序單擊,打開主對話框。選一個或多個變量移入如選中此框,將對Variables框中選擇的變量進行標準化產生相應的Z分值,并作為新變量保存到數據窗口,其變量名在原變量名前加z。Descriptive 對話框 Options 對話框 (三)例題分析 已知20個初生嬰兒的體重數據如下表,對其進行描述統計。27702915279529952860297030873126312546542272350342183418392126693707231025733881提示:可以利用DATA中的TRANSPOSE進行轉置取得SPSS數據文件。打開數據文件“嬰兒體重.sa
4、v”。打開 Descriptives主對話框,選定變量t進入Variable欄中。選中Save standardized values as variables復選框,要求計算變量的z值,并保存結果到當前數據集中。單擊Options按鈕,選中Mean、Std.Deviation、Minimum、Maximum 、Variance 項。操作步驟:嬰兒體重的描述統計量這時打開原數據集,可看到多了一列zt,這是t 的z 分數,如下圖所示:保存了z 分數的數據集(一)主要功能 調用此過程可檢查數據是否有錯誤、考察樣本分布特征及對樣本分布規律作初步考察。剔除奇異值和錯誤數據。探索分析過程將提供在分組和不
5、分組的情況下常用的統計量與圖形。(二)探索分析 按Analyze Descriptive Statistics Explore 順序單擊,打開 Explore 主對話框。四、探索分析過程轉交叉列聯表分析Explore 主對話框Statistics對話框 Explore 欄中Plots對話框確定缺失值的處置:因變量或分組變量中帶有缺失值的觀測量都將在分析過程中被剔除。在分析過程中根據分組變量產生的組中帶缺失值的觀測量都將被剔除。分組變量的缺失值被單獨分為一組,輸出頻數時將標出缺失組。Explore 欄中Options對話框(三)例題:下表為30名10歲少兒的身高(cm)數據,試對其進行探索分析。
6、編號身高編號身高編號身高男女男女男女1131.5132.76135.5137.511132.2124.02137.4133.07121.4141.412129.0140.33128.2139.78129.2138.813132.6130.14136.0125.49135.4120.914140.9133.45140.4138.610135.8137.515129.3136.7步驟:打開 Explore主對話框,打開數據文件“Explore分析.sav”選變量height進入Dependent List欄中,選sex變量進入Factor List欄中;在Display欄中選擇 Both項;打開S
7、tatistics對話框,選中Descriptives 、M-estimation、 Outliers復選項,單擊Continue返回;打開Plot對話框,選擇Boxplots欄中的Factor levels together項,選擇Descriptives欄內的 Stem-and-leaf復選項,選擇Spread vs level with levene Test欄中的 Power estimation項,單擊 Continue 返回。單擊OK觀測量摘要表M估計量表少兒身高的分組描述統計量少兒身高的極端值方差一致性檢驗零假設是分組后的方差相等。表中四行是依據不同的統計量得到的檢驗,分別是基于
8、均值、基于中位數與調整后的自由度和基于調整后的均值。由于其顯著值均大于0.05,不能否定零假設,即可以認為男生和女生的身高的方差是無差異的。從左到右分為三部分:頻數、莖和葉。莖是整數部分,葉是小數部分,Stem width表示莖寬。每行的莖和葉組成的數字再乘以莖寬,即得到實際數據的近似值,實際數據中與該近似值靠近的值的個數即為頻數表示的個數。莖葉圖HIGHT Stem-and-Leaf Plot forSEX= 1 Frequency Stem & Leaf 1.00 12 . 1 4.00 12 . 8999 3.00 13 . 122 5.00 13 . 55567 2.00 14 . 0
9、0 Stem width: 10.00 Each leaf: 1 case(s)箱式圖方形是箱式圖的主體,上下邊為四分位數,中心粗線為中位數,變量的50%的觀測值落在這一區域中。方形上下兩條縱向直線是觸須線,觸須線外的兩端線為本體的最大值和最小值。本體指除奇異值外的變量值。奇異值用“O”標出,本例中無奇異值。五、列聯相關(一)列聯分析的基本原理自變量發生變化,因變量取值是否也發生變化。比較邊緣百分比和條件百分比的差別??ǚ綔y量用來考察兩變量是否獨立(無關)。 其原理是根據這一概率定理:若兩變量無關,則兩變量中聯合事件發生的概率應等于各自獨立發生的概率乘積當檢驗的相伴概率P小于a,拒絕原假設,說
10、明行列變量存在關聯。注意:原假設為行列變量無關。在列聯表中,這一定理就具體轉化為:若兩變量無關,則兩變量中條件概率應等于各自邊緣的概率乘積。反之,則兩變量有關,或稱兩變量不獨立。由此可見,期望值與觀察值的差距越大,說明兩變量越不獨立,也就越有相關。因此,卡方的表達式如下:卡方的取值在0之間??ǚ街翟酱螅P聯性越強。在SPSS中,有Pearson X2和相似比卡方(Likelihood Ratio X2 )兩種。 的改進標準化系數:為使 值有一固定的區間,便于比較,采用了以下幾個修正:A、系數(Phi): (01),適用于22表。B、 列聯系數(Contingency Coefficient):
11、 (01),適用任意表。C、 Cramer V系數:(01),適用任意表。D、系數(Lambda): (01),適用任意表。E、 Goodman & Kruskal-tau系數: (01),適用任意表。 (二)列聯表分析的功能調用列聯表分析過程可進行定類與定序資料列聯表分析,一個行變量(row)和一個列變量(column)可組成一個二維列聯表,如再加一個控制變量則可組成一個三維列聯表。而多個行、列、控制變量就可組成一個復雜的多維列聯表。在分析中可對二維和多維列聯表資料進行統計描述和x2檢驗,并計算相應的百分數指標。此外,還可計算四格表確切概率(Fishers Exact Test),且有單雙側
12、(One-Tail、Two-Tail)、對數擬然比檢驗( Likelihood Ratio)以及線性關系的Mantel-Haenszel x2檢驗。列聯表的格式列變量x行變量y(三)列聯表分析過程列聯表分析步驟: 按AnalyzeDescriptive Statistics Crosstabs 順序打開 Crosstabs 主對話框。Crosstabs 對話框Statistics 對話框醫學分析中用定類與定類定序與定序一定類,一定距均定距或均定序定類與定類定序與定序定序與定序定序與定序一定類,一定距Cell Display 對話框Table Format 對話框決定各行的排列順序:升序降序(四
13、)例1 為了探討吸煙與慢性支氣管炎有無關系,調查了339人,情況如下:吸煙和慢性支氣管炎調查表患慢性支氣管炎未患慢性支氣管炎吸煙43162不吸煙13121錄入數據“Crosstab.sav” 。變量h為頻次;變量x為是否吸煙:1為吸煙,2為不吸煙;變量n為是否患?。?為患病,2為不患病。選擇變量h進行加權。按Analyze-Descriptive Statistics-Crootabs 順序打開 Crootabs 主對話框。將x變量 選入Row框作為行變量,將n變量 選入Column 框作為列變量。打開Statistics對話框,選中Chi-squareContingency coeffici
14、ent和Phi and CramersV復選框,單擊Continue返回。單擊Cell按鈕,打開Cell display對話框,選中observed和Expected 復選框,單擊Continue返回;單擊OK。1.操作步驟統計摘要表,列出觀測量有效值個數、缺失值個數和總的個數。 2.輸出結果及分析 吸煙與患病統計摘要表吸煙與患病列聯表卡方檢驗 對稱性檢驗表例2:以SPSS自帶的數據文件”1991 U. S. General Social Survey.sav”為例分析影響幸福的因素。 六、多選項分析(一)多選項問題的分解方法:1、多選項二分法(每個答案設一個變量,變量值只有0、1)2、多選項分類法(變量個數為最多可能出現的答案數,變量取值為1K,K為可選答案的個數)(二)定義多項選擇變量集AnalyzeMultiple ResponseDefine Sets.(三)多選項頻數分析操作AnalyzeMultiple Response Frequencies(四)多選項交叉分組下的頻數分析操作AnalyzeMultiple Response-Crosstabs多選項分析應用舉例例1:儲蓄目的分析。簡單頻數分析與多選項頻數分析的結合一張表與
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 初三學生新學期國旗下演講稿(17篇)
- 超市員工試用期工作總結范文(5篇)
- 《乘用車營銷策略手冊》課件
- 單位食堂洗菜工的年終總結范文(7篇)
- 2025年建筑工地工作實習總結報告(5篇)
- 2025助學質押借款合同書(15篇)
- 《春季護膚小常識》課件
- 清理林地施工方案
- 學生愛校如家演講稿(4篇)
- 土方開挖工程承包合同(13篇)
- 第6-2章生料粉磨和熟料粉磨
- 2023年廣東學位英語試題學位英語考試真題(含答案)
- 冒泡排序算法課件
- 粵教版五年級下冊科學知識點
- 文言文《守株待兔》說課稿課件
- 生物礦物課件
- GB∕T 36765-2018 汽車空調用1,1,1,2-四氟乙烷(氣霧罐型)
- DB34-T 4243-2022 智慧醫院醫用耗材SPD驗收規范
- 《覺醒年代》朗誦稿
- 混凝土格構梁護坡施工方案設計
- 小學教育專業畢業論文
評論
0/150
提交評論