




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1講
數據的編碼、錄入與整理一、數據的編碼概念原理是研究者利用SPSS進行統計分析的必要前提。就是把通過問卷調查獲得的資料轉變為SPSS能夠識別的數據文件,為各種統計分析做好準備。數據編碼概念數據編碼是指把需要加工處理的數據庫信息,用特定的數字來表示的一種技術。根據一定數據結構和目標的定性特征,將數據轉換為代碼或編碼字符,在數據傳輸中表示數據的組成,并作為傳送、接受和處理的一組規則和約定。二、數據問卷與編碼(舉例)問卷量表序號調查內容選項1您的性別:(1)男(2)女2你的文化程度:(1)沒上過學(2)小學(3)初中(4)高中(5)大專以上3您想選擇下列哪些擇偶條件(最多選三項):(1)相貌(2)文化水準(3)氣質風度(4)志同道合(5)人品(6)家庭條件(7)個人收入(8)其他4您購買房屋時,會考慮哪些因素(任選):(1)離工作地點的遠近(2)小孩所就讀的學校(3)居家附近的環境5您對心理學感興趣:(1)不感興趣(2)感興趣(3)非常感興趣6您對學英語感到厭惡:(1)不厭惡(2)厭惡(3)非常厭惡二、數據問卷與編碼(舉例)變量名編碼樣例第1題1-男;2-女男1第2題1-沒上過學;2-小學;3-初中;4-高中;5-大專以上小學2第3題-11-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環境1-選;0-不選選1第5題ABC(A-1,B-2,C-3)A1第6題ABC(A-3,B-2,C-1)A3問卷編碼方案三、編碼類型數值型數據的編碼數值型數據的編碼就是根據調查問卷的評分標準對變量賦予分值。通常采用三點計分、四點計分和五點計分等方式進行評分
如選項A、B、C計分為1、2、3
如選項A、B、C、D計分為1、2、3、4
編碼示例中的第5、6題就是屬于數值型編碼第5題是正向數值型(被選項的程度越高,分值越大)第6題是反向數值型(被選項的程度越高,分值越小)變量名編碼樣例第5題ABC(A-1,B-2,C-3)A1第6題ABC(A-3,B-2,C-1)A3三、編碼類型非數值型數據的編碼
非數值型數據的編碼,首先要確定編碼規則,然后根據規則對變量賦予分值。
雙值型變量的編碼多采用“0、1”或“1、2”來賦值;如編碼示例中的第1題
多值型變量的編碼采用“1、2、3、…”來賦值;如編碼示例中的第2題
通常對非數值型數據編碼,主要起到分組的作用,不能進行各種算術運算變量名編碼樣例第1題1-男;0-女男1第2題1-沒上過學;2-小學;3-初中;4-高中;5-大專以上小學2三、編碼類型多項選擇題
多項選擇題就是題目答案的選項是多選項,標準定義有兩種:二分法和多重分類法任意多項二分法
表示每一次可以任選幾個選項;編碼方法把每一個被選項作為一個變量來定義,每個變量只能選擇“1或0”;如編碼示例中的第4題變量名編碼樣例第3題-11-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環境1-選;0-不選選1三、編碼類型多項選擇題
多項選擇題就是題目答案的選項是多選項,標準定義有兩種:二分法和多重分類法多選項多重分類法
限定了一次最多可以選擇項目的個數;不能直接對題目進行編碼,必須先確定最多選擇,并給每個選項建立一個變量;如編碼示例中的第3題變量名編碼樣例第3題-11-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環境1-選;0-不選選1多重分類定義變量集四、缺失值的處理概念
缺失值是指在數據采集與整理過程中丟失的內容,往往會給統計分析帶來一些麻煩和誤差。類型
用戶缺失值在問卷調查中把不回答的選項當作缺失值來處理缺失值可用研究者能識別的數字來表示如“0、9、99”系統缺失值指計算機默認的缺失方式,如輸入數據空缺、輸入非法字符等通常把缺失值標記為“.”四、缺失值的處理缺失值處理方法
替代法:采用統計命令或在相關統計功能中利用參數替代
Transform→ReplaceMissingValues
剔除法:剔除有缺失值的題目或剔除有缺失值的整份問卷五、數據處理中的操作術語個案(Cases)一個研究對象就是一個個案;一個個案就是一條記錄;在數據表格中表示為“一行”每一個個案記錄的是一個研究對象各個屬性的具體數值,如學生信息(姓名、性別、年齡等)個案學號姓名性別出生日期專業編號0604231張三男87-1-1010604253李四女88-6-30020605321王五女88-8六男88-12-2402每一行為一條記錄每一列為一個字段每個記錄只能對應一個對象且僅為一個字段學生表五、數據處理中的操作術語樣本(Sample)是指具有共同屬性的所有研究對象,如學生的所有信息樣本包含多個個案,在數據表格中表示為“n行”變量(Variable)
是指問卷中每一個問題,數據庫里字段,數據表格中表示為“一列”量值(Value)
是指問卷中的答案,也稱為觀測值,在SPSS系統里,單元格中的數值就是變量值六、定義變量啟動SPSS后進入數據編輯窗口,顯示為一個空文件,輸入數據前首先要定義變量。建立數據文件數據加工整理統計分析解釋分析結果定義數據文件結構錄入、修改、保存數據六、定義變量定義變量所包含的內容:變量名(Name):變量的名稱變量類型(Type):變量的類型寬度(Width):存儲變量值的最大值(1-可存儲1個字節的字符,2-可存儲1個漢字)小數位數(Decimals):變量為數值類型時,小數后的位數變量標簽(Label):對變量名的注釋。光標在變量名上時,會顯示該標簽變量值標簽(Values):變量標簽的取值缺失值(MissingValues):定義缺失的值,例如,當定義99為缺失值時,當該變量的值為99時,把它認為是缺失值顯示數據的列寬(Colums):與上面“寬度”不同,它只管顯示對齊方式(Align):左對齊、右對齊、居中量度類型(Measure):定比變量(Scale)、定序變量(Ordinal)、定類變量(Nominal)。只用于統計制圖時坐標軸變量的區分和SPSS決策樹模塊的變量定義。六、定義變量單擊數據編輯窗口左下方的“VariableView”標簽或雙擊列的題頭(Var),打開變量定義窗口,進行變量定義。六、定義變量定義變量名
在定義變量窗口中Name下的單元格中輸入變量名變量名必須以字母開頭,長度不超過8個SPSS保留的關鍵詞不能作為變量名AND、OR、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、ALL等
SPSS中允許使用中文變量名,但盡量不要使用,以免出現兼容性問題六、定義變量定義變量類型、寬度及小數位數
在Type下單擊單元格,打開變量類型窗口,選擇變量類型常用變量類型有:數值型(Numeric)日期型(Date)貨幣型(Dollar)字符型(String)
在Width、Decimal下單元格,選擇寬度和小數位數,系統默認為“8”和“2”;或者在變量類型窗口中設置六、定義變量定義變量標簽
在Label下單擊單元格,輸入變量標簽SPSS允許變量標簽長度為255字節定義變量值標簽
變量值標簽是對變量的每一可能取值進一步描述,當變量是定類或定序變量時,非常有用。變量值標簽系統默認為None在Values下單擊單元格,打開變量值標簽窗口,輸入變量值標簽:“1”代表男,“2”代表女。選中顯示值標簽按鈕,,可以通過下拉框錄入性別。六、定義變量定義缺失值在Missing下單擊單元格,打開缺失值窗口,輸入缺失值Nomissingvalues:沒有缺失值Discretemissingvalues:定義1~3個單一數為缺失值Rangeplusoneoptionaldiscretemissingvalues:定義指定范圍為缺失值,同時指定另外一個不在這一范圍的單一數為缺失值六、定義變量變量定義的信息復制如果有多個變量的類型相同,可以先定義一個變量,然后把該變量定義的信息復制給新變量操作步驟:先定義一個變量在該變量行號上單擊右鍵,在快捷菜單中選擇“Copy”選擇同類型新變量所在行,單擊右鍵,在快捷菜單中選擇“Paste”
七、數據的錄入定義完所有變量后,單擊“DataView”標簽,在數據編輯窗口輸入數據。數據錄入如果按逐行進行,按Tab鍵改變行數據錄入如果按逐列進行,按Enter鍵改變列系統默認的數據文件保存類型為“.sav”八、數據的導入
SPSS具有強大的與其他軟件共享數據文件的功能,所以能夠導入多種格式的數據:八、數據的導入-Excel文件例一(1):數據的導入將EXCEL文件2-recode.xls導入到SPSS中啟動SPSS;步驟:File→Open→Data.
數據導入后,查看“VariableView”標簽中的字段名、類型、寬度等。把導入后的數據文件保存為2-recode.sav八、數據的導入例一(2):把Access中shift-MIS.accdb中的“學生表”信息導入到SPSS中.方法1:a).打開shift-MIS.accdb文件,選中“表”對象,再選中“學生表”。八、數據的導入例一(1):把Access中shift-MIS.accdb中的“學生表”信息導入到SPSS中.b).菜單上,文件→導出…,“保存類型”選擇“MicrosoftExcel”,文件名自動為“學生表”→“導出”
八、數據的導入例一(1):把Access中shift-MIS.accdb中的“學生表”信息導入到SPSS中.c).啟動SPSS,File→Open→Data,“文件類型”選擇“Excel(*.xls)”,找到“學生表.xls”文件后→“打開”d).保存為:學生表.sav八、數據的導入例一(1):把Access中shift-MIS.accdb中的“學生表”信息導入到SPSS中.方法2:直接打開數據源
文件>打開數據庫>新查詢
(按照向導完成)九、數據的整理概念
數據整理是對錄入的數據進行轉換、檢測、量表統分、個案選擇、文件拆分與合并等操作,使原始數據生成后續研究所需要的數據。包含:文件級數據整理變量級數據整理其他數據整理九、數據的整理操作SPSS實現數據整理的功能主要集中在“Data”和“Transform”兩個菜單九、數據的整理-Recode例二:數據分值的轉換
數據分值的轉換是通過對數據進行重新編碼來實現的。在SPSS中主要通過Recode命令來實現九、數據的整理例二:數據分值的轉換IntoSameVariables:編碼后數據存放在原變量中,覆蓋原數據IntoDifferentVariables:編碼后數據存放在新定義的變量中,保留原數據
九、數據的整理例二:數據分值的轉換假設一套量表共10題,每題有A、B、C三個選項,現有10個被試作答。要求根據評分規則,將被試的原始數據選擇轉換為量表分數注意:1、2、4、7、8、10:正向題3、5、6、9:反向題量表評分規則
題號選項12345678910A1131331131B2222222222C331311331310名被試的作答結果表
題號被試123456789101ABBBABCACB2ABBCABCACB3ACBBABCABB4BBBBBACBCB5ACABBABABC6BCABABBBBA7BCCCABCABB8ACABBABACB9ABBBBACACB10BBBBABCBCC九、數據的整理例二:數據分值的轉換原數據轉換后數據九、數據的整理例二:數據分值的轉換數據輸入:打開數據文件(2-recode.sav)Transform→Recode→IntoDifferentVariables
打開“Recode”對話框,定義新變量名打開“OldandNewValue…”對話框,定義轉換規則九、數據的整理-Compute例三:量表的統分在數據錄入過程中,輸入的是最原始、最穩定的反應選項,但在后續的統計分析中通常需要對量表的總分進行推斷統計。量表的統分工作包括分量表的統分和總量表的統分,SPSS中通常用“Compute”命令實現量表的統分工作注:變量計算的目的分為1.數據的轉換處理,新變量更具有直觀有效的特點,如:根據顧客的消費總金額和消費時間計算平均消費以預測理想客戶;根據購房客戶的貸款總額和按揭方案計算指標來評價客戶的風險大小。2.對數據原有分布狀態進行轉換。如:利用對數或多項式轉換對非正態或非線性數據進行處理;對時間序列進行平穩化處理等。九、數據的整理例三:量表的統分以分值轉化后的數據文件2-recode.sav為例。假定該量表由2個分量表構成,其中1個量表由第1、2、5、8、9題組成,另一個量表由第3、4、6、7、10題組成。計算出每一個被試的分量表分和總量表分。九、數據的整理例三:量表的統分打開數據文件2-recode.sav。Transform→Compute(計算分量表分flb1、flb2和總量表分zlb)
統分結果保存為2-lb.sav九、數據的整理-SortCases例四:數據的排序
分為:個案排序和變量排序
在SPSS中,主要通過Data→SortCases、Data→SortVariables來實現。注:排序使我們初步了解數據的離散程度,發現數據的異常值。九、數據的整理例四:數據的排序以數據文件2-lb.sav為例,找出變量zlb的高低分組的分組一般以總個案的40%為界限確定高低分
九、數據的整理例四:數據的排序
打開數據文件2-lb.sav
Data→SortCases
將分數排序,確定高分組和低分組的起點分數值將變量zlb轉換為變量zlb1(重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 村級財務制度培訓與優化提升
- 七年級生物下冊 第四單元 生物圈中的人 第七章 人類活動對生物圈的影響第一節 分析人類活動破壞生態環境的實例教學設計 (新版)新人教版
- 人教版 (2019)選擇性必修 第二冊Unit 1 Science and Scientists教案及反思
- 2024云南曲靖福牌彩印有限公司招聘2人筆試參考題庫附帶答案詳解
- 三年級信息技術上冊 第3課 可愛的小老鼠教學設計 遼師大版(三起)
- 人教精通版四年級下冊Unit 3 What subject do you like bestLesson 14教案
- 上海市金山區九年級歷史上冊 第二單元 近代社會的確立與動蕩 第11課 開辟新時代的“宣言”教學設計 北師大版
- 2024中核匯海招聘筆試參考題庫附帶答案詳解
- 人教版四年級上冊語文教案設計(教學反思參考3)去年的樹學案-學案下載
- 內蒙古版四下綜合實踐 第三單元 主題活動四《自主選題:橋梁知多少》教案+素材
- 電力工程項目建設工期定額
- 監控系統維保專題方案及報價
- 房地產廣告圍擋施工投標文件范本
- 生育服務證辦理承諾書空白模板
- 主播人設打造
- 英語人教新起點(一起)五年級下冊-海尼曼分級閱讀G2《The Hug》教學設計
- 大慶油田第五采油廠杏四聚聯合站工程轉油放水站二期工程施工組織設計
- 智慧景區視頻監控系統設計方案
- 大年初一沒下雪 短文小說
- 中小學生守則ppt課件(18頁PPT)
- 本專科領域文獻記載的中醫診療方法挖掘、整理與應用
評論
0/150
提交評論