數據的編碼、錄入與整理_第1頁
數據的編碼、錄入與整理_第2頁
數據的編碼、錄入與整理_第3頁
數據的編碼、錄入與整理_第4頁
數據的編碼、錄入與整理_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

SPSS基礎與Access數據庫第七講數據的編碼、錄入與整理1.教師信息姓名:鄭戟明電話:67703855E-mail:shift_zjm@163.com

辦公室:學院樓B421部門:商務信息學院計算機教學部2.一、SPSS簡介3.SPSS的名稱1968年美國斯坦福大學兩名研究生研制,原名SPSS,英文名稱社會科學統計軟件包(StatisticalPackagefortheSocialSciences)首字母的縮寫。1994-1998年間陸續(xù)并購SYSTAT等公司,統計軟件的3S指的就是SPSS、SAS、SYSTAT2000年改名為“StatisticalProductandServiceSolutions”,即“統計產品與服務解決方案”2010年SPSS公司被IBM并購。4.SPSS軟件應用行業(yè)SPSS軟件是一款在很多行業(yè)的數據分析應用中久享盛名的統計分析工具,是世界上最早的統計分析軟件。應用領域經濟學教育學商業(yè)金融營銷研究行業(yè)電子商務數據統計政府機構其它5.SPSS的影響力在國際學術界有一條不成文的規(guī)定:凡是用SPSS完成的計算和統計分析,可以不必說明算法。6.SPSS發(fā)展1968年:斯坦福大學三位學生創(chuàng)建了SPSS,誕生了第一個用于大型機的統計軟件1975年:在芝加哥成立SPSS總部1984年:首先推出了世界上第一個統計分析軟件微機版本SPSS/PC+,并使其能很快地應用于自然科學、技術科學、社會科學的各個領域。1992年:推出Windows版本2000年:SPSS11.0起,SPSS全稱為“StatisticalProductandServiceSolutions”,即“統計產品和服務解決方案”。2009年:SPSS公司宣布重新包裝旗下的SPSS產品線,定位為預測統計分析軟件(PredictiveAnalyticsSoftware)PASW,包括四部分:統計分析、數據挖掘、數據采集、企業(yè)應用服務2010年:IBM收購SPSS之后,各子產品名稱統一加上IBMSPSS字樣:統計分析產品、數據挖掘產品、數據采集產品、企業(yè)應用服務7.SPSS發(fā)展8.SPSS發(fā)展9.SPSS基礎內容第7講SPSS數據的編碼、錄入與整理第8講統計報告第9講描述性統計第10講均值比較第11講散點圖、相關系數第12講回歸概念、回歸系數第13講SPSS綜述10.SPSS數據分析基本步驟建立數據文件數據加工整理統計分析解釋分析結果定義數據文件結構錄入、修改、保存數據11.二、數據處理的基本概念12.數據的編碼、錄入與整理原理是研究者利用SPSS進行統計分析的必要前提。就是把通過問卷調查獲得的資料轉變?yōu)镾PSS能夠識別的數據文件,為各種統計分析做好準備。數據編碼概念數據編碼是指把需要加工處理的數據庫信息,用特定的數字來表示的一種技術。根據一定數據結構和目標的定性特征,將數據轉換為代碼或編碼字符,在數據傳輸中表示數據的組成,并作為傳送、接受和處理的一組規(guī)則和約定。13.數據問卷量表序號調查內容選項1您的性別:(1)男(2)女2你的文化程度:(1)沒上過學(2)小學(3)初中(4)高中(5)大專以上3您想選擇下列哪些擇偶條件(任選三項):(1)相貌(2)文化水準(3)氣質風度(4)志同道合(5)人品(6)家庭條件(7)個人收入(8)其他4您購買房屋時,會考慮哪些因素(任選):(1)離工作地點的遠近(2)小孩所就讀的學校(3)居家附近的環(huán)境5您對心理學感興趣:(1)不感興趣(2)感興趣(3)非常感興趣6您對學英語感到厭惡:(1)不厭惡(2)厭惡(3)非常厭惡14.數據問卷編碼方案變量名編碼樣例第1題1-男;0-女男1第2題1-沒上過學;2-小學;3-初中;4-高中;5-大專以上小學2第3題-11-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環(huán)境1-選;0-不選選1第5題ABC(A-1,B-2,C-3)A1第6題ABC(A-3,B-2,C-1)A315.編碼類型(數值型數據)數值型數據的編碼數值型數據的編碼就是根據調查問卷的評分標準對變量賦予分值通常采用三點計分、四點計分和五點計分等方式進行評分如選項A、B、C計分為1、2、3如選項A、B、C、D計分為1、2、3、4編碼示例中的第5、6題就是屬于數值型編碼第5題是正向數值型(被選項的程度越高,分值越大)第6題是反向數值型(被選項的程度越高,分值越小)變量名編碼樣例第5題ABC(A-1,B-2,C-3)A1第6題ABC(A-3,B-2,C-1)A316.編碼類型(非數值型數據)非數值型數據的編碼非數值型數據的編碼,首先要確定編碼規(guī)則,然后根據規(guī)則對變量賦予分值。雙值型變量的編碼多采用“0、1”或“1、2”來賦值如編碼示例中的第1題多值型變量的編碼通常對非數值型數據編碼,主要起到分組的作用,不能進行各種算術運算變量名編碼樣例第1題1-男;0-女男1第2題1-沒上過學;2-小學;3-初中;4-高中;5-大專以上小學217.編碼類型(多項選擇題)多項選擇題的編碼多項選擇題就是題目答案的選項是多選項限定多選項分類法限定了一次最多可以選擇項目的個數;不能直接對題目進行編碼,必須先確定最多選擇,并給每個選項建立一個變量如編碼示例中的第3題任意多項二分法表示每一次可以任選幾個選項;編碼方法把每一個被選項作為一個變量來定義,每個變量只能選擇“1或0”如編碼示例中的第4題變量名編碼樣例第3題-11-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他文化水準2第3題-21-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他志同道合4第3題-31-相貌;2-文化水準;3-氣質風度;4-志同道合;5-人品;6-家庭條件;7-個人收入;8-其他人品5第4題-工作1-選;0-不選選1第4題-學校1-選;0-不選不選0第4題-環(huán)境1-選;0-不選選118.缺失值的概念什么是缺失值缺失值是指在數據采集與整理過程中丟失的內容,往往會給統計分析帶來一些麻煩和誤差。缺失值類型用戶缺失值在問卷調查中把不回答的選項當作缺失值來處理缺失值可用研究者能識別的數字來表示如“0、9、99”系統缺失值指計算機默認的缺失方式,如輸入數據空缺、輸入非法字符等通常把缺失值標記為“.”19.缺失值處理方法替代法:采用統計命令或在相關統計功能中利用參數替代在SPSS中,執(zhí)行菜單命令“Transform→ReplaceMissingValues”來替代缺失值剔出法:剔除有缺失值的題目或剔除有缺失值的整份問卷20.數據處理中的操作術語個案(Cases)一個研究對象就是一個個案;一個個案就是一條記錄;在數據表格中表示為“一行”每一個個案記錄的是一個研究對象各個屬性的具體數值,如學生信息(姓名、性別、年齡等)學號姓名性別出生日期專業(yè)編號0604231張三男87-1-1010604253李四女88-6-30020605321王五女88-8六男88-12-2402字段學生表個案21.數據處理中的操作術語樣本(Sample)是指具有共同屬性的所有研究對象,如學生的所有信息樣本包含多個個案,在數據表格中表示為“n行”變量(Variable)是指問卷中每一個問題,數據庫里字段,數據表格中表示為“一列”量值(Value)是指問卷中的答案,也稱為觀測值,在SPSS系統里,單元格中的數值就是變量值22.三、創(chuàng)建數據文件23.數據處理的流程建立數據文件數據加工整理統計分析解釋分析結果定義數據文件結構錄入、修改、保存數據24.定義變量啟動SPSS后進入數據編輯窗口,顯示為一個空文件,輸入數據前首先要定義變量定義變量主要就是定義數據文件的結構25.定義變量的方法單擊數據編輯窗口左下方的“VariableView”標簽或雙擊列的題頭(Var),打開變量定義窗口,進行變量定義。26.定義變量的內容變量名(Name):變量的名稱變量類型(Type):變量的類型寬度(Width):存儲變量值的最大值小數位數(Decimals):變量為數值類型時,小數后的位數變量標簽(Label):對變量名的注釋。光標在變量名上時,會顯示該標簽變量值標簽(Values):變量標簽的取值缺失值(MissingValues):定義缺失的值,例如,當定義99為缺失值時,當該變量的值為99時,把它認為是缺失值顯示數據的列寬(Colums):與上面“寬度”不同,它只管顯示對齊方式(Align):左對齊、右對齊、居中量度類型(Measure):定比變量(Scale)、定序變量(Ordinal)、定類變量(Nominal)。只用于統計制圖時坐標軸變量的區(qū)分和SPSS決策樹模塊的變量定義。27.定義變量名在定義變量窗口中“Name”下的單元格中輸入變量名變量名必須以字母開頭,長度不超過8個SPSS保留的關鍵詞不能作為變量名AND、OR、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、ALL等

SPSS中允許使用中文變量名,但盡量不要使用,以免出現兼容性問題28.定義變量類型、寬度及小數位數在“Type”下單擊單元格,打開變量類型窗口,選擇變量類型常用變量類型有:數值型(Numeric)日期型(Date)貨幣型(Dollar)字符型(String)29.定義變量標簽和變量值標簽定義變量標簽在“Label”下單擊單元格,輸入變量標簽SPSS允許變量標簽長度為255字節(jié)定義變量值標簽變量值標簽是對變量的每一可能取值進一步描述,當變量是定類或定序變量時,非常有用。變量值標簽系統默認為None在“Values”下單擊單元格,打開變量值標簽窗口,輸入變量值標簽30.定義缺失值在“Missing”下單擊單元格,打開缺失值窗口,輸入缺失值Nomissingvalues:沒有缺失值Discretemissingvalues:定義1~3個單一數為缺失值Rangeplusoneoptionaldiscretemissingvalues:定義指定范圍為缺失值,同時指定另外一個不在這一范圍的單一數為缺失值31.變量定義的信息復制如果有多個變量的類型相同,可以先定義一個變量,然后把該變量定義的信息復制給新變量操作步驟:先定義一個變量在該變量行號上單擊右鍵,在快捷菜單中選擇“Copy”選擇同類型新變量所在行,單擊右鍵,在快捷菜單中選擇“Paste”32.數據的錄入定義完所有變量后,單擊“DataView”標簽,在數據編輯窗口輸入數據。數據錄入如果按逐行進行,按“Tab”鍵改變行數據錄入如果按逐列進行,按“Enter”鍵改變列系統默認的數據文件保存類型為“.sav”33.數據的導入SPSS具有強大的與其他軟件共享數據文件的功能,所以能夠導入多種格式的數據能夠導入SPSS的數據文件:

*.sys、*.por、*.xls、*.slk、*.w*、*.dbf、*.dat、*.syd、*.sas7dbat等導入數據文件的操作步驟:執(zhí)行菜單命令“File→Open→Data”選擇導入數據文件的類型

通過復制粘貼導入數據在原系統中打開需要導入的數據文件復制粘貼到SPSS中特別要注意數據類型34.數據的導入(示例1)示例1:把Access中shift-MIS.mdb中的“學生表”信息導入到SPSS中操作步驟:打開shift-MIS.mdb文件,選中“學生表”單擊右鍵,在快捷菜單中選擇“導出”,選擇導出類型“Excel(X)”,確定保存位置、文件名和文件格式啟動SPSS,執(zhí)行菜單命令“File→Open→Data”,在“OpenData”窗口中選擇文件類型“Excel(*.xls)”,選擇“學生表.xls”文件以“學生表.sav”為文件名保存35.數據的導入(示例2)示例2:將EXCEL文件“2-recode.xls”導入到SPSS中方法一:執(zhí)行菜單命令“File→Open→Data”導入數據數據導入后,查看“VariableView”標簽中的字段名、類型、寬度等方法二:練習通過復制、粘帖的辦法把“2-recode.xls”中的數據通過復制,在SPSS中粘帖的辦法導入到SPSS中把導入后的數據文件保存為“2-recode.sav”36.四、數據的整理37.數據整理的概念什么是數據整理數據整理是對錄入的數據進行轉換、檢測、量表統分、個案選擇、文件拆分與合并等操作,使原始數據生成后續(xù)研究所需要的數據。數據整理操作方法SPSS實現數據整理的功能主要集中在“Data”和“Transform”兩個菜單中38.數據分值的轉換數據分值的轉換是通過對數據進行重新編碼來實現的。在SPSS中主要通過Recode命令來實現RecodeIntoSameVariables:編碼后數據存放在原變量中,覆蓋原數據RecodeIntoDifferentVariables:編碼后數據存放在新定義的變量中,保留原數據

39.數據分值的轉換(示例3)示例3:假設一套量表共10題,每題有A、B、C三個選項,現有10個被試作答。要求根據評分規(guī)則,將被試的原始數據選擇轉換為量表分數注意:1、2、4、7、8、10:正向題3、5、6、9:反向題量表評分規(guī)則

題號選項12345678910A1131331131B2222222222C331311331310名被試的作答結果表

題號被試123456789101ABBBABCACB2ABBCABCACB3ACBBABCABB4BBBBBACBCB5ACABBABABC6BCABABBBBA7BCCCABCABB8ACABBABACB9ABBBBACACB10BBBBABCBCC40.示例3結果原數據轉換后數據41.示例3操作步驟打開數據文件“2-recode.sav”執(zhí)行菜單命令“Transform→Recode→RecodeIntoDifferentVariables”打開“RecodeIntoDifferentVariables”對話框,定義新變量名打開“RecodeIntoDifferentVariables:OldandNewValue”對話框,定義轉換規(guī)則數據文件以原文件名保存42.量表的統分在數據錄入過程中,輸入的是最原始、最穩(wěn)定的反應選項,但在后續(xù)的統計分析中通常需要對量表的總分進行推斷統計。量表的統分工作包括分量表的統分和總量表的統分,SPSS中通常用“ComputeVariable”命令實現量表的統分工作43.量表的統分(示例4)示例4:以分值轉化后的數據文件“2-recode.sav”為例進行量表的統分。假定該量表由2個分量表構成,其中1個量表由第1、2、5、8、9題組成,另一個量表由第3、4、6、7、10題組成。計算出每一個被試的分量表分和總量表分。44.示例4操作步驟打開數據文件“2-recode.sav”。執(zhí)行菜單命令“Transform→ComputeVariable”(計算分量表分flb1、flb2和總量表分zlb)統分結果保存為“2-lb.sav”45.數據的排序在數據統計分析中,有時需要對一個或多個變量進行排序在SPSS中,主要通過菜單命令“Data→SortCases”來實現46.數據的排序(示例5)示例5:以數據文件“2-lb.sav”為例,對變量zlb進行由低到高的排序。如果變量值相同,再對flb1、flb2變量進行排序。47.示例5操作步驟打開數據文件“2-lb.sav”執(zhí)行菜單命令“Data→SortCases”

添加變量zlb、flb1、flb2進行排序,都是升序排序結果以原文件名保存48.數據的限選在進行統計分析或作圖時,經常需要選擇一定數量的個案來進行添加分析。在SPSS中,主要通過菜單命令“Data→SelectCases”來實現選擇所有個案按指定條件選擇個案對個案進行隨機抽樣按比例大概抽樣精確抽樣按范圍選擇個案多余數據保留在原表中多余數據被刪除49.數據的限選(示例6)示例6:以數據文件“Anxiety.sav”為例。要求限選前20個個案進行后續(xù)統計分析。50.示例6操作步驟打開數據文件“Anxiety.sav”執(zhí)行菜單命令“Data→SelectCases”

設置前20個個案文件另存為“select.sa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論