SPSS軟件入門與基礎統計知識_第1頁
SPSS軟件入門與基礎統計知識_第2頁
SPSS軟件入門與基礎統計知識_第3頁
SPSS軟件入門與基礎統計知識_第4頁
SPSS軟件入門與基礎統計知識_第5頁
已閱讀5頁,還剩72頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

版權所有,使用者請勿刪改SPSS軟件應用第一講SPSS根本介紹全稱:StatisticalPackagefortheSocialScience社會科學統計包軟件是當前在社會科學上最流行的統計應用軟件:如:市場營銷調查,社會學研究,教育學研究等你想輕輕松松發篇好文章在核心期刊上嗎?SPSS/EXCEL計算描述統計指標小結軟件獲得匯總統計量的基本選項SPSS1,分析>描述統計>頻率2,轉換>計算變量Excel1,工具一數據分析一描述統計一匯總統計或者公式:TOTAL,AVERAGE,MEDIAN,MODE,PERCENTILE,STDEV,VAR等你想用一款比excel更傻瓜快捷高效的軟件嗎?你想輕輕松松看懂論文,毫無壓力嗎?你想做比他更好的研究嗎?統計在教育學的小例子你會不會忍不住想:1,樣本中,有多少男孩,多少女孩?2,班級數學平均分是多少,女孩數學多少分?男孩數學多少分?3,班上100-120分數段有多少學生?深入的,你會不會想探究:男生的數學是不是真的比女生好?本地學生是不是比外地學生成績好?數學好的學生計算時機不會也不錯?兩者之間有一定的關聯?中考分數可不可以預測高考分數?根本學習內容:相關統計知識SPSS根本界面簡介SPSS數據文件創立、編輯以及修改統計學根本概念:描述統計(descriptivestatistics)研究的是數據收集、處理、匯總、圖表描述、概括與分析等統計方法。優點:化繁為簡,例如用圖表展示數據,建立數據模型,使數據清晰明了。推斷統計(inferentialstatistics)研究如何利用樣本數據來推斷總體等特征的統計方法。例如:要了解武漢市〔一個地區〕初中生運用計算機根本技能的能力,不可能對每個初中生的技能水平進行一一測量,需要抽取局部初中生,進行測量,然后根據獲得的樣本數據對所研究的總體特征進行推斷。總體(population)總體是包含所研究的全部個體(case)的集合。思考:在研究中,有些總體很好確定,比方研究武漢市學生的中考成績,那么武漢市所有學生就是總體;但有些場合總體范圍很難確定,比方要了解學生是否喜歡一種新興的教育技術〔電子白板〕,首先要確定哪些學校是使用者,即確定構成該使用者的總體,但事實上,總體范圍確實定比較復雜。總體、

樣本與個體樣本(sample)樣本是從總體中抽取一局部個體的集合,構成樣本的個體數目稱之為樣本量(samplesize);個體(case)統計分析的根本單元〔人、企業、單位等〕;研究的參與者;樣本中的一個成員;一個樣本中有n個個體,那么樣本量(samplesize)是n;參數統計量μσπxsp平均數標準差比

例總體樣本推斷參數(parameter)和

統計量(statistic)參數(parameter)參數是用來描述總體特征的概括性數字度量,它是研究者想要了解的總體的某些特征值。一般由總體平均數μ,總體標準差σ等;由于總體數據通常是龐大的,我們所不知道的,所以參數是一個未知的常數。因為如此,所以要進行抽樣,根據樣本計算出某些值去估計總體參數。參數(parameter)和

統計量(statistic)

統計量(statistic)統計量是用來描述樣本特征的概括性數學度量。它是根據樣本數據所計算出來的量值。統計量是樣本的函數。一般有樣本平均數x、樣本標準差s。由于樣本是抽選出來的,所以統計量總是知道的。抽樣的目的是根據樣本量去估計總體參數。例如用樣本平均數x去估計總體平均數μ,用樣本標準差s去估計總體標準差σ。除去樣本平均值,樣本方差這些常規統計量,還有為統計分析的需要而構造出來的統計量,比方統計檢驗的z統計量,t統計量,χ2統計量,f統計量等變量(variable)變量是說明現象的某種特征的概念。簡單的說是你想測量的個體的根本屬性。例如:學生的性別、年齡、期中考試的分數、高考的分數、期中考試的班級排名等;對于性別、年齡、分數、排名的測量有4種類型,分別是:名義尺度、順序尺度、間隔尺度、比率尺度。名義尺度〔Nominalscale〕例:性別男女例:居住的城市武漢北京上海天津例:你喜歡哪類書籍科幻小說紀實文學散文詩歌性別學生學號你使用過SPSS嗎?1-是的

0-沒有名義尺度〔nominalscale)名義尺度是一種標記方式,其中數字或者符號只是用來表示對物體分類(categories)的標簽,表示不同性每一類都只表示分類;不存在比較關系,設置的答案要注意互斥性和完備性。沒有順序性!不能做加減法運算,目的是求的各類答案數量。常用的統計方法有頻數分析、比率分析、求眾數分析。順序尺度〔ordinalscale〕期中考試某班全體同學的名次:第一名,第二名…..衣服的尺碼:S、M、LX、XS、SP受教育的程度:小學、初中、高中、大學、研究生順序尺度〔ordinalscale〕順序尺度〔ordinalscale〕的數字和符號不僅代表類別,而且還表示按某種特征或者屬性排列的上下、大小和先后順序。特點:兩個數字之間的差距沒有絕對的意義。在順序尺度中各類答案的分數是不能做加減乘除運算的;分數只是說明一個順序關系。可進行頻數分析、比例分析、求眾數分析。間隔尺度〔intervalscale〕例子:

高考分數等

考試分數

溫度值不僅是順序關系,重點是有可測量順序之間的相等差距。被調查者評定的分數可做加減,但不能作乘除運算。因為等距尺度中不具備真正的零點,不存在倍數關系。比率尺度〔rationscale〕比率尺度是測量數據中最高水平的尺度,可以進行分類分類、排序、加減乘數等運算。是最精確的計量尺度。有絕對零點(TrueZero),絕對

“0”

意味著“沒有”。例如:體重你這個學期選了幾門課程?年齡價格收入兩個值是否有大小、等級區別?在兩個差值1、2之間與2、3之間,是否是相等的?其中的0是否表示“沒有”?No—nominal名義尺度Yes-goon繼續No—ordinal順序尺度Yes-goon繼續No—interval間隔尺度Yes-goon繼續為什么測量尺度很重要?尺度類型基本特征實例

可能用到的統計方法描述性推斷性名義尺度nominalscale數字用于對物體的識別和分類學號,性別,媒體種類;百分比,眾數(mode)卡方(chisquare),二項式檢驗順序尺度ordinalscale數字代表物體的相對位置,無差距大小成績排名,最終學歷;社會階層;百分位數,中位數(median)序列相關,方差分析間隔尺度intervalscale有相等的差距;無絕對零點,有以上特征具體考試分數,華氏攝氏溫度;全距,平均數(mean),標準差(SD),簡單相關,t檢驗,方差,回歸,因子分析比率尺度ratioscale絕對零點意味著“無”,有以上所有基本特征年齡,收入,學習年限,體重;幾何平均數,(間隔尺度允許的都可以)變異系數;對數分析測量尺度的重要性測量尺度決定所獲取的信息:名義尺度是測量中最低的信息水平比率尺度測定可能包含大量的信息,是最精確的尺度尺度度量標準越高越好不同的測量尺度具有不同的分析方法小練習:一個研究者對研究武漢市初中生閱讀習慣充滿興趣,他在當地的一家初中隨機找了35個學生進行了調查,,詢問他們性別,年齡,所在年級,班級名次,最喜歡的書的類型〔小說,記錄文學,社科類讀物等〕,每個月在書籍上的開銷,花在讀書上的時間做了收集。提問:1,在這個研究中,總體(population)是什么?樣本(sample)是什么?2,樣本量(samplesize)是多少?3,變量(variable)有哪些?分別屬于什么測量尺度?4,樣本是否能反映總體?武漢市初中生當地一家初中隨機找的學生n=35性別是名義尺度,年齡是間隔尺度,所在年級是順序尺度,班級名次是順序尺度,最喜歡的書籍是名義尺度,書上的開銷和花在書上的時間都是比率尺度思考:你可以使用不同的尺度測量相同的變量:教育:你接受了多少年的根本教育〔比率尺度ration〕最高教育水平〔順序尺度ordinal〕測量尺度的復雜性:〔是順序尺度還是間隔尺度〕例:這堂課老師展示的PowerPoint你喜歡嗎?請按1到5進行排序:1表示非常不喜歡,5表示非常喜歡:非常不喜歡不喜歡一般,談不上很喜歡也談不上不喜歡喜歡非常喜歡根本學習內容:相關統計知識SPSS根本界面簡介SPSS數據文件創立、編輯以及修改SPSS根本介紹SPSS軟件共有4個窗口,表示4種不同類型的SPSS文件數據編輯窗口Dataeditor(.savfile)DataviewVariableview數據輸出窗口outputviewer(.spvfile)語法窗口syntaxeditor(.spsfile)腳本窗口scriptwindow變量個體輸出窗口根本學習內容:相關統計知識SPSS根本界面簡介SPSS數據文件創立、編輯以及修改創始屬于你自己的數據文件

插入新的變量insertingnewvariables

定義變量definingvariables

插入新的個體Insertingnewcases

輸入數據Entering/editingdatapoints

刪除變量Deletingvariables

刪除個體Deletingcases

保存數據Savingyourdataset用SPSS來儲存小練習中的數據:一個研究者對研究武漢市初中生閱讀習慣充滿興趣,他在當地的一家初中隨機找了35個學生進行了調查,,詢問他們性別,年齡,所在年級,最喜歡的書的類型〔小說,記錄文學,社科類讀物等〕,每個月在書籍上的開銷,每月零花錢,花在讀書上的時間做了收集。提問:1,在這個研究中,總體(population)是什么?樣本(sample)是什么?2,樣本量(samplesize)是多少?3,變量(variable)有哪些?分別屬于什么測量尺度?4,樣本是否能反映總體?練習1,創立一個新的SPSS數據文件;

2,在變量視圖創立以下幾個變量(Variables):學號、性別、年齡、學生家庭社會經濟狀況〔低中高〕、中考總成績、高考總成績。確定其根本屬性〔小數,測量尺度,值〕并保存該文件〔.sav);共創造5個個體〔Case)。3,保存數據文件SPSS數據文件〔.sav〕Excel文件〔.xls,xlsx,xlsm)數據的描述:圖與表頻數分布表餅圖條形圖直方圖線圖頻數分布表美國使用交互性電子白板情況中學教師授課專業統計落在某一特定類別或組中的數據個數。把各個類別及落在其中的相應頻數全部列出,用表格形式表現出來,叫頻數分布。餅圖piechart

美國一所中學使用交互性電子白板情況使用者占60%n=370不使用者占60%n=248用圓形以及圓內扇形的角度來表示數值大小的圖形,主要用于一個樣本或者總體中各組成局部占全部數據的比例。條形圖barchart玩游戲n=455編程n=44聽音樂n=477看電影n=350匈牙利德布勒森市初高中學生計算機使用情況調查直方圖histogram某班級學生身高統計條形圖和直方圖的區別疑問:直方圖和條形圖看上去都是由方條組成,是否有區別?處理的數據是否不一樣?答1:條形圖:用寬度相同的條形的高度和長短來表示數據多少的圖形。其寬度是固定的。直方圖:直方圖是用面積表示各組頻數的多少,寬度是有意義的。答2:條形圖是針對的分類數據。直方圖正對的是數值型數據。SPSS:FrequencyTable頻數表方法一:1、分析>描述統計>頻率.2、選取變量〔variable〕放進變量表單(variableslist)中.你可以同時選取幾個變量;3、可以選擇從高到低,也可以選擇從低到高;SPSS餅圖、條形圖、直方圖分析>描述統計>頻率單擊對話框左邊的圖表選擇圖表類型性別高考語文方法二:圖形>圖表構建程序

圖形畫板模板選擇程序

舊對話框實例:課堂實例中:我想看看三個班級各自的語文成績,同時我想看看基于各自的家庭經濟收入的三個班的高考語文成績。如何實現呢?庫>條>拖拽或者雙擊進入圖表預覽使用實例數據橫軸〔是否為x軸〕:班級;縱軸〔是否為y軸〕:高考數學X軸上〔設置顏色〕:家庭收入一班家庭收入對高考數學平均分并沒有什么影響二班家庭狀況中等的高考數學平均分略高于收入低的學生平均分,家庭收入高的學生平均分最低;三班家庭收入高學生平均分略高于家庭收入中等略高于家庭收入差的。計算新變量computevariables如果我想計算所有學生高考語文、高考數學和高考英語的平均分,如何計算?計算新變量computevariables

轉換>計算變量〔transform>computevariable)目標變量->取名,例如:平均分數學表達式->(高考語文+高考數學+高考英語)/3拓展練習:有一份電子白板量表,收集的時候,用-2表示很不滿意,2表示滿意。現在想用1表示不滿意,5表示滿意。如何轉換?根本概念學習:集中趨勢眾數中位數和分位數均值離散程度測量平均差方差標準差SPSS/EXCEL計算描述統計指標小結軟件獲得匯總統計量的基本選項SPSS分析>描述統計>頻率Excel工具一數據分析一描述統計一匯總統計或者公式:AVERAGE,MEDIAN,MODE,PERCENTILE,STDEV,VAR等集中趨勢的度量分類數據:眾數順序數據:中位數和分位數數值型數據:均值眾數、中位數和均值的比較集中趨勢的度量1,眾數〔mode〕眾數是一組數據中出現頻率最高的變量值。也就是出現最多的變量值。例如:1,1,1,2,2,1,1,3,4,5,4,2,1,1,191是出現頻率最多的,所以是眾數〔mode〕眾數是一個位置代表值,它不受數據中極端值的影響。從分部的角度看,眾數是具有明顯集中趨勢點的數值。可以有兩個或者多個眾數,還可以沒有。可用于分類數據。TheMode眾數特點:1,集中趨勢的測量2,出現次數最多3,不受極端值的影響4,一組數據可能沒有眾數5,也可能有多個眾數排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數據,也可用數值型數據,但不能用于分類數據中位數〔median〕中位數〔median〕舉例:中位數位置=〔n+1〕/2例:7,8,9,12,15位置=〔5+1〕/2=3;中位數是97,8,9,12位置是=〔4+1〕/2=2.5中位數是8.5平均數平均數也稱均值〔mean〕x-bar〔x〕=〔x1+x2+x3+x4+x5+xn〕/n這里指的是算數平均值。還有加權平均值和幾何平均值。接上例:x=〔850+1200+1650+1700+2000+2500+2600+3000+3800+120000〕/10=3130平均數在統計中具有重要地位,它是進行統計分析和統計推斷的根底。集中趨勢的最常用測度值一組數據的均衡點所在表達了數據的必然性特征易受極端值的影響用于數值型數據,不能用于分類數據和順序數據平均數眾數、中位數、均值的特點和應用眾數不受極端值影響具有不惟一性數據分布偏斜程度較大時應用中位數不受極端值影響數據分布偏斜程度較大時應用均值易受極端值影響數學性質優良數據對稱分布或接近對稱分布時應用眾數、中位數和均值的關系左偏分布均值

中位數

眾數對稱分布

均值=中位數=眾數右偏分布眾數

中位數均值在對稱的正態分布條件下:算術平均數等于眾數等于中位數;在非對稱正態分布的情況下,眾數、中位數和平均數三者的差異取決于偏斜的程度,偏斜的程度越大,它們之間的差異越大;當次數分配呈右偏(正偏)時,算術平均數受極大值的影響;當次數分配呈左偏(負偏)時,算術平均數受極小值的影響;中位數那么總是介于眾數和平均數之間。根本概念學習:集中趨勢眾數中位數和分位數均值離散程度測量方差標準差樣本方差和標準差方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!理解:兩個人打槍:每個人打6次:甲中靶:1,2,3,8,9,10乙中靶:3,4,5,6,7,8計算方差、標準差:兩個人甲乙打槍,每個人打6次:甲中靶環數:1,2,3,8,9,10均值=5.5乙中靶環數:3,4,5,6,7,8均值=5.5甲中環數的方差:s2=[(5.5-1〕2+〔5.5-2〕2+〔5.5-3〕2+〔5.5-8〕2+〔5.5-9〕2+(5.5-10〕2]/(6-1)=20.25+12.25+6.25+6.25+12.25+20.25=15.5乙中環數的方差s2=[(5.5-3)2+(5.5-4)2+(5.5-5)2+(5.5-6)2+(5.5-7)2+(5.5-8)2]/(6-1)=6.26+2.25+0.25+0.25+2.25+6.25=3.5方差和標準差(varianceandstandarddeviation)數據離散程度的最常用測度值反映了各變量值與均值的平均差異根據總體數據計算的,稱為總體方差或標準差;根據樣本數據計算的,稱為樣本方差或標準差4681012

x=8.3

自由度(degreeoffreedom)一組數據中可以自由取值的數據的個數當樣本數據的個數為n時,假設樣本均值x確定后,只有n-1個數據可以自由取值,其中必有一個數據那么不能自由取值例如,樣本有3個數值,即x1=2,x2=4,x3=9,那么x=5。當x=5確定后,x1,x2和x3有兩個數據可以自由取值,另一個那么不能自由取值,比方x1=6,x2=7,那么x3那么必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實際應用角度看,在抽樣估計中,當用樣本方差s2去估計總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論