用圖表展示數(shù)據(jù)_第1頁
用圖表展示數(shù)據(jù)_第2頁
用圖表展示數(shù)據(jù)_第3頁
用圖表展示數(shù)據(jù)_第4頁
用圖表展示數(shù)據(jù)_第5頁
已閱讀5頁,還剩80頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據(jù)分析數(shù)據(jù)分析( (方法與案例方法與案例) )作者作者 賈俊平賈俊平統(tǒng)計學統(tǒng)計學2 - 2統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版) 圖并沒有說謊,是說謊者在畫圖。 Benjamin Disraeli 第 2 章 用圖表展示數(shù)據(jù)2.1 用圖表展示定性數(shù)據(jù) 2.2 用圖表展示定量數(shù)據(jù) 2.3 合理使用圖表2 - 4統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)學習目標l 定性數(shù)據(jù)的頻數(shù)分布表l 定性數(shù)據(jù)的圖示方法l 定量數(shù)據(jù)的頻數(shù)分布表l 定量數(shù)據(jù)的圖示方法l 用Excel和SPSS作頻數(shù)分布表和圖形l 合理使用圖表2 - 5統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用哪些圖形展

2、示獎牌?2009年7月26日至8月3日第13屆世界游泳錦標賽在意大利羅馬舉行。美國的泳壇霸主地位難以撼動,中國軍團也創(chuàng)造了史上第二的佳績在本屆游泳世錦賽上,中國代表團取得金牌數(shù)和獎牌與美國并列第一、獎牌榜排名第二的好成績,而且中國男子游泳首次奪得世界性大賽的冠軍并一舉打破世界紀錄。本屆游泳世錦賽共設有獎牌227枚,其中金牌75枚、銀牌75枚、銅牌77枚。下表是本屆游泳世錦賽金牌總數(shù)取得前三名的國家所獲得獎牌的分布情況 2 - 6統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用哪些圖形展示獎牌?根據(jù)上面的數(shù)據(jù),你認為可以選擇哪些圖形來展示三個國家所獲得的獎牌情況?學完本章的圖表展示技術,這樣的

3、問題就會迎刃而解2 - 7統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)統(tǒng)計應用把數(shù)據(jù)畫圖之后,要用用腦袋沃德(Abraham Wald)和許多統(tǒng)計學家一樣,在第二次世界大戰(zhàn)時也處理了戰(zhàn)爭與相關的問題。他發(fā)明的一些統(tǒng)計方法在戰(zhàn)時被視為軍事機密。以下是他提出的概念中較簡單的一種沃德被咨詢飛機上什么部位應該加強鋼板時,開始研究從戰(zhàn)役中返航的軍機上受敵軍創(chuàng)傷的彈孔位置。他畫了飛機的輪廓,并且標識出彈孔的位置。資料累積一段時間后,幾乎把機身各部位都填滿了。于是沃德建議,把剩下少數(shù)幾個沒有彈孔的部位補強。因為這些部位被擊中的飛機都沒有返航資料來源:David S.Mroore2.1 用圖表展示定性數(shù)據(jù)

4、用圖表展示定性數(shù)據(jù) 2.1.1 生成頻數(shù)分布表生成頻數(shù)分布表 2.1.2 定性數(shù)據(jù)的圖示定性數(shù)據(jù)的圖示第 2 章 用圖表展示數(shù)據(jù)2.1.1 生成頻數(shù)分布表2.1 用圖表展示定性數(shù)據(jù)2 - 10統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)生成頻數(shù)分布表(定性數(shù)據(jù))1.列出各類別2. 計算各類別的頻數(shù)3. 生成頻數(shù)分布表分類分類頻數(shù)頻數(shù)比例比例百分比百分比比率比率ABCDE2 - 11統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)定性數(shù)據(jù)的描述統(tǒng)計量頻數(shù)(frequency) :落在各類別中的數(shù)據(jù)個數(shù)比例(proportion) :某一類別數(shù)據(jù)個數(shù)占全部數(shù)據(jù)個數(shù)的比值百分比(percenta

5、ge) :將對比的基數(shù)作為100而計算的比值比率(ratio) :不同類別數(shù)值個數(shù)的比值2 - 12統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)生成頻數(shù)分布表(定性數(shù)據(jù))【例2-1】為研究人們對不同類型軟飲料的偏好情況,一家調(diào)查公司在某超市隨機調(diào)查了50名顧客。右表是顧客性別及其所偏好的飲料類型記錄。生成頻數(shù)分布表,觀察不同性別的顧客及其所偏好的飲料類型的分布狀況,并進行描述性分析2 - 13統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)使用Excel數(shù)據(jù)透視表計數(shù)(pivot table)第第1步:步:選擇【數(shù)據(jù)數(shù)據(jù)】菜單中的【數(shù)據(jù)透視表和數(shù)據(jù)透視圖數(shù)據(jù)透視表和數(shù)據(jù)透視圖】第第2步:步

6、:確定數(shù)據(jù)源區(qū)域(在操作前將光標放在任意數(shù)據(jù)單元格 內(nèi),系統(tǒng)會自動選定數(shù)據(jù)源區(qū)域)第第3步:步:在【向?qū)?步驟之3】中選擇數(shù)據(jù)透視表的輸出位 置,然后選擇【布局】第第4步:步:在【向?qū)Р季帧繉υ捒蛑校来螌ⅰ帮嬃项愋汀蓖现磷?邊的“行”(或列)區(qū)域,將“顧客性別”拖至 “列”(或 行)區(qū)域,將“飲料類型”拖至“數(shù)據(jù)”區(qū)域。第第5步:步:單擊【確定】,自動返回【向?qū)?步驟之3】對話 框。單擊【完成】2 - 14統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)生成頻數(shù)分布表(列聯(lián)表Excel)不同類型飲料和不同性別顧客的頻數(shù)分布 2 - 15統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用SPS

7、S生成定性數(shù)據(jù)的頻數(shù)分布表(單變量頻數(shù)分布表)第1步:選擇【Analyze】【Descriptive Statistics-Frequencies】進入主對話框第2步:將“飲料類型”或“顧客性別”選入 【Variable(s)】;選中【Display Frequency tables】第3步 (若需要描述統(tǒng)計量或圖形)主點【Statistics】 或【Charts】,并選擇相應的選項。點擊 【OK】2 - 16統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)生成頻數(shù)分布表(定性數(shù)據(jù)SPSS)不同類型飲料的頻數(shù)分布 飲飲 料料 類類 型型612.012.012.01020.020.032.011

8、22.022.054.0816.016.070.01530.030.0100.050100.0100.0果汁礦泉水綠茶其他碳酸飲料TotalValidFrequencyPercentValid PercentCumulativePercent顧客性別顧客性別2244.044.044.02856.056.0100.050100.0100.0男女TotalValidFrequencyPercentValid Percent Cumulative Percent2 - 17統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用SPSS生成定性數(shù)據(jù)的列聯(lián)表 (Crosstabulation交叉表)第1步:

9、選擇【Analyze】【Descriptive Statistics- Crosstabs】進入主對話框第2步:將“飲料類型”選入【Row(s)】,將“顧客性別”選 入【Column(s)】(行列可以互換)第3步: (若需要對列聯(lián)表進行描述性分析)點擊 【Cells】,在【Percentages】下選中需要的統(tǒng)計 量,如【Row】、【Column】、【Total】等;(若 需要圖形)點擊【Display clustered bar chart】。 點擊【OK】2 - 18統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)列聯(lián)表的描述性分析(例題分析SPSS)飲飲 料料 類類 型型 * * 顧顧

10、客客 性性 別別 C Cr ro os ss st ta ab bu ul la at ti io on n15616.7%83.3%100.0%4.5%17.9%12.0%2.0%10.0%12.0%641060.0%40.0%100.0%27.3%14.3%20.0%12.0%8.0%20.0%741163.6%36.4%100.0%31.8%14.3%22.0%14.0%8.0%22.0%26825.0%75.0%100.0%9.1%21.4%16.0%4.0%12.0%16.0%691540.0%60.0%100.0%27.3%32.1%30.0%12.0%18.0%30.0%2228

11、5044.0%56.0%100.0%100.0%100.0%100.0%44.0%56.0%100.0%Count% within 飲料類型% within 顧客性別% of TotalCount% within 飲料類型% within 顧客性別% of TotalCount% within 飲料類型% within 顧客性別% of TotalCount% within 飲料類型% within 顧客性別% of TotalCount% within 飲料類型% within 顧客性別% of TotalCount% within 飲料類型% within 顧客性別% of Total果汁

12、礦泉水綠茶其他碳酸飲料飲料類型Total男女顧客性別Total列列百百分分比比 2 - 19統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)列聯(lián)表的描述性分析(例題分析SPSS)列聯(lián)表的統(tǒng)計描述 顧顧 客客 性性 別別 * * 飲飲 料料 類類 型型 C Cr ro os ss st ta ab bu ul la at ti io on n16726224.5%27.3%31.8%9.1%27.3%100.0%16.7%60.0%63.6%25.0%40.0%44.0%2.0%12.0%14.0%4.0%12.0%44.0%544692817.9%14.3%14.3%21.4%32.1%100

13、.0%83.3%40.0%36.4%75.0%60.0%56.0%10.0%8.0%8.0%12.0%18.0%56.0%610118155012.0%20.0%22.0%16.0%30.0%100.0%100%100.0%100%100%100.0%100.0%12.0%20.0%22.0%16.0%30.0%100.0%Count% within 顧客性別% within 飲料類型% of TotalCount% within 顧客性別% within 飲料類型% of TotalCount% within 顧客性別% within 飲料類型% of Total男女顧客性別Total果汁礦

14、泉水綠茶其他碳酸飲料飲料類型Total2 - 20統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)數(shù)據(jù)透視表(pivot table)可以從復雜的數(shù)據(jù)中提取有用的信息可以對數(shù)據(jù)表的重要信息按使用者的習慣或分析要求進行匯總和作圖形成一個符合需要的交叉表(列聯(lián)表)在利用數(shù)據(jù)透視表時,數(shù)據(jù)源表中的首行必須有列標題2 - 21統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)生成頻數(shù)分布表(列聯(lián)表Excel)不同類型飲料和顧客性別的頻數(shù)分布不同類型飲料和顧客性別的頻數(shù)分布 2.1.2 定性數(shù)據(jù)的圖示2 - 23統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)條形圖(bar Chart)用寬度相同的條形的

15、高度或長短來表示各類別數(shù)據(jù)各類別可放在縱軸,稱為條形圖,可以放在橫軸,稱為柱形圖(column chart) 2 - 24統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)復式條形圖(bar Chart)飲料類型和顧客性別的條形圖 (SPSS的輸出) 2 - 25統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)帕累托圖(pareto chart)1.按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的柱形圖 2.用于展示分類數(shù)據(jù)的分布2 - 26統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用SPSS繪制餅圖 (Pie)第第1步:步:選擇【Graphs】【Interactive-Pie-Clustered】

16、,進入主對話框第第2步:步:如果繪制簡單餅圖,將某個分類變量(如“飲料類型”)選入【Slice】(部分,片);點擊【Pies】,選擇在餅圖中要展示的內(nèi)容,如【Category】、【Count】、【Percen】等。點擊【確定確定】如果要繪制復式餅圖,將某個分類變量(如“飲料類型”)選入【Slice】;將另一個分類變量(如“顧客性別”)選入【Cluster】;點擊【Pies】,選擇在餅圖中要展示的內(nèi)容,如【Category】、【Count】、【Percen】等。點擊【確確定定】2 - 27統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)簡單餅圖(pie Chart)用圓形及圓內(nèi)扇形的角度來表示數(shù)

17、值大小的圖形,主要用于表示一個樣本(或總體)中各組成部分的數(shù)據(jù)占全部數(shù)據(jù)的比例用于研究結構問題2 - 28統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)復式餅圖(pie Chart)主要用于展示兩個或多個分類變量的構成比較,比如,在男女分類的基礎上又增加了飲料類型的分類。 2 - 29統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)環(huán)形圖(doughnut chart)環(huán)形圖中間有一個“空洞”,樣本或總體中的每一部分數(shù)據(jù)用環(huán)中的一段表示與餅圖類似,但又有區(qū)別餅圖只能顯示一個總體各部分所占的比例餅圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個樣本或總體的環(huán)形圖則可以同時繪制多個樣本

18、或總體的數(shù)據(jù)系列,每一個樣本或總體的數(shù)據(jù)系列數(shù)據(jù)系列,每一個樣本或總體的數(shù)據(jù)系列為一個環(huán)為一個環(huán)用于結構比較研究 2 - 30統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)環(huán)形圖(doughnut chart)【例2-2】2006年北京、上海和天津地區(qū)按收入法計算的地區(qū)生產(chǎn)總值(按當年價格計算)數(shù)據(jù)。繪制環(huán)形圖比較三個地區(qū)的生產(chǎn)總值構成 2 - 31統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)環(huán)形圖(doughnut chart )2 - 32統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)復式條形圖2 - 33統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)環(huán)形圖(doughnut c

19、hart)排名排名國家國家金金銀銀銅銅總總51212810036383611023212872在第29屆北京奧運會上,獲得金牌和獎牌前三名的國家及獎牌數(shù)如下。繪制環(huán)形圖比較三個國家的獎牌構成 2 - 34統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)環(huán)形圖(doughnut chart )中國、美國、俄羅斯奧運會獎牌構成中國、美國、俄羅斯奧運會獎牌構成2 - 35統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)復式條圖中國、美國、俄羅斯奧運會獎牌比較中國、美國、俄羅斯奧運會獎牌比較2 - 36統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)復式條圖中國、美國、俄羅斯奧運會獎牌比較中國、美國、

20、俄羅斯奧運會獎牌比較2.2.1 生成頻數(shù)分布表2 - 39統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)生成頻數(shù)分布表(例題分析)【例例2-3】某電腦公司120天的銷售額數(shù)據(jù)(單位:萬元) 。生成一張頻數(shù)分布表觀察銷售額分布的特征2 - 40統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)生成頻數(shù)分布表(例題分析)確定組數(shù):組數(shù)的確定應以能夠顯示數(shù)據(jù)的分布特征為目的。在實際分組時,組數(shù)一般為5K 15。本例中由于數(shù)據(jù)較多,可考慮分為10組 確定組距:組距(Class Width)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即 組距( 最大值 - 最小值) 組數(shù)

21、 例如,本例最大值為237,最小值為141,組距=(237-141)109.6。為便于計算,組距宜取5或10的倍數(shù),且第一組的下限應低于最小變量值,最后一組的上限應高于最大變量值,因此組距可取10 統(tǒng)計出各組的頻數(shù)。每個組的數(shù)據(jù)滿足axb(上限值不在內(nèi))(Excel的計數(shù)規(guī)則是axb) 2 - 41統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)分組中的幾個概念 1. 下限(lower limit) :一個組的最小值 2. 上限(upper limit) :一個組的最大值 3. 組距(class width) :上限與下限之差 4. 組中值(class midpoint) :下限與上限之間的中

22、點值下限值+上限值2組中值 =2 - 42統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)生成頻數(shù)分布表(例題分析)某電腦公司銷售額的頻數(shù)分布 2 - 43統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)使用Excel頻數(shù)函數(shù) (FREQUENCY)Excel的【直方圖】工具的缺陷是:頻數(shù)分布及直方圖沒有與數(shù)據(jù)鏈接,當改變?nèi)魏我粋€數(shù)據(jù)時,頻數(shù)分布表和直方圖不會跟著改變使用統(tǒng)計函數(shù)【FREQUENCY】創(chuàng)建頻數(shù)分布表和直方圖可解決這一問題。具體步驟是選擇與接受區(qū)域相臨近的單元格區(qū)域,作為頻數(shù)分布表輸出的區(qū)域選擇統(tǒng)計函數(shù)中的【FREQUENCY】函數(shù)在對話框【Date-array】后輸入數(shù)據(jù)區(qū)域,

23、在【Bins-array】后輸入接受區(qū)域同時按下“ctrl-shift-Enter”組合鍵,即得到頻數(shù)分布統(tǒng)計函數(shù)FREQUENCY2.2.2 定量數(shù)據(jù)的圖示2 - 45統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)分組數(shù)據(jù)看分布直方圖(histogram)用于展示分組數(shù)據(jù)分布的一種圖形用矩形的寬度和高度來表示頻數(shù)分布本質(zhì)上是用矩形的面積來表示頻數(shù)分布在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖直方圖下的總面積等于12 - 46統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用SPSS繪制直方圖 第第1步:步:選擇【Graphs】菜單,并選

24、擇 【histogram】選項進入主對話框第第2步:步:在主對話框中將變量選入【Variables】 ,點擊【OK】 繪制直方圖2 - 47統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)分組數(shù)據(jù)看分布直方圖(SPSS繪制的直方圖)2 - 48統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)分組數(shù)據(jù)看分布直方圖(直方圖與條形圖的區(qū)別)條形圖中的每一矩形表示一個類別,其寬度沒有意義,而直方圖的寬度則表示各組的組距由于分組數(shù)據(jù)具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開排列條形圖主要用于展示定性數(shù)據(jù),而直方圖則主要用于展示定量數(shù)據(jù)2 - 49統(tǒng)計學統(tǒng)計學STATISTICS(第四版第

25、四版)未分組數(shù)據(jù)看分布莖葉圖(stem-and-leaf plot)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留最后一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)2 - 50統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用SPSS繪制莖葉圖和箱線圖 (包括直方圖)第第1步:步:選擇【Analyze】菜單,并選擇 【Descriptive

26、statistics-Explore】 選項進入主對話框第第2步:步:在主對話框中將變量選入【Variables】, 點擊【Plots】,在對話框中選擇【Stem- and-leaf】(根據(jù)需要可選【Histogram】以 給出直方圖)。點擊【Continue】回到主對 話框。點擊【OK】 2 - 51統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)看分布莖葉圖(例題分析)2 - 52統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)看分布莖葉圖 (例題分析)第一列給出每個莖上葉子的頻數(shù)第二列是“莖”,第三列是“葉”下面標出了1個極端值237、莖的寬度10、每個葉代表一個數(shù)據(jù)

27、(案例)SPSS自動將每個莖重復了一次,使分布的細節(jié)看的更清楚一些。當然,在數(shù)據(jù)較少時莖的數(shù)值也可以不重復 2 - 53統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)看分布點圖(例題分析)2 - 54統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)看分布箱線圖(box plot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖是由一組數(shù)據(jù)的最大值(maximum)、最小值(minimum)、中位數(shù)(median)、兩個四分位數(shù)(quartiles)這5個值繪制而成的中位數(shù)是一組數(shù)據(jù)排序后處于中間位置上的變量值四分位數(shù)是一組數(shù)據(jù)排序后處在數(shù)據(jù)25%位置和75%位置上的兩個分位數(shù)值 繪制

28、方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分位數(shù)畫出箱子,再將兩個極值點與箱子相連接2 - 55統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)看分布箱線圖(箱線圖的構成)中位數(shù)中位數(shù)4681012Q75%Q25%XMaxXMin2 - 56統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)看分布箱線圖(例題分析)最小值最小值141最大值最大值237中位數(shù)中位數(shù)18225%四分位數(shù)四分位數(shù)170.2575%四分位數(shù)四分位數(shù)197140 150 160 170 180 190 200 210 220

29、230 2402 - 57統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)分布的形狀與箱線圖對稱分布對稱分布Bell-shapedLeft-skewed distribution左偏分布左偏分布右偏分布右偏分布Right-skewed distribution2 - 58統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)看分布多批數(shù)據(jù)箱線圖(例題分析)【例例2-4】 從某大學經(jīng)濟管理專業(yè)二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,所得結果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征課程名稱課程名稱學生編號學生編號1234567891011英語英

30、語經(jīng)濟數(shù)學經(jīng)濟數(shù)學西方經(jīng)濟學西方經(jīng)濟學市場營銷學市場營銷學財務管理財務管理基礎會計學基礎會計學統(tǒng)計學統(tǒng)計學計算機應用基礎計算機應用基礎766593746870558590958187757391789751768570926881717488698465739570786690737884709363798060878167869183777690708283829284817069727875789188669480857186746879628181557870756871772 - 59統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用SPSS繪制多批數(shù)據(jù)箱線圖 第第1步:步:選擇【Gr

31、aphs】下拉菜單,并選擇【Boxplot】第第2步:步:在出現(xiàn)的對話框中選擇【Simple】,在 【Data in Chat Are】中選擇【Summaries of separate variables】,點擊【Define】 返回主對話框第第3步:步:在主對話框?qū)⑺凶兞?這里是11個學生)選入 【Boxes Represent】,將“課程名稱”選入 【Label Cases by】。點擊【OK】 2 - 60統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖(例題分析Median/Quart./Range)2 - 61統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版

32、)未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (SPSS繪制的箱線圖)2 - 62統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)離群點和極值的定義中位數(shù)中位數(shù)Q75%Q25%離群點:離群點:某個數(shù)據(jù)與四分位某個數(shù)據(jù)與四分位數(shù)(數(shù)(Q25%或或Q75%)的的距離(即差值)超距離(即差值)超過過1.5倍的四分位差倍的四分位差超過超過1.5倍的四分位差倍的四分位差極值:極值:某個數(shù)據(jù)與四分位某個數(shù)據(jù)與四分位數(shù)(數(shù)(Q25%或或Q75%)的的距離(即差值)超距離(即差值)超過過3倍的四分位差倍的四分位差離群點離群點 X i2 - 63統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (上證指數(shù)

33、K線圖)2 - 64統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)垂線圖(drop-line)垂線圖可用于展示多個變量或多個樣本取值的分布狀況將屬于同一樣本或類別的多個取值的散點用一條垂線連接起來,用垂線的長度及垂線上的各個點來反映某個樣本或類別取值的差異及其變動狀況 用用SPSS制作垂線圖制作垂線圖2 - 65統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)垂線圖 (例題分析)11名學生8門課程考試成績的垂線圖2 - 66統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)誤差圖(error bar )誤差圖是以均值為中心,加減一定倍數(shù)的標準差(也可以是加減一定倍

34、數(shù)的標準誤差)繪制而成的(該圖也可以繪制均值的一定置信水平的置信區(qū)間)用于展示多個樣本或分類的不同取值的分布狀況和離散狀況 用用SPSS制作垂線圖制作垂線圖2 - 67統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)未分組數(shù)據(jù)誤差圖 (例題分析)11名學生名學生8門課程考試成績的誤差圖門課程考試成績的誤差圖(均值加減均值加減2倍的標準差倍的標準差)2 - 68統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)兩個變量間的關系二維散點圖(2D Scatter plots)展示兩個變量之間的關系用橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi , yi)在坐標系中用一個點表示,n組數(shù)據(jù)在坐標系中形成

35、的n個點稱為散點,由坐標及其散點形成的圖有2維、3維、矩陣等形式2 - 69統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)兩個變量間的關系二維散點圖(2D Scatter plots) 【例例2-5】 表212是我國 3 1 個 地 區(qū)2006年的固定資產(chǎn)投資額、地區(qū)生產(chǎn)總值(GDP)和最終消費支出數(shù)據(jù)。繪散點圖并觀察它們之間的關系 2 - 70統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)用SPSS繪制重疊散點圖 (Overlay Scatter)第第1步:步:選擇【Graphs】菜單,并選擇【Scatter/Dot】第第2步:步:如果繪制兩個變量的簡單散點圖,點擊【Simple Sca

36、tter】,點擊【Define】,將兩個變量分別選入【Y Pairs】和【X Pairs】,點擊【OK】如果要繪制重疊散點圖,點擊【Overlay Scatter】,點擊【Define】,將所要配對的數(shù)據(jù)依次選入【Y-X Pairs】(本例為“固定資產(chǎn)投資額-地區(qū)生產(chǎn)總值”和“固定資產(chǎn)投資額-最終消費支出”),點擊【OK】如果要繪制矩陣散點圖,點擊【Matrix Scatter】,將幾個變量(本例為“固定資產(chǎn)投資額”、“地區(qū)生產(chǎn)總值”和“固定資產(chǎn)投資額”)同時選入【Matrix Variables】,將區(qū)分坐標軸的樣本(本例為“地區(qū)”)選入【Label Cases by】,點擊【KO】2 -

37、71統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)兩個變量間的關系二維散點圖(2D Scatter plots)2 - 72統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)兩個變量間的關系重疊散點圖(用SPSS繪制重疊散點圖)如果想比較幾個變量之間的關系,也可以把它們的散點圖繪制在同一張圖里,繪制成重疊散點圖(Overlay Scatter)(注意:繪制重疊散點圖時,變量值之間的數(shù)值差異不能過大,否則不便于比較)比如,如果想比較固定資產(chǎn)投資額與地區(qū)生產(chǎn)總值和最終消費支出的關系,可以把固定資產(chǎn)投資作為共同的一個坐標軸,地區(qū)生產(chǎn)總值和最終消費支出作為另一個坐標軸也可以繪制散點圖矩陣(Matrix Scatter)2 - 73統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)兩個變量間的關系重疊散點圖(Overlay Scatter)2 - 74統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)兩個變量間的關系矩陣散點圖(Matrix Scatter)2 - 75統(tǒng)計學統(tǒng)計學STATISTICS(第四版第四版)比較多個樣本的相似性 雷達圖(radar chart)也稱為蜘蛛圖(spider chart)從一個點出發(fā),用每一條射線代表一個變量,多個變量的數(shù)據(jù)點連接成線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論