統計學第3章數據的圖表展示_第1頁
統計學第3章數據的圖表展示_第2頁
統計學第3章數據的圖表展示_第3頁
統計學第3章數據的圖表展示_第4頁
統計學第3章數據的圖表展示_第5頁
已閱讀5頁,還剩25頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Nankai University1第三章第三章 數據的圖表展示數據的圖表展示示例:統計研究表明,多種原因會使壽命減少示例:統計研究表明,多種原因會使壽命減少v 文字描述文字描述 未結婚的男性會使壽命減少未結婚的男性會使壽命減少3500天,未結婚的女性天,未結婚的女性則減少則減少1600天;吸煙的男性會使壽命減少天;吸煙的男性會使壽命減少2250天,女天,女性則減少性則減少800天;飲酒會使壽命減少天;飲酒會使壽命減少130天;超重天;超重30%會使壽命減少會使壽命減少1300天,超重天,超重20%則減少則減少900天;濫用天;濫用藥物會使壽命減少藥物會使壽命減少90天天Nankai Univ

2、ersity2v 表格描述表格描述Nankai University3原因原因壽命減少的天數壽命減少的天數未結婚(男性)3500吸煙(男性)2250未結婚(女性)160030%超重130020%超重900吸煙(女性)800飲酒130濫用藥物90v 圖形描述圖形描述Nankai University405001000150020002500300035004000未結婚(男性) 吸煙(男性) 未結婚(女性) 30%超重 20%超重 吸煙(女性) 飲酒 濫用藥物 壽命減少的天數壽命減少的天數 壽命減少的天數 Contents數據的預處理數據的預處理1品質數據的整理與描述品質數據的整理與描述2數值型

3、數據的整理與描述數值型數據的整理與描述3Nankai University51.1.數據的預處理數據的預處理Nankai University6v 數據審核數據審核v 數據篩選數據篩選v 數據排序數據排序v 數據透視表數據透視表數據審核數據審核v 間接來源數據的審核間接來源數據的審核 審核數據的適用性 審核數據的時效性v 直接來源數據的審核直接來源數據的審核 審核數據的完整性 審核數據的準確性Nankai University7數據篩選數據篩選v 數據篩選時根據需要找出符合特定條件的某類數據。v 用Excel進行數據篩選。 選擇【數據】菜單,【篩選】命令v 數據篩選示例:例3.1v 例3.1

4、表中是8名學生4門課程的考試成績數據(單位:分)。試分別找出統計學成績大于80分的學生;英語成績最高的前三名學生;四門課程成績都大于70分的學生。Nankai University8數據排序數據排序v 數據排序可幫助研究者通過瀏覽數據發現一些明顯的特征或趨勢,找到解決問題的線索。v 排序還有助于對數據檢查糾錯,以及為重新歸類或分組等提供方便。v 排序后的數據也稱為順序統計量。v 無論是屬性型數據還是數值型數據,排序均可借助于Excel很容易的完成。Nankai University9數據透視表數據透視表v 為了從復雜的數據中提取有用的信息,可以利用Excel提供的【數據透視表】工具。v 利用數

5、據透視表,可以對數據表的重要信息按使用者的習慣或分析要求進行匯總和作圖,形成一個符合需要的交叉表(列聯表)。v 列聯表列聯表(contingency table):由兩個或兩個以上變量交叉分類的頻數分布表稱為列聯表。二維的列聯表(兩個變量交叉分類)也稱為交叉表交叉表(cross table)。v 利用數據透視表時,原始數據表中的首行必須有列標題。v 示例3.2Nankai University10v 例3.2 在某大學隨機抽取30名學生,調查他們的性別、家庭所在地、平均每月生活費支出、平均每月購買衣物支出和購買衣物時所考慮的首要因素等,試建立一個數據透視表,在表的行變量中給出性別和買衣物首選因

6、素,在列變量中給出學生的家庭所在地,對平均月生活費和月平均衣物支出進行交叉匯總。Nankai University11Nankai University122.2.品質品質數據的整理與描述數據的整理與描述v 分類數據的整理與描述分類數據的整理與描述v 順序數據的整理與描述順序數據的整理與描述分類數據的整理與描述分類數據的整理與描述v 分類數據本身就是對事物的一種分類,因此,在整理時首先列出所分的類別,然后計算出每一類別的頻數、頻率或比例、比率等,即可形成一張頻數分布表,最后根據需要選擇適當的圖形進行展示,以便對數據及其特征有一個初步的了解。Nankai University13分類數據的整理與

7、描述分類數據的整理與描述v 分類數據的整理頻數與頻數分布 頻數頻數(frequency):是落在某一特定類別或組中的數據個數。 頻數分布頻數分布(frequency distribution):把各個類別及落在其中的相應頻數全部列出,并用表格形式表現出來。 例3.3 為研究不同類型軟飲料的市場銷售情況,一家市場調查公司對隨機抽取的一家超市進行調查。表中給出調查員隨機觀察的50名顧客購買的飲料類型及購買者性別的記錄。生成頻數分布表,觀察飲料類型和顧客性別的分布狀況,并進行描述性分析。Nankai University14分類數據的整理與描述分類數據的整理與描述v 分類數據的圖示描述 1)條形圖條

8、形圖:是用寬度相同的條形的高度或長短來表示數據多少的圖形,可以橫置或縱置,縱置時也稱柱形圖。 2)帕累托圖帕累托圖(Pareto chart)是按各類別數據出現的頻數多少排序后繪制的條形圖。 3)餅圖餅圖:是用圓形及圓內扇形的角度來表示數值大小的圖形,主要用于表示一個樣本(或總體)中各組成部分的數據占全部數據的比例,用于研究結構性問題十分有用。局限性在于只能顯示一個樣本各部分所占的比例。 4)環形圖環形圖:把餅圖疊在一起,挖去中間的部分就是環形圖。每個樣本用一個環來表示,樣本中的每一部分數據用環中的一段表示。環形圖可顯示多個樣本各部分所占的相應比例,從而有利于構成的比較研究。Nankai Un

9、iversity15順序數據的整理與描述順序數據的整理與描述v 上面介紹的分類數據的頻數分布表和圖示方法,也都適用于對順序數據的整理與描述。但一些適用于順序數據的整理和顯示方法,并不適用于分類數據。v 對于順序數據,還可以計算累積頻數和累積頻率。v 累積頻數累積頻數:是將各有序類別或組的頻數逐級累加起來得到的頻數。通過累積頻數,可以很容易的看出某一類別(或數值)以下或某一類別(或數值)以上的頻數之和。v 累積頻率累積頻率/累積百分比累積百分比:是將各有序類別或組的百分比逐級累加起來。Nankai University16v 例3.4 在一項有關城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣

10、調查了300戶,其中一個問題是:“您對您家庭目前的住房狀況是否滿意?”要求回答的類別依次如下: 1.非常不滿意 2.不滿意 3.一般 4.滿意 5.非常滿意 v 根據累積頻數或累積概率,可以繪制累積頻數分布圖或累積頻率圖。Nankai University17Nankai University183.3.數值型數據的整理與描述數值型數據的整理與描述v 箱線圖箱線圖v 直方圖直方圖v 線圖線圖v 散點圖散點圖v 氣泡圖氣泡圖v 雷達圖雷達圖箱線圖箱線圖v 箱線圖箱線圖(box plot)是由一組數據的最大值、最小值、中位數、兩個四分位數這五個特征值繪制而成的,它主要用于反映原始數據分布的特征,還

11、可以進行多組數據分布特征的比較。v 箱線圖的繪制方法:先找出一組數據的最大值、最小值、中位數和兩個四分位數;然后,連接兩個四分位數畫出箱子;再將最大值和最小值與箱子相連接,中位數在箱子中間。v 對于多組數據,可以將各組數據的箱線圖并列起來,從而進行分布特征的比較。Nankai University19v 例3.5 從某大學經濟管理專業二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調查,試繪制各個學生成績的比較箱線圖,并分析各個同學考試成績的分布特征。Nankai University20直方圖直方圖v 直方圖直方圖(histogram)是用于展示分組數據分布的一種圖形,它是用矩形的寬

12、度和高度(即面積)來表示頻數分布的。v 數據分組是根據統計研究的需要,將原始數據按照某種標準化分成不同的組別,分組后的數據稱為分組數據分組數據(grouped data)。v 繪制該圖時,在平面直角坐標系中,用橫軸表示數據分組,縱軸表示頻數或頻率,這樣,各組與相應的頻數就形成了一個矩形,即直方圖。Nankai University21v 直方圖與條形圖的區別: 條形圖是用條形的高度(豎置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的;直方圖用矩形的高度表示每一組的頻數或頻率,寬度則表示各組的組距。 由于分組數據具有連續性,直方圖的各矩形通常是連續排列,而條形圖則是分開排列。 條形圖主要

13、用于展示屬性型數據,而直方圖則主要用于展示數值型數據。Nankai University22v 例3.6 試根據某電腦公司2005年前4個月每天的銷售量數據(單位:臺),繪制直方圖并分析。Nankai University23線圖線圖v 如果數值型數據是在不同時間上取得的,即時間序列數據,則可以繪制線圖。線圖線圖(line plot)主要用于反映現象隨時間變化的特征。v 繪制線圖時,時間一般繪制在橫軸,觀測值繪制在縱軸,一般應繪制成橫軸略大于縱軸的長方形。圖形過扁或過于瘦高,不僅不美觀,而且會給人造成視覺上的錯覺,不便于對數據變化的理解。一般情況下,縱軸數據下端應從“0”開始,以便于比較。如果

14、數據與“0”之間的間距過大,可以采取折斷的符號將縱軸折斷。Nankai University24v 例3.7 已知1991-2003年我國城鄉居民家庭的人均收入數據,試繪制線圖。Nankai University250.01000.02000.03000.04000.05000.06000.07000.08000.09000.01991199219931994199519961997199819992000200120022003城鎮居民農村居民散點圖散點圖v 上面介紹的一些圖形描述的都是單變量數據。當有兩個或兩個以上變量時,可以采用多變量的圖示方法,常見的有散點圖、氣泡圖、雷達圖等。v 散點

15、圖散點圖(scatter diagram)是用二維坐標展示兩個變量之間關系的一種圖形。v 散點圖是用坐標橫軸代表變量x,縱軸代表變量y,每組數據(xi,yi)在坐標系中用一個點表示,n組數據在坐標系中形成的n個點稱為散點,由坐標及其散點形成的二維數據圖稱為散點圖。Nankai University26v 例3.8 小麥的單位面積產量與降雨量和溫度有一定關系。為了了解它們之間的關系,收集到相關數據。試繪制小麥產量與降雨量的散點圖,并分析它們之間的關系。Nankai University27010002000300040005000600070008000900002040608010012014

16、0氣泡圖氣泡圖v 氣泡圖氣泡圖(bubble chart)可用于展示三個變量之間的關系。v 它與散點圖類似,繪制時將一個變量放在橫軸,另一個變量放在縱軸,而第三個變量則用氣泡的大小來表示。Nankai University280204060801001201400510152025雷達圖雷達圖v 雷達圖雷達圖(radar chart)是顯示多個變量的常用圖示方法,也稱為蜘蛛圖(spider chart)。v 設有n組樣本,每個樣本測得m個變量,要繪制這m個變量的雷達圖,其具體做法是:先畫一個圓,然后將圓m等分,得到m個點,令這m個點分別對應m個變量,再將這m個點與圓心相連,得到m個輻射狀的半徑,這m個半徑分別作為m個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示,再將同一樣本的值在m個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一張雷達圖。v 雷達

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論