定量分析方法第5章-2014年_第1頁
定量分析方法第5章-2014年_第2頁
定量分析方法第5章-2014年_第3頁
定量分析方法第5章-2014年_第4頁
定量分析方法第5章-2014年_第5頁
已閱讀5頁,還剩54頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章統計數據的整理與顯示第一節數據的預處理第二節品質數據的整理與顯示第三節數值型數據的整理與顯示第一節數據的預處理數據的審核數據的篩選數據的排序數據的審核

(原始數據)審核數據準確性的方法邏輯檢查從定性角度,審核數據是否符合邏輯,內容是否合理,各項目或數字之間有無相互矛盾的現象主要用于對定類數據和定序數據的審核計算檢查檢查調查表中的各項數據在計算結果和計算方法上有無錯誤主要用于對定距和定比數據的審核數據的審核

(第二手數據)適用性審核弄清楚數據的來源、數據的口徑以及有關的背景材料確定這些數據是否符合自己分析研究的需要時效性審核應盡可能使用最新的統計數據確認是否必要做進一步的加工整理數據的篩選對審核過程中發現的錯誤應盡可能予以糾正當發現數據中的錯誤不能予以糾正,或者有些數據不符合調查的要求而又無法彌補時,需要對數據進行篩選數據篩選的內容包括:將某些不符合要求的數據或有明顯錯誤的數據予以剔除將符合某種特定條件的數據篩選出來,而不符合特定條件的數據予以剔出數據的排序

(要點)按一定順序將數據排列,以發現一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數據檢查糾錯,以及為重新歸類或分組等提供依據在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成(SPSS--rankcases,sortcases)數據的排序的方法

定類數據的排序字母型數據,排序有升序降序之分,但習慣上用升序漢字型數據,可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分定距和定比數據的排序遞增排序:設一組數據為X1,X2,…,XN,遞增排序后可表示為:X(1)<X(2)<…<X(N)遞減排序可表示為:X(1)>X(2)>…>X(N)第二節品質數據的整理與顯示定類數據的整理與顯示定序數據的整理與顯示定類數據的整理與顯示

(基本問題)要弄清所面對的數據類型,因為不同類型的數據,所采取的處理方式和方法是不同的對定類數據和定序數據主要是做分類整理對定距數據和定比數據則主要是做分組整理適合于低層次數據的整理和顯示方法也適合于高層次的數據;但適合于高層次數據的整理和顯示方法并不適合于低層次的數據定類數據的整理與顯示定類數據的整理

(基本過程)列出各類別計算各類別的頻數制作頻數分布表用圖形顯示數據

定類數據的整理

(可計算的指標)1.頻數:落在各類別中的數據個數2.比例:某一類別數據占全部數據的比值3.百分比:將對比的基數作為100而計算的比值4.比率:不同類別數值的比值定類數據整理—頻數分布表

(實例)【例5.1】為研究咖啡市場的狀況,一家廣告公司在某城市隨機抽取4662人就廣告問題做了問卷調查,其中的一個問題是“您比較喜歡哪個牌子得咖啡?”

1.AA;2.BB;3.CC;4.DD;5.EE;6.FF。Samples-coffee.sav可以通過原始數據得頻數分布表得到表5-1喜歡的咖啡品牌的頻數表定類數據的圖示—條形圖

(條形圖的制作)條形圖是用寬度相同的條形的高度或長短來表示數據變動的圖形條形圖有單式、復式等形式在表示定類數據的分布時,是用條形圖的高度來表示各類別數據的頻數或頻率繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖定類數據的圖示—條形圖

(由SPSS繪制的條形圖)定類數據的圖示—圓形圖

(圓形圖的制作)也稱餅圖,是用圓形及園內扇形的面積來表示數值大小的圖形主要用于表示總體中各組成部分所占的比例,對于研究結構性問題十分有用在繪制圓形圖時,總體中各部分所占的百分比用園內的各個扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應比例確定的。定類數據的圖示—圓形圖

(由SPSS繪制的圓形圖)定類數據的圖示—環形圖

(環形圖的制作)環形圖中間有一個“空洞”,總體中的每一部分數據用環中的一段表示環形圖與圓形圖類似,但又有區別圓形圖只能顯示一個總體各部分所占的比例環形圖則可以同時繪制多個總體的數據系列,每一個總體的數據系列為一個環環形圖可用于進行比較研究環形圖可用于展示定類和定序的數據品質數據的圖示—環形圖

(由Excel繪制的環形圖)8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

圖5-3甲乙兩城市家庭對住房狀況的評價定序數據的整理與顯示定序數據的整理

(可計算的指標)1.累計頻數:將各類別的頻數逐級累加2.累計頻率:將各類別的頻率(百分比)逐級累加定序數據頻數分布表

(實例)【例5.2】在一項關于組織知識管理問題的研究中,研究人員調查了168位在政府部門和企業工作的員工,其中的一個問題是:“您通過書籍、期刊報紙等傳統媒介獲取信息和知識的頻率如何

?1.經常;2.偶爾;3.很少;4.從來沒有表5-2通過傳統媒介獲取信息的頻數分布表第三節數值型數據的整理與顯示數據的分組數值型數據的圖示頻數分布的類型頻數分布表的編制編制頻數分布表的步驟確定組數編制頻數分布表的步驟確定組距計算頻數編制表格分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組

(要點)將一個變量值作為一組適合于離散變量適合于變量值較少的情況頻數分布表的編制

(實例)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例5.3】某政府機構每月接待外賓人數如下(單位:個)。試采用單變量值對數據進行分組。

單變量值分組表

(實例)表5-4某政府機構每月接待人數人數(個)頻數(人)人數(個)頻數(人)人數(個)頻數(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112組距分組

(要點)將變量值的一個區間作為一組適合于連續變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~組距分組

(步驟)確定組數:組數的確定應以能夠顯示數據的分布特征和規律為目的。在實際分組時,可以按Sturges提出的經驗公式來確定組數K確定各組的組距:組距(ClassWidth)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定,即

組距=(最大值-最小值)÷組數根據分組整理成頻數分布表

組距分組

(幾個概念)下限:一個組的最小值上限:一個組的最大值組距:上限與下限之差組中值:下限與上限之間的中點值下限值+上限值2組中值=等距分組表

(上下組限重疊)表5-5某機構接待人數分組表按人數分組頻數(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計50100等距分組表

(上下組限間斷)表5-6某機構接待人數分組表按人數分組頻數(人)頻率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合計50100等距分組表

(使用開口組)表5-7某機構接待人數分組表按人數分組頻數(人)頻率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合計50100組距分組與不等距分組

(在表現頻數分布上的差異)等距分組各組頻數的分布不受組距大小的影響可直接根據絕對頻數來觀察頻數分布的特征和規律不等距分組各組頻數的分布受組距大小不同的影響各組絕對頻數的多少不能反映頻數分布的實際狀況需要用頻數密度(頻數密度=頻數/組距)反映頻數分布的實際狀況分組技巧組距一般選擇5,10的倍數組距的確定要根據實際情況,力求使分布平滑可以先用窄間距分類,然后適當放寬間距間距太小,頻數分布會顯得凌亂或不規則,間距太大,會損失大量信息。雖然有確定分組數的公式,但最佳決定要依據常識和頻數表的使用目的。分組技巧還可以使用不等距分組,即使用不同寬度的間距,讓某些特殊的間距比別的間距寬或者使用開放間距(會帶來很多麻煩)39.2%11.6%36.3%26.3%37.1%15.3%27.3%23.5%13.3%28.126.327.135.123.026.131.036.327.322.833.425.621.646.87.116.826.946.644.358.133.113.427.833.422.142.733.036.320.79.326.329.939.45.324.317.818.237.121.617.512.323.637.237.125.127.128.827.833.626.528.326.924.841.033.619.343.728.219.983.647.14.89.739.532.322.415.126.326.129.214.314.621.637.937.124.910.020.711.822.936.046.121.513.3例5.4下列數據是某城市教育委員會的選舉中,93個普查區合格選民實際參加選舉的比例:表5-8數據按5%的間距分類時的頻數分布間距頻數f間距頻數f0.0-4.9145.0-49.945.0-9.9450.0-54.9010.0-14.9955.0-59.9115.0-19.9860.0-64.9020.0-24.91665.0-69.9025.0-29.92370.0-74.9030.0-34.9875.0-79.9035.0-39.91480.0-84.9140.0-44.9493分布不太規則表5-9數據按10%的間距分類時的頻數分布間距頻數f0.0-9.9510.0-19.91720.0-29.93930.0-39.92240.0-49.9850.0-59.9160.0-69.9070.0-79.9080.0-89.9193分布較平滑表5-10數據按20%的間距分類時的頻數分布間距頻數f0.0-19.92220.0-39.96140.0-59.9960.0-79.9080.0-99.9193有些含糊不清組距分組

(步驟)確定組數:組數的確定應以能夠顯示數據的分布特征和規律為目的。在實際分組時,可以按Sturges提出的經驗公式來確定組數K確定各組的組距:組距(ClassWidth)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定,即

組距=(最大值-最小值)÷組數根據分組整理成頻數分布表

數值型數據的圖示分組數據—直方圖

(直方圖的制作)用矩形的寬度和高度來表示頻數分布的圖形,實際上是用矩形的面積來表示各組的頻數分布在直角坐標中,用橫軸表示數據分組,縱軸表示頻數或頻率,各組與相應的頻數就形成了一個矩形,即直方圖(Histogram)分組數據—直方圖

(直方圖的繪制)頻數(人)1512963105110115120125130135140月接待人數(個)圖5-5某機構接待人數直方圖我一眼就看出來了,大多數的日子接待人數在120-125之間!分組數據—直方圖

(直方圖與條形圖的區別)條形圖是用條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續排列,條形圖則是分開排列分組數據—折線圖

(折線圖的制作)折線圖也稱頻數多邊形圖(Frequencypolygon)是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數分布是一致的1512963105110115120125130135140接待人數(個)頻數(人)分組數據—折線圖

(折線圖的繪制)圖5-6機構接待人數折線圖時間序列數據—線圖

(實例)【例5.5】已知1991~1998年我國城鄉居民家庭的人均收入數據如表5-11。試繪制線圖¥

表5-111991~1998年城鄉居民家庭人均收入年份城鎮居民農村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6784.0921.61221.01577.71926.12091.12162.0時間序列數據

(由SPSS繪制的線圖先定義日期definedates然后timeseries—sequencecharts)SPSS做圖表示定量變量常用的圖形:

直方圖、盒型圖、莖葉圖、散點圖直方圖

對于一個定量變量,比如某個地區(地區1)學校高三男生的身高;有163個度量。Spss選項:Graphs-Histogram。橫坐標是身高區間,而縱坐標為各種身高區間的身高的頻數。圖5-8交互式直方圖interactive盒型圖比直方圖簡單一些的是盒形圖(boxplot,又稱箱圖).盒子的中間橫線是數據的中位數(median).即數據中占據中間位子的數,即數據中有一半大于中位數(在其之上),另一半小于中位數(在其之下)。

Spss選項:Graphs-Boxplot圖5-9莖葉圖(stem-and-leafplots)莖葉圖既展示了分布形狀又有原始數據。SPSS選項:Analyze-DescriptiveStatistics-Explore。其中莖葉圖中莖的單位為10cm,而葉子為個位。地區1高三男生高度Stem-and-LeafPlot

Frequency

Stem&Leaf

9.00

15.001223344

17.00

15.55666667778899999

20.00

16.01112222223333333444

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論