第二講 單變量統(tǒng)計(jì)描述課件_第1頁(yè)
第二講 單變量統(tǒng)計(jì)描述課件_第2頁(yè)
第二講 單變量統(tǒng)計(jì)描述課件_第3頁(yè)
第二講 單變量統(tǒng)計(jì)描述課件_第4頁(yè)
第二講 單變量統(tǒng)計(jì)描述課件_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二講單變量統(tǒng)計(jì)描述第二講單變量統(tǒng)計(jì)描述一、分布(xini)x的要求:n:頻次分布(1)完整性P:概率分布(2)互斥性%:百分比分布為什么?如:性別xi人數(shù)ni

男5

女6第二講單變量統(tǒng)計(jì)描述例:某校學(xué)生的父親職業(yè)職業(yè)np%干部工人農(nóng)民1101522280.2000.2760.52420.027.652.4總數(shù)5501.000100.0第二講單變量統(tǒng)計(jì)描述二、統(tǒng)計(jì)表統(tǒng)計(jì)表的制作要注意的問題:1、標(biāo)題、內(nèi)容簡(jiǎn)明2、統(tǒng)計(jì)欄數(shù)多時(shí),要加編號(hào)3、數(shù)字填寫:位數(shù)對(duì)準(zhǔn),同欄數(shù)字、小數(shù)位要一致,相同數(shù)字不的寫“同上”,無(wú)數(shù)字欄用“—”,缺資料“…”4、表中數(shù)字用同一單位時(shí),標(biāo)在右上角5、表的左右兩端不封閉判斷練習(xí):分別制作定類、定序、定距變量統(tǒng)計(jì)表注意:統(tǒng)計(jì)表的分組科學(xué)性問題第二講單變量統(tǒng)計(jì)描述判斷:學(xué)校對(duì)最喜愛體育項(xiàng)目調(diào)查:項(xiàng)目名稱人數(shù)百分比球類田徑游泳賽車150100607060302020第二講單變量統(tǒng)計(jì)描述判斷:學(xué)生成績(jī)變化調(diào)查開學(xué)初期末成績(jī)%提高下降不變好中差108010608075101010301015第二講單變量統(tǒng)計(jì)描述三、統(tǒng)計(jì)圖圓瓣圖。反映所占比例;使用于定類;條形圖。定類:離散長(zhǎng)條;定序:緊挨長(zhǎng)條或離散長(zhǎng)條;寬度無(wú)意義;直方圖。緊挨長(zhǎng)條;寬度有意義;適用于定距;高度:頻次密度=頻次/組距折線圖。直方圖頂點(diǎn)中心相連;要計(jì)算組中心值。第二講單變量統(tǒng)計(jì)描述看一看,這是一個(gè)什么東東?第二講單變量統(tǒng)計(jì)描述課內(nèi)練習(xí)根據(jù)以下資料:好:1000;中:2000;差:50001、能否制成直方圖?Why?2、如果作成條形圖,對(duì)變量值的排列是否有要求?3、作圖第二講單變量統(tǒng)計(jì)描述四、頻數(shù)統(tǒng)計(jì)

cf↑:向上累計(jì)。小于某一數(shù)字的頻數(shù)

cf↓:向下累計(jì)。大于某一數(shù)字的頻數(shù)年齡人數(shù)cf↑c(diǎn)f↓153318166915189189第二講單變量統(tǒng)計(jì)描述第二講單變量統(tǒng)計(jì)描述第二講單變量統(tǒng)計(jì)描述第二講單變量統(tǒng)計(jì)描述第二講單變量統(tǒng)計(jì)描述第二講單變量統(tǒng)計(jì)描述第二講單變量統(tǒng)計(jì)描述第二講單變量統(tǒng)計(jì)描述五、集中值三種方法找集中值:頻次;居中;平均;想一想:社會(huì)經(jīng)濟(jì)生活中有哪些集中值?1、眾值M0

頻數(shù)最多的變量值,適合于單峰對(duì)稱。2、中位值Md

數(shù)據(jù)序列中央位置之值。未分組數(shù)據(jù):1)根據(jù)原始資料求中位值奇數(shù)時(shí)中位值=(N+1)/2偶數(shù)時(shí)中位值中間位置左右兩位數(shù)的平均值為中位值。第二講單變量統(tǒng)計(jì)描述2)根據(jù)頻次分布求中位值

未分組資料:首先確定中位值的位置(利用cf↑)第二步找中位值。分組資料

:四步求值方法1、找50%區(qū)間2、找上界U、下界L;U%—L%3、求累計(jì)50%的變量值X4、中位值=L+X第二講單變量統(tǒng)計(jì)描述例:某農(nóng)村婦女初婚年齡求中位值注意:真實(shí)組界的問題年齡頻次頻率cf↑16-183030%30%18-205050%80%20-222020%100%第二講單變量統(tǒng)計(jì)描述3、均值

適用于定距變量,能綜合反映頻次、次序、數(shù)值大小變化未分組數(shù)據(jù)

1)直接累加:算術(shù)平均例

2)根據(jù)頻次:加權(quán)平均均值=分組數(shù)據(jù):以中心值來(lái)代替變量值,但有誤差例。第二講單變量統(tǒng)計(jì)描述例:調(diào)查某地6戶農(nóng)民家庭和5戶干部家庭,每戶人數(shù)如下:農(nóng)民家庭:6;4;4;8;6;3;干部家庭;4;2;3;3;5;求均值。第二講單變量統(tǒng)計(jì)描述例:青年人每年閱讀書本數(shù)調(diào)查,求均值。書數(shù)人數(shù)2-45-78-1011-1314-1617-19245321總數(shù)17第二講單變量統(tǒng)計(jì)描述六、標(biāo)志變異指標(biāo)

測(cè)定離散趨勢(shì),考察資料的分散特征

1、異眾比率

非眾值的比例越小,則眾值的代表性越大。例2、極差R=觀察最大值-觀察最小值例3、四分互差Q=Q75–Q25例1例24、方差、σ與標(biāo)準(zhǔn)差未分組

1)根據(jù)原始資料標(biāo)準(zhǔn)差=2)根據(jù)頻次分布:例:第二講單變量統(tǒng)計(jì)描述例:以下19位學(xué)生每月零花錢的調(diào)查:100以下:6;100-200:10;200以上:3求異眾比率。第二講單變量統(tǒng)計(jì)描述例:以下是大學(xué)生每月餐費(fèi)開支調(diào)查,求極差。250;240;300;420;500;450;590;440;380;240;550;360;400;第二講單變量統(tǒng)計(jì)描述例1,根據(jù)原始資料求中位值調(diào)查甲村的家庭人口數(shù),如下:

2;2;3;4;6;9;10;11;13;15;求中位值。第二講單變量統(tǒng)計(jì)描述例2,根據(jù)分組資料求以下是1209名吸煙者年齡統(tǒng)計(jì),求四分互差年齡人數(shù)百分比CF↑21-2421225-3427335-4425745-5422655-6415265以上89合計(jì)第二講單變量統(tǒng)計(jì)描述例:某校教師20名調(diào)查,每月買書支出:40元,10人;50元,7人;60元,3人。求標(biāo)準(zhǔn)差。第二講單變量統(tǒng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論