用樣本的頻率分布估計總體分布公開課_第1頁
用樣本的頻率分布估計總體分布公開課_第2頁
用樣本的頻率分布估計總體分布公開課_第3頁
用樣本的頻率分布估計總體分布公開課_第4頁
用樣本的頻率分布估計總體分布公開課_第5頁
已閱讀5頁,還剩25頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據根據樣本的情況對總體的相應情況作出估計和推斷3.隨機抽樣的三種常用方法簡單隨機抽樣、系統抽樣、分層抽樣2.統計學研究問題的步驟三步驟:收集數據、整理數據、統計推斷。即通過抽樣方法收集數據的目的是從中尋找所包含的信息,用樣本去估計總體。統計學的核心思想是復習舊知第1頁/共29頁第一頁,共30頁。第2頁/共29頁第二頁,共30頁。我國是世界上嚴重缺水的國家之一,城市缺水問題較為突出.情境引入第3頁/共29頁第三頁,共30頁。2000年全國主要城市中缺水情況排在前10位的城市第4頁/共29頁第四頁,共30頁。

巢湖市市政府為了節約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標準a,用水量不超過a的部分按平價收費,超過a的部分按議價收費.(1)如果希望大部分居民的日常生活不受影響,那

么標準a定為多少比較合理呢?(2)為了較合理地確定這個標準,你認為需要做哪些工作?第5頁/共29頁第五頁,共30頁。3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2

這些數字告訴我們什么信息?通過抽樣,我們獲得了100位居民某年的月平均用水量(單位:t),如下表:第6頁/共29頁第六頁,共30頁。

很容易發現的是一個居民月平均用水量的最小值時0.2t,最大值是4.3t,其他在0.2t~4.3t之間.分析數據的一種基本方法是用圖將它們畫出來,或者用緊湊的表格改變數據的排列方式.一幅圖勝過一千字(一)從數據中提取信息,(二)利用圖形傳遞信息。第7頁/共29頁第七頁,共30頁。初中我們曾經學過頻數分布表和頻數分布圖,這使我們能夠清楚地知道數據分布在各個小組的個數.

下面將要學習的頻率分布表和頻率分布圖,則是從各個小組數據在樣本容量中所占比例大小的角度,來表示數據分布的規律.它可以使我們看到整個樣本數據的頻率分布情況.第8頁/共29頁第八頁,共30頁。頻率分布相關概念

頻率:樣本中某個組的頻數和樣本容量的比,叫做該數據的頻率。頻率分布的表示形式有:①樣本頻率分布表②樣本頻率分布直方圖③樣本頻率分布折線圖

所有數據(或數據組)的頻數的分布變化規律叫做樣本的頻率分布。

頻數:在統計學中,將樣本按照一定的方法分成若干組,每組內含有這個樣本的個體的數目叫做頻數第9頁/共29頁第九頁,共30頁。第一步:求極差(一組數據中的最大值與最小值的差).知識探究(一):樣本頻率分布表思考1:上述100個數據中的最大值和最小值分別是什么?由此說明樣本數據的變化范圍是什么?0.2~4.3思考2:分成多少組合適呢?第二步:決定組距與組數:組距:指每個小組的兩個端點的距離;組數:k=極差÷組距,若k為整數,則組數=k,否則,組數=[k]+1.將數據分組,當數據在100個以內時,按數據多少常分5-12組。(4.3-0.2)÷0.5=8.2.將8.2取整故,可取組距=0.5,組數=9如果將上述100個數據按組距為0.5進行分組,那么這些數據共分為多少組?第10頁/共29頁第十頁,共30頁。第四步:列頻率分布表.

計算各小組的頻率,作出下面的頻率分布表.第三步:確定分點,將數據分組.以組距為0.5將數據分組時,可以分成以下9組:[0,0.5),[0.5,1),…,[4,4.5].知識探究(一):頻率分布表思考3:各組數據的取值范圍可以如何設定?各組均為左閉右開區間,最后一組是閉區間思考4:如何統計上述100個數據在各組中的頻數?如何計算樣本數據在各組中的頻率?你能將這些數據用表格反映出來嗎?第11頁/共29頁第十一頁,共30頁。列頻率分布表:分組頻數累計頻數頻率[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合計48152225146420.040.080.150.220.250.140.060.041001.000.02頻率/組距0.080.160.300.440.500.280.120.080.04頻率分布表一般分五列1、“分組”,2、“頻數累計(可省),3、“頻數”,4、“頻率”,5、“頻率/組距”最后一行是合計知識探究(一):頻率分布表頻數的合計為樣本容量頻率合計為1第12頁/共29頁第十二頁,共30頁。為了直觀反映樣本數據在各組中的分布情況,我們將上述頻率分布表中的有關信息用下面的圖形表示:月均用水量/t0.100.200.300.400.50O頻率/組距0.511.52.53.54.5234知識探究(二):頻率分布直方圖

第一步:畫平面直角坐標系.第二步:在橫軸上均勻標出各組分點,在縱軸上標出單位長度.第三步:以組距為寬,各組的頻率與組距的商為高,分別畫出各組對應的小長方形.y軸:頻率/組距x軸:數據單位第13頁/共29頁第十三頁,共30頁。月均用水量/t頻率/組距0.50.40.30.20.10.511.522.533.544.5O各組的頻率在圖中哪里顯示出來?各小長方體的面積之和是否為定值?各小長方形的面積之和為1.寬度:組距高度:頻率組距知識探究(二):頻率分布直方圖

小長方形的面積=組距頻率=組距×頻率第14頁/共29頁第十四頁,共30頁。月均用水量/t0.50.40.30.20.10.511.522.533.544.5O你能根據上述頻率分布直方圖指出居民月均用水量的一些數據特點嗎?頻率/組距知識探究(二):頻率分布直方圖

第15頁/共29頁第十五頁,共30頁。(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個中間值附近,只有少數居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對稱性等.月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O第16頁/共29頁第十六頁,共30頁。

同樣一組數據,如果組距不同,橫軸、縱軸的單位不同,得到的圖和形狀也會不同。不同的形狀給人以不同的印象,這種印象有時會影響我們對總體的判斷,下面給出以0.1和1為組距重新作出的頻率分布直方圖。第17頁/共29頁第十七頁,共30頁。

如果市政府希望85%左右的居民每月的用水量不超過標準,根據上述頻率分布表,你對制定居民月用水量標準(即a的取值)有何建議?

問題:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O0.150.250.020.220.080.140.040.040.06若將標準a定為2.5,則74%的居民在2.5t以下若將標準a定為3,則88%的居民在3t以下,標準可定為3t.第18頁/共29頁第十八頁,共30頁。頻率分布直方圖如下:月均用水量/t0.100.200.300.400.500.511.522.533.544.5連接頻率分布直方圖中各小長方形上端的中點,得到頻率分布折線圖.o頻率/組距第19頁/共29頁第十九頁,共30頁。利用樣本頻率分布對總體分布進行相應估計:(1)上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會有什么變化?假如增至10000呢?(2)樣本容量越大,這種估計越精確.(3)當樣本容量無限增大,組距無限縮小,那么頻率分布直方圖就會無限接近于一條光滑曲線——總體密度曲線.第20頁/共29頁第二十頁,共30頁。總體密度曲線月均用水量/tab(圖中陰影部分的面積,表示總體在某個區間(a,b)內取值的百分比).o頻率/組距第21頁/共29頁第二十一頁,共30頁。理論遷移

例某地區為了了解知識分子的年齡結構,隨機抽樣50名,其年齡分別如下:

42,38,29,36,41,43,54,43,34,44,

40,59,39,42,44,50,37,44,45,29,

48,45,53,48,37,28,46,50,37,44,

42,39,51,52,62,47,59,46,45,67,

53,49,65,47,54,63,57,43,46,58.

(1)列出樣本頻率分布表;

(2)畫出頻率分布直方圖以及頻率分布折線圖;

(3)估計年齡在32~52歲的知識分子所占的比例約是多少.

第22頁/共29頁第二十二頁,共30頁。(1)極差為67-28=39,取組距為5,分為8組.

分組頻數頻率頻率/組距

[27,32)

[32,37)

[37,42)

[42,47)

[47,52)

[52,57)

[57,62)

[62,67]

合計

樣本頻率分布表:

3

3

50

9

16

3

0.18

0.06

4

5

7

0.06

0.06

0.32

0.14

0.08

0.10

1.00

0.036

0.012

0.012

0.012

0.064

0.028

0.016

0.020

0.200

第23頁/共29頁第二十三頁,共30頁。(2)樣本頻率分布直方圖:年齡0.0600.0500.0400.0300.0200.010273237424752576267O(3)因為0.06+0.18+0.32+0.14=0.7,故年齡在32歲~52歲的知識分子約占70%.頻率/組距0.060.180.140.32第24頁/共29頁第二十四頁,共30頁。一、求極差,即數據中最大值與最小值的差二、決定組距與組數:組距=極差/組數三、分組,通常對組內數值所在區間,取左閉右開區間,最后一組取閉區間四、登記頻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論