




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2.2.1用樣本的頻率分布估計總體分布頻率分布的表示形式有:①樣本頻率分布表②樣本頻率分布圖樣本頻率分布條形圖樣本頻率分布直方圖③樣本頻率分布折線圖
1、初中時我們學習過樣本的頻率分布,包括頻數、頻率的概念,頻數分布表和頻數分布直方圖的制作。例1.
為檢測某種產品的質量,抽取了一個容量為30的樣本,檢測結果為一級品5件,二級品8件,三級品13件,次品4件.(1)列出樣本的頻率分布表;(2)畫出表示樣本頻率分布的條形圖;(3)根據上述結果,估計此種產品為二級品或三級品的概率約是多少.
解:(1)樣本的頻率分布表為:
0.134次品0.4313三級品0.278二級品0.175一級品頻率頻數產品解:(2)樣本頻率分布的條形圖為:
0.10.20.30.40.50.60.7一級品二級品產品頻率三級品次品(3)此種產品為二級品或三級品的概率約為0.27+0.43=0.7.
知識探究(一):頻率分布表【問題】
我國是世界上嚴重缺水的國家之一,城市缺水問題較為突出,某市政府為了節約生活用水,計劃在本市試行居民生活用水定額管理,即確定一個居民月用水量標準a,用水量不超過a的部分按平價收費,超出a的部分按議價收費.通過抽樣調查,獲得100位居民2007年的月均用水量如下表(單位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2顯然:這里的總體可以在一個實數區間取值,稱為連續型總體。樣本的頻率分布表示形式有:
頻率分布表和頻率分布直方圖1.極差:樣本數據中的最大值和最小值的差稱為極差2.確定組距,組數:.如果將上述100個數據按組距為0.5進行分組,那么這些數據共分為多少組?0.2~4.3(4.3-0.2)÷0.5=8.2
3將數據分組,決定分點:以組距為0.5進行分組,上述100個數據共分為9組,各組數據的取值范圍可以如何設定?4畫頻率分布表:如何統計上述100個數據在各組中的頻數?如何計算樣本數據在各組中的頻率?你能將這些數據用表格反映出來嗎?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].
分組頻數累計頻數頻率
[0,0.5)40.04[0.5,1)正80.08[1,1.5)正正正150.15[1.5,2)正正正正220.22[2,2.5)正正正正正250.25[2.5,3)正正140.14[3,3.5)正一60.06[3.5,4)40.04[4,4.5]20.02
合計1001.00頻率分布表:知識探究(二):頻率分布直方圖5畫頻率分布直方圖為了直觀反映樣本數據在各組中的分布情況,我們將上述頻率分布表中的有關信息用下面的圖形表示:月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O上圖稱為頻率分布直方圖,其中橫軸表示月均用水量,縱軸表示頻率/組距.頻率分布直方圖中各小長方形的寬度和高度在數量上有何特點?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距2圖形的意義圖形的意義:頻率分布直方圖中各小長方形的面積表示什么?各小長方形的面積之和為多少?各小長方形的面積=頻率各小長方形的面積之和=1月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O寬度:組距高度:頻率組距3分析例題:你能根據上述頻率分布直方圖指出居民月均用水量的一些數據特點嗎?月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O(1)居民月均用水量的分布是“山峰”狀的,而且是“單峰”的;(2)大部分居民的月均用水量集中在一個中間值附近,只有少數居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的對稱性等.月均用水量/t頻率組距0.50.40.30.20.10.511.522.533.544.5O思考:對一組給定的樣本數據,頻率分布直方圖的外觀形狀與哪些因素有關?在居民月均用水量樣本中,你能以1為組距畫頻率分布直方圖嗎?
與分組數(或組距)及坐標系的單位長度有關.月均用水量/t頻率組距0.40.30.20.112345
O1、求極差(即一組數據中最大值與最小值的差)
知道這組數據的變動范圍4.3-0.2=4.12、決定組距與組數(將數據分組)3、將數據分組(8.2取整,分為9組)畫頻率分布直方圖的步驟4、列出頻率分布表.(填寫頻率/組距一欄)5、畫出頻率分布直方圖。組距:指每個小組的兩個端點的距離組數:將數據分組,當數據在100個以內時,按數據多少常分5-12組。頻率分布的條形圖和頻率分布直方圖的區別兩者是不同的概念;橫軸:兩者表示內容相同思考:頻率分布條形圖和頻率分布直方圖是兩個相同的概念嗎?有什么區別?縱軸:兩者表示的內容不相同頻率分布條形圖的縱軸(長方形的高)表示頻率頻率分布直方圖的縱軸(長方形的高)表示頻率與組距的比值,其相應組距上的頻率等于該組距上長方形的面積。頻率分布直方圖如下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.5連接頻率分布直方圖中各小長方形上端的中點,得到頻率分布折線圖利用樣本頻分布對總體分布進行相應估計(2)樣本容量越大,這種估計越精確。(1)上例的樣本容量為100,如果增至1000,其頻率分布直方圖的情況會有什么變化?假如增至10000呢?總體密度曲線頻率組距月均用水量/tab(圖中陰影部分的面積,表示總體在某個區間(a,b)內取值的百分比)。當樣本容量無限增大,分組的組距無限縮小,那么頻率分布折線圖就會無限接近一條光滑曲線——總體密度曲線.總體密度曲線
用樣本分布直方圖去估計相應的總體分布時,一般樣本容量越大,頻率分布直方圖就會無限接近總體密度曲線,就越精確地反映了總體的分布規律,即越精確地反映了總體在各個范圍內取值百分比。
總體密度曲線反映了總體在各個范圍內取值的百分比,精確地反映了總體的分布規律。是研究總體分布的工具.總體密度曲線莖葉圖某賽季甲、乙兩名籃球運動員每場比賽得分的原始記錄如下:(1)甲運動員得分:13,51,23,8,26,38,16,33,14,28,39(2)乙運動員得分:
49,24,12,31,50,31,44,36,15,37,25,36,39
甲乙
804631253682543893161679449150注:中間的數字表示得分的十位數字。
旁邊的數字分別表示兩個人得分的個位數。莖葉圖當樣本數據較少時,用莖葉圖表示數據的效果較好,它不但可以保留所有的信息,而且可以隨時記錄,給數據的記錄和表示都方便。練習:某中學高一(2)班甲,乙兩名同學自高中以來每場數學考試成績情況如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:83,86,93,99,88,96,98,98,79,85,97畫出兩人數學成績莖葉圖,請根據莖葉圖對兩人的成績進行比較。
小結圖形優點缺點頻率分布1)易表示大量數據丟失一些直方圖
2)直觀地表明分布地情況信息
1)無信息損失只能處理樣本莖頁圖
2)隨時記錄方便記錄和表示容量較小數據課堂小結表示樣本分布的方法:(1)頻率分布表(2)頻率分布圖(包括直方圖和條形圖)(3)頻率分布折線圖(4)莖葉圖一眾數、中位數、平均數的概念中位數:將一組數據按大小依次排列,把處在最中間位置的一個數據(或最中間兩個數據的平均數)叫做這組數據的中位數.
眾數:在一組數據中,出現次數最多的數據叫做這組數據的眾數.
平均數:一組數據的算術平均數,即
問題1:眾數、中位數、平均數這三個數一般都會來自于同一個總體或樣本,它們能表明總體或樣本的什么性質?平均數:反映所有數據的平均水平
眾數:反映的往往是局部較集中的數據信息
中位數:是位置型數,反映處于中間部位的數據信息
1、求下列各組數據的眾數(1)、1,2,3,3,3,5,5,8,8,8,9,9眾數是:3和8(2)、1,2,3,3,3,5,5,8,8,9,9眾數是:32、求下列各組數據的中位數(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位數是:5中位數是:4
3、在一次中學生田徑運動會上,參加男子跳高的17名運動員的成績如下表所示:成績(米)1.501.601.651.701.751.801.851.90人數23234111分別求這些運動員成績的眾數,中位數與平均數。解:在17個數據中,1.75出現了4次,出現的次數最多,即這組數據的眾數是1.75.上面表里的17個數據可看成是按從小到大的順序排列的,其中第9個數據1.70是最中間的一個數據,即這組數據的中位數是1.70;
答:17名運動員成績的眾數、中位數、平均數依次是1.75(米)、1.70(米)、1.69(米)。
這組數據的平均數是二、眾數、中位數、平均數與頻率分布直方圖的關系頻率組距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)
眾數在樣本數據的頻率分布直方圖中,就是最高矩形的中點的橫坐標。如何在頻率分布直方圖中估計眾數可將眾數看作直方圖中面積最大長方形的“中心”0.52.521.5143.534.5頻率組距0.040.080.150.220.250.140.060.040.02前四個小矩形的面積和=0.49后四個小矩形的面積和=0.262.02如何在頻率分布直方圖中估計中位數分組[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合計頻率0.040.080.150.220.250.140.060.040.021在樣本中中位數的左右各有50%的樣本數,條形面積各為0.5,所以反映在直方圖中位數左右的面積相等.,中位數)可將中位數看作整個直方圖面積的“中心”思考討論以下問題:1、2.02這個中位數的估計值,與樣本的中位數值2.0不一樣,你能解釋其中原因嗎?答:2.02這個中位數的估計值,與樣本的中位數值2.0不一樣,這是因為樣本數據的頻率分布直方圖,只是直觀地表明分布的形狀,但是從直方圖本身得不出原始的數據內容,直方圖已經損失一些樣本信息。所以由頻率分布直方圖得到的中位數估計值往往與樣本的實際中位數值不一致.如何在頻率分布直方圖中估計平均數=2.02=2.02平均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和。可將平均數看作整個直方圖面積的“重心”
思考討論以下問題:2、樣本中位數不受少數極端值的影響,這在某些情況下是一個優點,但它對極端值的不敏感有時也會成為缺點。你能舉例說明嗎?答:優點:對極端數據不敏感的方法能夠有效地預防錯誤數據的影響。對極端值不敏感有利的例子:例如當樣本數據質量比較差,即存在一些錯誤數據(如數據錄入錯誤、測量錯誤等)時,用抗極端數據強的中位數表示數據的中心值更準確。缺點:(1)出現錯誤的數據也不知道;(2)對極端值不敏感有弊的例子:某人具有初級計算機專業技術水平,想找一份收入好的工作。這時如果采用各個公司計算機專業技術人員收入的中位數作為選擇工作的參考指標就會冒這樣的風險:很可能所選擇公司的初級計算機專業技術水平人員的收入很低,其原因是中位數對極小的數據不敏感。這里更好的方法是同時用平均工資和中位數作為參考指標,選擇平均工資較高且中位數較大的公司就業.例1、下表是七位評委給某參賽選手的打分,總分為10分,你認為如何計算這位選手的最后得分才較為合理?評委1號2號3號4號5號6號7號
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鉆頭代理經銷協議書
- 外包運輸安全協議書
- 舊房房頂改造協議書
- 刑事司法互助協議書
- 問題處理調解協議書
- 煤炭聯營協議書范本
- 醫藥連鎖購銷協議書
- 項目承包內部協議書
- 沒有檔案托管協議書
- 汽車限速協議書范本
- 防流感班會課件
- 2025安徽蚌埠市國有資本運營控股集團有限公司招聘4人筆試參考題庫附帶答案詳解
- 2024年中國資源循環集團有限公司招聘筆試真題
- 行政管理本科畢業論文-數字政府背景下地方政府治理效能研究
- 家庭營養師課件
- 鐵路護路工作培訓
- 玉蘭采購及包栽包活合同范本
- 2025年春季四年級下冊語文第15課《白鵝》課件(統編版)
- 2024北京市大興初二(下)期中數學試卷及答案
- JGT266-2011 泡沫混凝土標準規范
- 中央八項規定實施細則解讀課件
評論
0/150
提交評論