第13講用樣本估計總體(春季講義)(人教A版2019)_第1頁
第13講用樣本估計總體(春季講義)(人教A版2019)_第2頁
第13講用樣本估計總體(春季講義)(人教A版2019)_第3頁
第13講用樣本估計總體(春季講義)(人教A版2019)_第4頁
第13講用樣本估計總體(春季講義)(人教A版2019)_第5頁
已閱讀5頁,還剩32頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第13講用樣本估計總體【人教A版2019】模塊一模塊一總體取值規律的估計1.頻率分布直方圖(1)頻率分布表與頻率分布直方圖的意義

為了探索一組數據的取值規律,一般先要用表格對數據進行整理,或者用圖將數據直觀表示出來.在初中,我們曾用頻數分布表和頻數分布圖來整理和表示這種數值型數據,由此能使我們清楚地知道數據分布在各個小組的個數.

有時,我們更關心各個小組的數據在樣本容量中所占比例的大小,所以選擇頻率分布表和頻率分布直方圖來整理和表示數據.

(2)頻率分布表與頻率分布直方圖的制作步驟

與畫頻數分布直方圖類似,我們可以按以下步驟制作頻率分布表、畫頻率分布直方圖.

第一步,求極差

極差為一組數據中最大值與最小值的差.

第二步,決定組距與組數第三步,將數據分組

通常對組內數據取左閉右開區間,最后一組數據取閉區間.

第四步,列頻率分布表

計算各小組的頻率,作出頻率分布表.

第五步,畫頻率分布直方圖

畫圖時,以橫軸表示分組,縱軸(小長方形的高度)表示.2.其他幾類常用統計圖——條形圖、折線圖、扇形圖條形圖折線圖扇形圖特點一般地,條形圖中,一條軸上顯示的是所關注的數據類型,另一條軸上對應的是數量、個數或者比例,條形圖中每一長方形都是等寬的.用一個單位長度表示一定的數量,用折線的起伏表示數量的增減變化.用整個圓表示總體,扇形圖中,每一個扇形的圓心角以及弧長,都與這一部分表示的數據大小成正比.作用及選用情景能清楚地表示每個項目的具體數量,便于相互比較大小.能清楚地看出數量增減變化的情況及各部分數量的多少.常用來表示隨時間變化的數據,當然,也可以用在其他合適的情形中.可以形象地表示出各部分數據在全部數據中所占的比例情況.圖例【題型1繪制、補全頻率分布直方圖】【例1.1】(2024高一下·全國·專題練習)如表所示給出了在某校500名12歲男孩中,用隨機抽樣得出的120人的身高(單位:cm).區間界限122,126126,130130,134134,138138,142142,146146,150150,154154,158人數58102233201165(1)列出樣本頻率分布表;(2)畫出頻率分布直方圖;(3)估計身高小于134cm的人數占總人數的百分比.【解題思路】(1)借助所給表格計算即可得;(2)借助頻率分布直方圖的定義及所給表格即可得;(3)計算出相應頻率之和即可得.【解答過程】(1)樣本頻率分布表如下:分組頻數頻率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合計1201.00(2)其頻率分布直方圖如下:

(3)0.04+0.07+0.08=0.19,故可估計身高小于134cm的人數占總人數的19%.【例1.2】(2024高一下·全國·專題練習)隨機觀測生產某種零件的某工廠25名工人的日加工零件數,獲得數據如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36,根據上述數據得到樣本的頻率分布表如下:分組25,3030,3535,4040,4545,50頻數358nn頻率0.120.200.32ff(1)確定樣本頻率分布表中n1,n2,f1(2)根據上述頻率分布表,畫出樣本頻率分布直方圖與折線圖.【解題思路】(1)利用給定的數據組求出n1,n2,f1(2)由(1)及已知畫出樣本頻率分布直方圖與折線圖.【解答過程】(1)依題意,n1=7,n2=2,所以(2)樣本頻率分布直方圖與折線圖如圖,【變式1.1】(2324高一下·陜西西安·階段練習)某地有2000名學生參加數學學業水平考試,現將成績匯總,得到如圖所示的頻率分布表.成績分組頻數頻率成績分組50,6010060,7070,8080080,9090,100200

(1)請完成題目中的頻率分布表,并補全題目中的頻率分布直方圖;(2)將成績按分層抽樣的方法抽取150名同學進行問卷調查,甲同學在本次測試中數學成績為95分,求他被抽中的概率.【解題思路】(1)根據頻率分布直方圖,利用頻率、頻數與樣本容量的關系,填寫頻率分布表,計算頻率組距(2)用分層抽樣方法,該同學被抽中的概率是與每一個同學的幾率相等,為1502000【解答過程】(1)完成題目中的頻率分布表,如下;成績分組頻數頻率50,601000.0560,706000.3070,808000.4080,903000.1590,1002000.10補全題目中的頻率分布直方圖,如下;

(2)將成績按分層抽樣的方法抽取150名同學進行問卷調查,甲同學在本次測試中數學成績為95分,他被抽中的概率為1502000【變式1.2】(2425高一下·陜西西安·階段練習)中央電視臺播出《中國詩詞大會》火遍全國,下面是組委會在選拔賽時隨機抽取的100名選手的成績,按成績分組,得到的頻率分布表如下所示:組號分組頻數頻率第1組160,1650.100第2組165,170①______第3組170,17520②______第4組175,180200.200第5組180,185100.100合計1001.00

(1)請先求出頻率分布表中①、②位置的相應數據,再完成頻率分布直方圖(用陰影表示).(2)為了能選拔出最優秀的選手,組委會決定在筆試成績高的第3,4,5組中用分層抽樣抽取5名選手進入第二輪面試,則第3,4,5組每組各抽取多少名選手進入第二輪面試?【解題思路】(1)先補全頻率分布表,然后完成頻率分布直方圖.(2)根據分層抽樣的知識求得正確答案.【解答過程】(1)第1組的頻數為100×0.1=10,所以①填100?10?20?20?10②填20100組號分組頻數頻率頻率第1組160,165100.1000.02第2組165,170400.4000.08第3組170,175200.2000.04第4組175,180200.2000.04第5組180,185100.1000.02合計1001.00由此補全頻率分布直方圖如下:

(2)第3,4,5組的頻率之比為0.200:0.200:0.100=所以第3,4,5組分別抽取2人,2人,1人.【題型2頻率分布直方圖的相關計算】【例2.1】(2324高三上·天津南開·期末)某研究機構為了解某地年輕人的閱讀情況,通過隨機抽樣調查了100位年輕人,對這些人每天的閱讀時間(單位:分鐘)進行統計,得到樣本的頻率分布直方圖如圖所示,則a的值為(

)A.0.02 B.0.2 C.0.04 D.0.4【解題思路】根據題意結合頻率和為1列式求解.【解答過程】由頻率分布直方圖可知:每組頻率依次為0.1,10a,0.45,10a,0.05,則0.1+10a+0.45+10a+0.05=20a+0.6=1,解得a=0.020.故選:A.【例2.2】(2324高一下·北京朝陽·期末)李華統計了他爸爸2024年5月的通話明細清單,發現他爸爸該月共通話60次,他按每次通話時間長短進行分組(每組為左閉右開的區間),畫出了如圖所示的頻率分布直方圖.則每次通話時長不低于5分鐘且小于15分鐘的次數為(

)A.18 B.21 C.24 D.27【解題思路】根據給定的頻率分布直方圖,求出每次通話時長不低于5分鐘且小于15分鐘的頻率即可得解.【解答過程】觀察頻率分布直方圖,得每次通話時長不低于5分鐘且小于15分鐘的頻率為:1?5(0.06+0.03+0.02+0.02)=0.35,則60×0.35=21,所以每次通話時長不低于5分鐘且小于15分鐘的次數為21.故選:B.【變式2.1】(2324高一下·江蘇連云港·期末)根據《中華人民共和國道路交通安全法》規定:血液酒精濃度在80mg/100ml(含80)以上時,屬醉酒駕車,處十五日以下拘留和三個月以上六個月以下暫扣駕駛證,并處500元以上2000元以下罰款.2024年3月以來,某地區交警查處酒后駕車和醉酒駕車共20人.如圖,這是對這20人酒后駕車血液中酒精含量進行檢測所得結果的頻率直方圖,則屬于醉酒駕車的人數約為(

)A.1 B.2 C.3 D.4【解題思路】根據頻率分布直方圖求出頻率,即可估計人數.【解答過程】由頻率分布直方圖可知酒精濃度在80mg/100ml(含80)以上的頻率為0.01+0.005×10=0.15所以樣本中屬于醉酒駕車的人數約為20×0.15=3人.故選:C.【變式2.2】(2024高一下·全國·專題練習)如圖是60名學生參加數學競賽的成績(均為整數,滿分100分)的頻率分布直方圖,估計這次數學競賽的及格率(60分及以上為及格)是(

)A.75% B.25%C.15% D.40%【解題思路】根據頻率直方圖,求出樣本中60分及以上的頻率,即可估計出概率.【解答過程】大于或等于60分的共四組,它們是[59.5,69.5),[69.5,79.5),[79.5,89.5),[89.5,99.5],故樣本中60分及以上的頻率為(0.015+0.03+0.025+0.005)×10=0.75,由此可估計這次數學競賽的及格率為75%,故選:A.【題型3統計圖的綜合應用問題】【例3.1】(2324高一下·貴州黔東南·期末)小波一星期的總開支(單位:元)分布如圖1所示,一星期的食品開支(單位:元)分布如圖2所示,則小波一星期的肉類開支占總開支的百分比為(

)A.33% B.11% C.10%【解題思路】首先根據頻數分布直方圖可知食品開支為300元,其中肉類開支為100元,運用百分比公式計算出肉類占食品開支的百分比;然后根據扇形統計圖得出食品在所有開支中所占的百分比,兩者相乘,即可求得一星期的肉類開支占總開支的百分比.【解答過程】由圖2知,小波一星期的食品開支為300元,其中肉類開支為100元,占食品開支的13而食品開支占總開支的30%,所以小波一星期的肉類開支占總開支的百分比為10故選:C.【例3.2】(2024·甘肅·一模)小李一周的總開支分布如圖(1)所示,其中一周的食品開支如圖(2)所示,則以下判斷錯誤的是(

A.小李這一周用于肉蛋奶的支出高于用于娛樂的支出B.小李這一周用于食品中其他類的支出在總支出中是最少的C.小李這一周用于主食的支出比用于通信的支出高D.小李這一周用于主食和蔬菜的總支出比日常支出高【解題思路】條形圖各支出占食品支出的比例乘以30%【解答過程】對于A,肉蛋奶的支出占食品開支的16080+160+120+40從而小李這一周用于肉蛋奶的支出占比(總開支是單位1)與用于娛樂的支出占比(總開支是單位1)大小關系為40%對于B,小李這一周用于食品中其他類的支出在總支出中占比為4080+160+120+40對比其他類型的支出占比可知,B描述正確,不符合題意;對于C,小李這一周用于主食的支出占比(總開支是單位1)與通信的支出占比(總開支是單位1)的大小關系為,8080+160+120+40對于D,小李這一周用于主食和蔬菜的總支出占比(總開支是單位1)與日常支出占比(總開支是單位1)的大小關系為,80+12080+160+120+40故選:D.【變式3.1】(2324高三下·內蒙古錫林郭勒盟·開學考試)為了積極推進國家鄉村振興戰略,某示范村不斷自主創新,拓寬村民增收渠道,近年來取得了顯著成效.據悉該村2023年經濟總收入是2022年的2倍,為了更好地了解該村經濟收入變化情況,統計了該村兩年的經濟收入構成比例,得到如圖所示的條形圖和餅圖.則以下說法錯誤的是(

)A.2023年“種植收入”和2022年“種植收入”一樣多B.2023年“養殖收入”與“第三產業收入”之和比2022年的全年總收入還多C.2023年“外出務工收入”是2022年“外出務工收入”的1D.2023年“其他收入”比2022年“其他收入”的2倍還多【解題思路】設2022年總收入為m,則2023年總收入為2m,A選項,分別計算出2022年和2023年種植收入,得到A正確;B選項,計算出0.35×2m+0.2×2m=1.1m【解答過程】設2022年總收入為m,則2023年總收入為2m,對于A,2022年種植收入為0.4m,2023年種植收入為0.2×2m=0.4m,A正確;對于B,2023年養殖收入和第三產業收入之和為0.35×2m+0.2×2m=1.1m對于C,2022年外出務工收入為0.15m,2023年外出務工收入為0.05×2m=0.1m,是2022年外出務工收入的23對于D,2022年其他收入為0.15m,2023年其他收入為0.2×2m=0.4m,由于0.4m>2×0.15m,故2023年其他收入比2022年其他收入的2倍還多,D正確.故選:C.【變式3.2】(2324高一下·湖南·階段練習)如圖為近一年我國商品零售總額和餐飲收入總額同比增速情況折線圖,根據該圖,下列結論正確的是(

)(注:同比,指當前的數據與上一年同期進行比對;環比,指當前數據與上個月的數據進行比對.)

A.2024年1~2月份,商品零售總額同比增長9.2B.2023年3~12月份,餐飲收入總額同比都降低C.2023年6~10月份,商品零售總額同比都增加D.2023年12月,餐飲收入總額環比增速為?14.1【解題思路】根據折線統計圖一一分析即可.【解答過程】對于A,2024年1~2月份,商品零售總額同比增長2.9%對于B,2023年8月份,餐飲收入總額同比增加,故B錯誤;對于C,2023年6~10月份,商品零售總額同比都增加,故C正確;對于D,2023年12月,餐飲收入總額環比增速并未告知,故D錯誤.故選:C.模塊模塊二總體百分位數的估計1.總體百分位數的估計(1)概念

一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100p)%的數據大于或等于這個值.(2)求解步驟

可以通過下面的步驟計算一組n個數據的第p百分位數:

第1步,按從小到大排列原始數據.

第2步,計算i=n×p%.第3步,若i不是整數,而大于i的比鄰整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i項與第(i+1)項數據的平均數.【題型4百分位數的求解】【例4.1】(2324高一下·河北滄州·階段練習)已知一組數據:55,64,92,76,88,67,76,90,則這組數據的第80百分位數是(

)A.90 B.88 C.82 D.76【解題思路】根據百分位數計算規則計算可得.【解答過程】將數據從小到大排列為:55,64,67,76,76,88,90,92,又8×80%所以這組數據的第80百分位數是90.故選:A.【例4.2】(2324高三下·河南·階段練習)高二年級進行消防知識競賽,統計所有參賽同學的成績,成績都在[50,100]內,估計所有參賽同學成績的第75百分位數為(

)A.65 B.75 C.85 D.95【解題思路】先由長方形的面積和為1求出a,再由第75百分位數的定義求解;【解答過程】因為2a×10=1,所以a=0.05.參賽成績位于[50,80)內的頻率為10×0.01+0.015+0.035第75百分位數在80,90內,設為80+y,則0.03y=0.15,解得y=5,即第75百分位數為85,故選:C.【變式4.1】(2324高一下·江蘇無錫·階段練習)從小到大排列的數據1,2,3,5,6,7,8,9,10,14,15,18的下四分位數為(

)A.3 B.4 C.10 D.12【解題思路】利用分位數的定義進行求解.【解答過程】數據共12個,12×250故從小到大,選擇第3和第4個數的平均數作為下四分位數,即3+52故選:B.【變式4.2】(2324高一下·江蘇蘇州·期末)某科研單位對ChatGPT的使用情況進行滿意度調查,在一批用戶的有效問卷(用戶打分在50分到100分之間的問卷)中隨機抽取了100份,按分數進行分組(每組為左閉右開的區間),得到如圖所示的頻率分布直方圖,估計這批用戶問卷的得分的第75百分位數為(

)A.78.5 B.82.5 C.85 D.87.5【解題思路】根據百分位數計算規則計算可得.【解答過程】因為0.01+0.025+0.035×10=0.7<0.750.01+0.025+0.035+0.02×10=0.9>0.75所以第75百分位數位于80,90,設為x,則0.01+0.025+0.035×10+0.02x?80=0.75故選:B.模塊模塊三總體集中趨勢與離散程度的估計1.總體集中趨勢的估計在初中的學習中我們已經了解到,平均數、中位數和眾數等都是刻畫“中心位置”的量,它們從不同角度刻畫了一組數據的集中趨勢.具體概念回顧如下:名稱概念平均數如果有n個數x1,x2,…,xn,那么就是這組數據的平均數,用表示,即.中位數將一組數據按從小到大或從大到小的順序排列,處在最中間的一個數據(當數據個數是奇數時)或最中間兩個數據的平均數(當數據個數是偶數時)稱為這組數據的中位數.眾數一組數據中出現次數最多的數據(即頻數最大值所對應的樣本數據)稱為這組數據的眾數.2.總體離散程度的估計(1)方差和標準差

假設一組數據是,,,,用表示這組數據的平均數,則我們稱為這組數據的方差.有時為了計算方差的方便,我們還把方差寫成的形式.

我們對方差開平方,取它的算數平方根,稱為這組數據的標準差.(2)總體(樣本)方差和總體標準差①一般式:如果總體中所有個體的變量值分別為,總體平均數為,則總體方差.

②加權式:如果總體的N個變量值中,不同的值共有k(k≤N)個,不妨記為,其中出現的頻數為,則總體方差為.

總體標準差:S=.(3)標準差與方差的統計意義①標準差刻畫了數據的離散程度或波動幅度,標準差越大,數據的離散程度越大;標準差越小,數據的離散程度越小.

②在刻畫數據的分散程度上,方差與標準差是一樣的,但在解決實際問題時,一般多采用標準差.③標準差(方差)的取值范圍為[0,+∞).若樣本數據都相等,表明數據沒有波動幅度,數據沒有離散性,則標準差為0.反之,標準差為0的樣本,其中的數據都相等.3.頻率分布直方圖中的統計參數(1)頻率分布直方圖中的“眾數”

根據眾數的意義可知,在頻率分布直方圖中最高矩形中的某個(些)點的橫坐標為這組數據的眾數.一般用中點近似代替.

(2)頻率分布直方圖中的“中位數”

根據中位數的意義,在樣本中,有50%的個體小于或等于中位數,也有50%的個體大于或等于中位數.因此,在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積應該相等,由此可估計中位數的值.

(3)頻率分布直方圖中的“平均數”

平均數是頻率分布直方圖的“重心”.因為平均數可以表示為數據與它的頻率的乘積之和,所以在頻率分布直方圖中,樣本平均數可以用每個小矩形底邊中點的橫坐標與小矩形的面積的乘積之和近似代替.【題型5眾數、中位數、平均數的求解及應用】【例5.1】(2425高一上·四川南充·開學考試)“雜交水稻之父”袁隆平培育的超級雜交稻在全世界推廣種植.某種植戶為了考察所種植的雜交水稻苗的長勢,從稻田中隨機抽取7株水稻苗,測得苗高(單位:cm)分別是23,24,23,25,26,23,25.則這組數據的眾數和中位數分別是(

)A.24,25 B.23,23C.23,24 D.24,24【解題思路】把給定數據由小到大排列,再求出眾數、中位數即得.【解答過程】苗高由小到大排列為:23,23,23,24,25,25,26,所以這組數據的眾數和中位數分別是23,24.故選:C.【例5.2】(2324高一下·新疆·期末)已知在高考前最后一次模擬考試中,高三某班8名同學的物理成績分別為84,79,84,86,95,84,87,93,則該組數據的平均數和眾數分別是(

)A.86,84 B.84.5,85 C.85,84 D.86.5,84【解題思路】根據平均數和眾數的概念求解.【解答過程】將樣本數據按升序排列為79,84,84,84,86,87,93,95,可得平均數x=因為84出現了三次,且次數最多,所以眾數為84.故選:D.【變式5.1】(2324高一下·陜西安康·期末)某科技攻關青年團隊共有18人,他們的年齡分布如下表所示:年齡45403632302826人數3234231下列說法正確的是(

)A.29是這18人年齡的一個25%分位數 B.40是這18人年齡的一個80%分位數C.34是這18人年齡的一個中位數 D.這18人年齡的眾數是4【解題思路】分別計算25%,80%分位數得到A錯誤,B正確,再計算中位數和眾數得到CD錯誤,得到答案【解答過程】對選項A:18×25%對選項B:18×80%對選項C:這18人年齡的中位數是32+322對選項D:這18人年齡的眾數是32,故D錯誤.故選:B.【變式5.2】(2024·浙江紹興·三模)已知實數1<2<x<y,若xy=36,且這四個數的中位數是3,則這四個數的平均數是(

)A.52 B.3 C.72【解題思路】借助中位數與平均數定義結合題目所給條件計算即可得.【解答過程】由題意可得2+x2=3xy=36則x=故選:D.【題型6方差、標準差的求解及應用】【例6.1】(2324高一下·湖北武漢·期末)已知一組樣本數據x1,x2,…,xn(n∈N*)的方差為1.2,則5x1?1,A.5 B.6 C.25 D.30【解題思路】利用方差的性質求解.【解答過程】∵數據x1∴5x1?1,5x2故選:D.【例6.2】(2324高一下·海南省直轄縣級單位·期末)從兩個班級各隨機抽取5名學生測量身高(單位:cm),甲班的數據為169,162,150,160,159,乙班的數據為180,160,150,150,165.據此估計甲、乙兩班學生的平均身高x甲,x乙及方差S甲2,A.x甲>x乙,S甲2>C.x甲<x乙,S甲2【解題思路】由題意,根據平均數和方差的計算公式分別計算出x甲、x乙、S甲【解答過程】x甲=169+162+150+160+159S甲S乙所以x甲<x故選:D.【變式6.1】(2324高一下·廣東深圳·階段練習)已知數據x1,x2,A.30,91 B.31,91 C.30,90 D.31,90【解題思路】根據平均數、方差的性質計算可得.【解答過程】因為x1,x2,x3,?,x8的平均數是所以3x1+1,3x2故選:D.【變式6.2】(2324高一下·湖南長沙·期末)已知某樣本的容量為50,平均數為70,方差為75.現發現在收集這些數據時,其中的兩個數據記錄有誤,一個錯將80記錄為60,另一個錯將70記錄為90.在對錯誤的數據進行更正后,重新求得樣本的平均數為x,方差為s2,則(

A.x=70,s2C.x=70,s2【解題思路】根據平均數、方差公式計算可得.【解答過程】由題意,可得x=設收集的48個準確數據分別記為x1則75==1s=150x故選:A.【題型7頻率分布直方圖中集中趨勢參數的計算】【例7.1】(2324高一下·河北張家口·期末)某時間段公路上車速的頻率分布直方圖如圖所示,則(

A.a=0.1 B.車速的眾數估計值是70C.車速的平均數估計值大于其中位數的估計值 D.車速的中位數估計值是62.5【解題思路】利用頻率分布直方圖求出a、眾數、平均數、中位數判斷即得.【解答過程】對于A,由10(a+3a+4a+2a)=1,得a=0.01,A錯誤;對于B,車速在[60,70)內的頻率最大,車速的眾數估計值是65,B錯誤;對于C,車速的平均數為0.1×45+0.3×55+0.4×65+0.2×75=62,車速的中位數m∈(60,70),則(m?60)×0.04=0.1,解得m=62.5,C錯誤;對于D,車速的中位數估計值是62.5.故選:D.【例7.2】(2324高一下·四川達州·期末)在某次考試成績中隨機抽取50個,成績均在50,100之間,將這些成績共分成五組:50,60,60,70,70,80,80,90,90,100,得到如圖所示的頻率分布直方圖,由圖中數據估計總體的眾數和中位數(中位數精確到個位)分別是(

).A.65,70 B.65,71 C.65,72 D.65,73【解題思路】本題根據眾數和中位數的概念以及在頻率分布直方圖的表達方法即可計算求解.【解答過程】眾數是頻率分布直方圖中最高的矩形的中點的坐標,即眾數為60+702設把頻率分布直方圖分成兩個面積相等部分的平行于y軸的直線橫坐標為x0先求圖中的a值,由0.004+0.036+a+0.020+0.008×10=1得,a=0.032則x0?70×0.032=0.5?0.4=0.1故選:D.【變式7.1】(2425高二上·湖南株洲·階段練習)某公司為了了解本公司職員的早餐費用情況,抽樣調查了100位職員的早餐日平均費用(單位:元),得到如下圖所示的頻率分布直方圖,圖中標注a的數字模糊不清.(1)試根據頻率分布直方圖求a的值,并估計該公司職員早餐日平均費用的眾數和平均數;(2)已知該公司有1000名職員,試估計該公司有多少職員早餐日平均費用不少于8元?【解題思路】(1)由頻率和為1得到a的值,頻率最高組的中間數即是眾數,用每組數據的中間數乘以頻率所得結果即為平均數;(2)找到滿足題意的頻率乘以總數即得頻數.【解答過程】(1)∵0.05×2×3+0.10×2×2+2a=1∴a=0.15眾數為5,平均數1×0.05+3×0.1+5×0.15+7×0.1+9×0.05+11×0.05(2)由頻率分布直方圖可知,平均費用不少于8元的頻率為:0.05×2+0.05×2=0.2∴1000×0.2=200∴試估計該公司有200名職員早餐日平均費用不少于8元.【變式7.2】(2324高一下·江蘇南京·期末)從全校學生的期末考試成績(均為整數)中隨機抽取一個樣本,將樣本分成5組,繪成頻率分布直方圖,如圖中從左到右各小組的小矩形的高之比為2:3:6:4:1,最左邊的一組頻數是6.(1)求樣本容量;(2)求105.5?120.5這一組的頻數及頻率;(3)估計這組樣本數據的眾數和中位數.【解題思路】(1)根據矩形面積比與頻率比的關系即可得到樣本容量;(2)根據面積比即可求出頻率,再根據樣本容量即可求出頻數;(3)根據眾數和中位數計算公式即可.【解答過程】(1)小矩形的高之比為頻率之比,所以從左到右的頻率之比為2:3:6:4:1.最左邊的一級所占的頻率為216所以樣本容量=頻數(2)105.5~120.5這一組的頻率為616=3(3)由頻率分布直方圖得:眾數為:105.5+120.52成績在[75.5,90.5)內的頻率為18成績在[90.5,105.5)內的頻率為316成績在[105.5,120.5)內的頻率為38則18+3設中位數為x∈[105.5,120.5),∴18+3即中位數為113.【題型8其他統計圖表中反映的集中趨勢與離散程度】【例8.1】(2324高一下·吉林長春·期末)近年來,“直播帶貨”受到越來越多人的喜愛.目前已經成為推動消費的一種流行的營銷形式.對某直播平臺的直播商家進行調查統計,發現所售商品多為小吃、衣帽、生鮮、玩具、飾品類等,各類直播商家所占比例如圖①所示.

(1)該直播平臺為了更好地服務買賣雙方,打算隨機抽取80個直播商家進行問詢交流.如果按照比例分配分層抽樣的方式抽取,則應抽取小吃類、玩具類商家各多少家?(2)在問詢了解直播商家的利潤狀況時,工作人員對抽取的80個商家的平均日利潤進行了統計(單位:元),所得頻率分布直方圖如圖②所示.請根據頻率分布直方圖,求出圖中a的值,并估計該直播平臺商家日利潤的平均數(求平均數時同一組中的數據用該組區間的中點值作代表).【解題思路】(1)根據題意,直接計算,即可得到結果;(2)根據題意,先由頻率之和求得a,再根據平均數的計算公式即可得到結果.【解答過程】(1)由題意可得,80×1?25%?15%?10%?5%?5%=32,所以應抽取小吃類32家,玩具類8家.(2)由題意可得,0.001×3+a+0.003+0.005+0.007×50=1,解得a=0.002平均數為250×0.001+300×0.003+350×0.007+400×0.005+450×0.002+500×0.001+550×0.001×50=377.5,所以該直播平臺商家日利潤的平均數為377.5【例8.2】(2324高一下·江蘇徐州·期末)近年來,“直播帶貨”受到越來越多人的喜愛,目前已經成為推動消費的一種流行營銷形式.某直播平臺有800個直播商家,對其進行調查統計,發現所售商品多為小吃、衣帽、生鮮、玩具、飾品類等,各類直播商家所占比例如圖①所示.為了更好地服務買賣雙方,該直播平臺打算用分層抽樣的方式抽取60個直播商家進行問詢交流.

(1)應抽取小吃類、生鮮類商家各多少家?(2)在問詢了解直播商家的利潤狀況時,工作人員對抽取的60個商家的平均日利潤進行了統計(單位:元),所得頻率直方圖如圖②所示.(i)估計該直播平臺商家平均日利潤的中位數與平均數(求平均數時同一組中的數據用該組區間中點的數值為代表);(ii)若將平均日利潤超過470元的商家稱為“優質商家”,估計該直播平臺“優質商家”的個數.【解題思路】(1)根據分層抽樣的定義計算即可;(2)(i)根據中位數和平均數的定義計算即可;(ii)根據樣本中“優秀商家”的個數來估計總體中“優秀商家”的個數即可.【解答過程】(1)根據分層抽樣知:應抽取小吃類60×1?30%?15所以應抽取小吃類21家,生鮮類9家.(2)(i)根據題意可得0.002×3+2a+0.006×50=1,解得a=0.004設中位數為x,因為0.002+0.004×50=0.3,0.002+0.004+0.006所以x?400×0.006+0.3=0.5,解得x=所以該直播平臺商家平均日利潤的中位數為13003平均數為325×0.002+375×0.004+425×0.006+475×0.004+525×0.002+575×0.002×50=440所以該直播平臺商家平均日利潤的平均數為440元.(ii)500?47050所以估計該直播平臺“優秀商家”的個數為256.【變式8.1】(2324高一下·河南·階段練習)已知第10~19屆亞運會中國隊獲得的金牌數如下圖所示.(1)求第10~19屆亞運會中國隊獲得的金牌數的極差;(2)剔除第12屆亞運會中國隊獲得的金牌數數據,求剩余9屆亞運會中國隊獲得的金牌數的平均數;(3)設第10~12屆亞運會中國隊獲得的金牌數的方差為s12,第13~15屆亞運會中國隊獲得的金牌數的方差為s22,不通過計算,試比較【解題思路】(1)將數據從小到大排列,找出最大值及最小值,解出極差即可;(2)剔除第12屆亞運會中國隊獲得的金牌數數據,計算出平均數即可;(3)通過折線圖觀察比較出第10~12屆亞運會中國隊獲得的金牌數與第13~15屆亞運會中國隊獲得的金牌數的波動情況即可判斷.【解答過程】(1)由題意知:第10?19屆亞運會中國隊獲得的金牌數的極差為201?94=107.(2)剩余9屆亞運會中國隊獲得的金牌數的平均數為:19(3)可判斷出s1因為第10~12屆亞運會中國隊獲得的金牌數的波動性,明顯比第13~15屆亞運會中國隊獲得的金牌數的波動性大,所以s1【變式8.2】(2324高一下·河南信陽·期中)樹人中學男女學生比例約為2:3,某數學興趣社團為了解該校學生課外體育鍛煉情況(鍛煉時間長短(單位:小時)),采用樣本量比例分配的分層抽樣,抽取男生m人,女生n人進行調查.記男生樣本為x1,x2,???,xm,樣本平均數、方差分別為x(1)該興趣社團通過分析給出以上兩個統計圖,假設兩個統計圖中每個組內的數據均勻分布,根據兩圖信息分別估計男生樣本、女生樣本的平均數;(2)已知男生樣本方差s12=5.5,女生樣本方差s【解題思路】(1)利用各組區間中點值代表該組的各個值,由頻率分布直方圖、扇形統計圖估計平均數的方法可求得結果;(2)根據分層抽樣計算平均數和方差的方法直接求解即可.【解答過程】(1)∵每個組內的數據均勻分布,∴以各組的區間中點值代表該組的各個值;由頻率分布直方圖估計男生樣本課外體育鍛煉時間的平均數x=1×0.05×2+3×0.1×2+5×0.175×2+7×0.1×2+9×0.075×2=0.1+0.6+1.75+1.4+1.35=5.2由扇形圖估計女生樣本課外體育鍛煉時間的平均數y=1×15%+3×25(2)∵采用按比例分配的分層隨機抽樣,∴m:n=2:3;∴估計樹人中學學生課外運動時間的平均數w=∴s2=mm+n一、單選題1.(2425高一下·甘肅蘭州·階段練習)已知一組數據3,4,5,6,7,8,9,10,則這組數據的第20百分位數是(

)A.3.5 B.4 C.4.5 D.5【解題思路】根據百分位數的定義求解即可.【解答過程】這組數據從小到大的順序為3,4,5,6,7,8,9,10,因為8×20%所以這組數據的第20百分位數為4.故選:B.2.(2425高一下·貴州遵義·階段練習)已知一組數x1,x2,x3,x4的平均數是3,方差為4,則數據2x1+1A.7,8 B.7,16 C.6,8 D.6,16【解題思路】根據平均數與方差的基本公式以及性質求解即可.【解答過程】由題意,x=x1所以2x1+1,2x2x1方差s1故選:B.3.(2324高一下·山西大同·期末)某部門為了了解一批樹苗的生長情況,在4000棵樹苗中隨機抽取400棵,統計這400棵樹苗的高度(單位:cm),將所得數據分成7組:70,80,80,90,90,100,100,110,110,120,120,130,130,140,并繪制了如圖所示的頻率分布直方圖,那么根據該圖可推測,在這4000棵樹苗中高度小于110?cmA.1680 B.1760 C.1840 D.1920【解題思路】求出樹苗中高度小于110?cm【解答過程】由頻率分布直方圖可得,小于110?cm的樹苗的頻率P=所以可推測,4000棵樹苗中高度小于110?cm的樹苗棵數約為4000×0.44=1760故選:B.4.(2324高一下·四川內江·期末)某調查機構對全國互聯網行業進行調查統計,得到整個互聯網行業從業者年齡的分布餅狀圖?90后從事互聯網行業者的崗位分布條形圖,則下列結論中不一定正確的是(

)A.互聯網行業從事技術崗位的人數中,90后比80后多B.90后互聯網行業者中從事技術崗位的人數超過整個從事互聯網行業者總人數的20C.互聯網行業中從事運營崗位的人數90后比80前多D.互聯網行業從業人員中90后占一半以上【解題思路】利用整個互聯網行業從業者年齡分布餅狀圖、90后從事互聯網行業崗位分布條形圖即可判斷各選項的真假.【解答過程】選項A;設整個互聯網行業總人數為a,互聯網行業中從事技術崗位的90后人數為56%a×39.6%但80后中從事技術崗位的人數比例未知,故A錯誤.選項B:設整個互聯網行業總人數為a,90后從事技術崗位人數為56%×39.6%a,而90后總人數的20%為56%選項C:設整個互聯網行業總人數為a,互聯網行業中從事運營崗位的90后人數為56%超過80前的人數6%a,且80前中從事運營崗位的人數比例未知,故C正確;選項D:由整個互聯網行業從業者年齡分布餅狀圖得到互聯網行業從業人員中90后占56%故選:A.5.(2425高一上·四川成都·開學考試)如表是某公司員工月收入的資料.月收入/元45000180001000055005000340033001000人數111361111能夠反映該公司全體員工月收入水平的統計量是(

)A.平均數和眾數 B.平均數和中位數C.中位數和眾數 D.平均數和方差【解題思路】求出數據的眾數和中位數,再與25名員工的收入進行比較即可.【解答過程】公司共有員工1+1+1+3+6+1+11+1=25人,該公司員工月收入的眾數為3300元,在25名員工中有13人這此數據之上,因此眾數能夠反映該公司全體員工月收入水平;月收入由小到大排列,3400為第13個數,因此該公司員工月收入的中位數為3400元;在25名員工中在此數據及以上的有13人,則中位數也能夠反映該公司全體員工月收入水平,而25名員工月收入的平均數45000+18000+10000+3×5500+6×5000+3400+11×3300+100025受極端數據45000、18000等影響,平均數偏離多數人的收入水平,而方差是表征數據波動大小的量,所以能夠反映該公司全體員工月收入水平的統計量是中位數和眾數.故選:C.6.(2425高三上·廣西南寧·開學考試)某校組織50名學生參加慶祝中華人民共和國成立75周年知識競賽,經統計這50名學生的成績都在區間50,100內,按分數分成5組:50,60,60,70,70,80,80,90,90,100,得到如圖所示的頻率分布直方圖(不完整),根據圖中數據,下列結論錯誤的是(

)A.成績在80,90上的人數最多B.成績不低于70分的學生所占比例為70C.50名學生成績的平均分小于中位數D.50名學生成績的極差為50【解題思路】根據頻率分布直方圖求出70,80的頻率,A項可由各矩形高度可得;B項由頻率計算可得;C項分別求出平均數、中位數比較可知;D項由極差定義可得.【解答過程】設70,80組的頻率為a,則由各組頻率之和為1可得10×0.01+0.02+0.03+0.02+a=0.8+a=1,解得50,60,60,70,70,80,80,90,90,100各組頻率依次為:0.1,0.2,0.2,0.3,0.2,A項,80,90組頻率最大,即成績在80,90上的人數最多,故A正確;B項,成績低于70分的學生頻率為0.1+0.2=0.3,即不低于70分的學生頻率為1?0.3=0.7,所以成績不低于70分的學生所占比例為70%C項,根據頻率分布直方圖,可得50名學生成績的平均數是55×0.1+65×0.2+75×0.2+85×0.3+95×0.2=78,由0.1+0.2+0.2=0.5,故50名學生成績的中位數為80,所以50名學生成績的平均分小于中位數,故選項C正確;D項,極差為數據中最大值與最小值的差,已知50名學生的成績都在區間50,100內,但成績的最大值不一定是100,最小值也不一定是50,故極差小于等于50,但不一定等于50,故D錯誤.故選:D.7.(2324高一下·江蘇無錫·期末)已知一組數據x1,x2,A.這組數據的40%分位數是xB.x2,xC.x2,xD.x2,x【解題思路】根據百分位數、極差、平均數、方差的概念及含義計算分析可得.【解答過程】對于A,5×40%=2,所以這組數據的40%分位數是對于B,不妨取這組數據為1,2,3,4,5,此時x2,x對于C,由x1<x2<所以x2,x對于D,因為x1<x故選:D.8.(2324高二下·湖南·期末)某學校開展“國學知識競賽”,共有“詩經組”,“論語組”,“春秋組”,“禮記組”4個小組參賽,每組10位選手,若該組每位選手的失分不超過6分,該組獲得“優秀”稱號,則根據每組選手的失分情況,下列小組一定獲得“優秀”稱號的是(

)A.詩經組中位數為3,眾數為2B.論語組平均數為3,方差為1C.春秋組平均數為3,眾數為2D.禮記組中位數為3,極差為4【解題思路】舉出相應反例計算可得A、C、D錯誤,借助反證法及方差計算公式可得B.【解答過程】對于A,數據為:1,2,2,2,2,4,6,7,8,9時,滿足中位數為3,眾數為2,但不滿足每位選手的失分不超過6分,故A錯誤;對于B,假設有一位同學失7分,則方差s2假設不成立,故B正確;對于C,數據為:1,2,2,2,2,2,2,3,5,9時,滿足平均數為3,眾數為2,但是不滿足每位選手失分不超過6分,故C錯誤;對于D,數據為:3,3,3,3,3,3,3,3,7,7,滿足中位數為3,極差為4,但最大值超過6分,故D錯誤.故選:B.二、多選題9.(2324高一下·四川樂山·期末)小劉一周的總開支分布如圖①所示,該周的食品開支如圖②所示,則以下說法正確的是(

)A.娛樂開支比通信開支多5元B.日常開支比食品中的肉類開支多100元C.娛樂開支金額為100元D.肉類開支占儲蓄開支的1【解題思路】先由圖2計算出食品的開支,再由圖1計算出總開支,從而對選項逐一分析即可得解.【解答過程】對于C,由圖2可知食品的開支為30+40+100+80+50=300元,由圖1可知食品開支為30%,所以總開支為300÷30則娛樂開支為1000×10%對于A,通信開支為1000×5%=50元,娛樂開支比通信開支多對于B,日常開支為1000×20%=200元,肉類為日常開支比肉類開支多100元,故B正確;對于D,儲蓄開支為1000×30%=300元,肉類開支占儲蓄開支的故選:BCD.10.(2324高一下·山東臨沂·期末)若數據x1,xA.數據3x1+4,3x2+4,?C.數據3x1+4,3x2+4,?,【解題思路】根據給定條件,利用平均數,方差公式逐項計算即可求解.【解答過程】對于A,由平均數公式,得數據3x1+2,3x2對于B,i=110對于C,由方差公式,得數據3x1+2,3x2+2,…,對于D,由s2得x12+所以i=110故選:BCD.11.(2324高一下·內蒙古通遼·階段練習)酒后駕駛是嚴重危害交通安全的行為,某交通管理部門對轄區內四個地區(甲、乙、丙、丁)的酒駕治理情況進行檢查督導,若“連續8天,每天查獲的酒駕人數不超過10”,則認為“該地區酒駕治理達標”,根據連續8天檢查所得數據的數字特征推斷,酒駕治理不一定達標的地區是(

)A.甲地:均值為4,中位數為5B.乙地:眾數為3,中位數為2C.丙地:均值為7,方差為2D.丁地:極差為3,75%分位數為8【解題思路】不妨設8天中,每天查獲的酒駕人數從小到大分別為x1,x2,?,【解答過程】不妨設8天中,每天查獲的酒駕人數從小到大分別為x1,x2對于A,若不達標,則x8≥11,因為中位數為5,所以故i=18xi=32則x1對于B,由眾數和中位數的定義易知,當x1對于C,若不達標,則x8由方差定義可知,s2對于D,由極差和百分位數的定義可知,當x1故選:ABD.三、填空題12.(2425高一上·全國·課后作業)為了了解某校學生的體重情況,采用隨機抽樣的方法調查.將樣本體重數據整理后,得到的頻率分布直方圖如圖所示.已知圖中從左到右前三個矩形面積之比為1∶2∶3,第二小組頻數為12,則全校共抽取人數為48.

【解題思路】根據圖以及前三組的頻率之比可得第二組的頻率,即可求解.【解答過程】由圖可知:第四,五小組的頻率之和為0.0375+0.0125×5=0.25所以前三組的頻率和為1?0.25=0.75,故第二組的頻率為0.75×2故總人數為12故答案為:48.13.(2324高一下·四川成都·期末)將10個數據按照從小到大的順序排列如下:11,15,17,a,23,26,27,34,37,38,若該組數據的40%分位數為22,則a=21【解題思路】根據百分位的計算求解即可.【解答過程】因為10×40%=4,所以40%分位數是第4、5個數據的平均數,所以a+232=22,解得故答案為:21.14.(2024高三·全國·專題練習)某學校高一年級在校人數為600人,其中男生320人,女生280人,為了解學生身高發展情況,按分層隨機抽樣的方法抽取50名男生身高為一個樣本,其樣本平均數為170.2cm,抽取50名女生身高為一個樣本,其樣本平均數為162.0cm,則該校高一學生的平均身高的估計值為166.4cm【解題思路】由題意可知,x=170.2,y=162.0,且M=320,N=280,【解答過程】由題意可知,x=170.2,y所以樣本平均數w=故該校高一學生的平均身高的估計值為166.4cm故答案為:166.4cm四、解答題15.(2324高一下·甘肅白銀·期末)某選手在參加某次比賽中,各評委打出的分數為10,9,8,9,9,8,10,7,8,6.(1)求該選手所有得分的平均數;(2)若該選手所有得分的m%分位數為9,求整數m的取值集合.【解題思路】(1)根據平均數的定義進行求解,得出答案;(2)先從小到大排序,再根據百分位數定義,分m≤50,51≤m≤59,m=60,61≤m≤69,m=70,71≤m≤79和m≥80等情況進行求解即可.【解答過程】(1)該選手平均分為:10+9+8+9+9+8+10+7+8+610(2)將所得分數從小到大排列為:6,7,8,8,8,9,9,9,10,10,共10個數,9在第6,7,8三個位置上,當51≤m≤59時,5<10×m%<6,選擇第6個數作為m%分位數,滿足要求,若m=60,則10×60%=6,選擇第6個和第7個數的平均數作為m%分位數,滿足要求,當61≤m≤69時,6<10×m%<7,選擇第7個數作為m%分位數,滿足要求,若m=70,則10×7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論