用樣本估計總體_第1頁
用樣本估計總體_第2頁
用樣本估計總體_第3頁
用樣本估計總體_第4頁
用樣本估計總體_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

用樣本估計總體一、基礎知識1.頻率分布直方圖頻率 頻率(1)縱軸表示組距,即小長方形的高= 組距;頻率(2)小長方形的面積=組距× 組距=頻率;(3)各個小方形的面積總和等于 1.2.頻率分布表的畫法極差第一步:求極差,決定組數和組距,組距= ;組數第二步:分組,通常對組內數值所在區間取左閉右開區間,最后一組取閉區間;第三步:登記頻數,計算頻率,列出頻率分布表.3.莖葉圖莖葉圖是統計中用來表示數據的一種圖,莖是指中間的一列數,葉就是從莖的旁邊生長出來的數.4.中位數、眾數、平均數的定義(1)中位數將一組數據按大小依次排列,處于最中間位置的一個數據 (或最中間兩個數據的平均數 )叫做這組數據的中位數.(2)眾數一組數據中出現次數最多的數據叫做這組數據的眾數.(3)平均數一組數據的算術平均數即為這組數據的平均數, n個數據x1,x2,?,xn的平均數 x=1n(x1+x2+?+xn).5.樣本的數字特征如果有n個數據x1,x2,?,xn,那么這 n個數的(1)平均數 x=1n(x1+x2+?+xn).12+x2-x2+?+xn-x2].(2)標準差s=[x1-xn2 1 2 2 2(3)方差s=[(x1-x)+(x2-x)+?+(xn-x)].二、常用結論1.頻率分布直方圖中的常見結論(1)眾數的估計值為最高矩形的中點對應的橫坐標.平均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.(3)中位數的估計值的左邊和右邊的小矩形的面積和是相等的.2.平均數、方差的公式推廣(1)若數據x1,x2,?,xn的平均數為 x,則mx1+a,mx2+a,mx3+a,?,mxn+a的平均數是mx+a.(2)若數據x1,x2,?,xn的方差為s2,則數據ax1+b,ax2+b,?,axn+b的方差為 a2s2.考點一

莖葉圖[典例]

(2017

山·東高考

)如圖所示的莖葉圖記錄了甲、乙兩組各

5名工人某日的產量數據

(單位:件

).若這兩組數據的中位數相等,且平均值也相等,則

x和

y的值分別為

(

)A.3,5

B.5,5C.3,7

D.5,7[解析]

由兩組數據的中位數相等可得

65=60+y,解得

y=5,又它們的平均值相等,所以15×[56+62+65+74+(70+x)]=15×(59+61+67+65+78),解得x=3.[答案] A[解題技法] 莖葉圖的應用莖葉圖通常用來記錄兩位數的數據,可以用來分析單組數據,也可以用來比較兩組數據.通過莖葉圖可以確定數據的中位數,數據大致集中在哪個莖,數據是否關于該莖對稱,數據分布是否均勻等.給定兩組數據的莖葉圖,比較數字特征時,“重心”下移者平均數較大,數據集中者方差較小.[題組訓練]1.在如圖所示一組數據的莖葉圖中,有一個數字被污染后模糊不清,但曾計算得該組數據的極差與中位數之和為 61,則被污染的數字為 ( )A.1B.2C.3D.4解析:選B由圖可知該組數據的極差為48-20=28,則該組數據的中位數為61-28=33,易得被污染的數字為 2.2.甲、乙兩名籃球運動員 5場比賽得分的原始記錄如莖葉圖所示,若甲、乙兩人的平均得分分別為 x甲,x乙,則下列結論正確的是 ( )x甲<x乙;乙比甲得分穩定x甲>x乙;甲比乙得分穩定x甲>x乙;乙比甲得分穩定x甲<x乙;甲比乙得分穩定解析:選A因為x甲=2+7+8+16+22=11,x乙=8+12+18+21+25=16.8,所55以x甲<x乙且乙比甲成績穩定.考點二 頻率分布直方圖[典例] 某城市 100戶居民的月平均用電量 (單位:千瓦時 ),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分組的頻率分布直方圖如圖.(1)求直方圖中 x的值;(2)求月平均用電量的眾數和中位數.[解] (1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,解得x=0.0075.即直方圖中 x的值為0.0075.(2)月平均用電量的眾數是 220+240=230.2(0.002+0.0095+0.011)×20=0.45<0.5,(0.002+0.0095+0.011+0.0125)×20=0.7>0.5,∴月平均用電量的中位數在 [220,240)內.設中位數為

a,則

0.45+0.0125×(a-220)=0.5,解得

a=224,即中位數為

224.[

變透練清

]1.某校隨機抽取5為組距將數據分組為

20個班,調查各班有出國意向的人數, 所得數據的莖葉圖如圖所示.[0,5),[5,10),?,[30,35),[35,40],所作的頻率分布直方圖是 (

以)解析:選A 以5為組距將數據分組為 [0,5),[5,10),?,[30,35),[35,40],各組的頻數依次為 1,1,4,2,4,3,3,2,可知畫出的頻率分布直方圖為選項 A中的圖.2.變結論 在本例條件下,在月平均電量為 [220,240),[240,260),[260,280),[280,300]的四組用戶中,用分層抽樣的方法抽取 11戶居民,則月平均用電量在 [220,240)的用戶中應抽取________戶.解析:月平均用電量在電量在[240,260)的用戶有

[220,240)的用戶有0.0125×20×100=25(戶).同理可得月平均用15戶,月平均用電量在 [260,280]的用戶有10戶,月平均用電量在[280,300]的用戶有

5戶,故抽取比例為

11 =1.25+15+10+5 5所以月平均用電量在

[220,240)的用戶中應抽取

25×1=5(戶).5答案:53.我國是世界上嚴重缺水的國家,某市為了制定合理的節水方案,對居民用水情況進行了調查,通過抽樣,獲得了某年100位居民每人的月均用水量(單位:噸),將數據按照[0,0.5),[0.5,1),?,[4,4.5]分成9組,制成了如圖所示的頻率分布直方圖.(1)求直方圖中

a的值;(2)設該市有

30萬居民,估計全市居民中月均用水量不低于

3噸的人數,說明理由.解:(1)由頻率分布直方圖可知,月均用水量在

[0,0.5)的頻率為

0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]6

組的頻率分別為

0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估計全市居民中月均用水量不低于

3噸的人數為

3.6萬.理由如下:由(1)知,100位居民中月均用水量不低于

3噸的頻率為

0.06+0.04+0.02=0.12.由以上樣本的頻率分布,可以估計

30萬居民中月均用水量不低于

3噸的人數為

300000×0.12=36000=3.6(萬).考點三

樣本的數字特征考法(一)

樣本的數字特征與頻率分布直方圖交匯[典例]

(2019

·寧師范大學附屬中學模擬遼

)某校初三年級有

400名學生,隨機抽查了

40名學生測試 1分鐘仰臥起坐的成績 (單位:次

),將數據整理后繪制成如圖所示的頻率分布直方圖.用樣本估計總體,下列結論正確的是

(

)A.該校初三學生1分鐘仰臥起坐的次數的中位數為25B.該校初三學生1分鐘仰臥起坐的次數的眾數為24C.該校初三學生1分鐘仰臥起坐的次數超過30的人數約有80D.該校初三學生1分鐘仰臥起坐的次數少于20的人數約為8[解析]第一組數據的頻率為0.02×5=0.1,第二組數據的頻率為0.06×5=0.3,第三組數據的頻率為0.08×5=0.4,∴中位數在第三組內,設中位數為25+x,則x×0.08=0.5-0.1-0.3=0.1,∴x=1.25,∴中位數為

26.25,故

A錯誤;第三組數據所在的矩形最高,第三組數據的中間值為

27.5,∴眾數為

27.5,故

B錯誤;1分鐘仰臥起坐的次數超過

30的頻率為

0.2,∴超過

30次的人數為

400×0.2=80,故

C正確;1

分鐘仰臥起坐的次數少于20的頻率為

0.1,∴1分鐘仰臥起坐的次數少于

20的人數為

400×0.1=40,故

D錯誤.故選

C.[答案]

C[解題技法]頻率分布直方圖與眾數、中位數、平均數的關系(1)最高的小長方形底邊中點的橫坐標為眾數;(2)中位數左邊和右邊的小長方形的面積和是相等的;平均數是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和.考法(二)

樣本的數字特征與莖葉圖交匯分為

[典例]將某選手的9個得分去掉1個最高分,去掉1個最低分,7個剩余分數的平均91.現場作的9個分數的莖葉圖后來有1個數據模糊,無法辨認,在圖中以x表示,則7個剩余分數的方差為

________.[解析]由莖葉圖可知去掉的兩個數是87,99,所以87+90×2+91×2+94+90+x=21222-91)2×2]=36.91×7,解得x=4.故s=[(87-91)+(90-91)×2+(91-91)×2+(9477[答案]367[解題技法]樣本的數字特征與莖葉圖綜合問題的注意點在使用莖葉圖時,一定要觀察所有的樣本數據,弄清楚這個圖中數字的特點,不要漏掉了數據,也不要混淆莖葉圖中莖與葉的含義.(2)莖葉圖既可以表示兩組數據, 也可以表示一組數據, 用它表示的數據是完整的數據,因此可以從莖葉圖中看出數據的眾數 (數據中出現次數最多的數 )、中位數(中間位置的一個數,或中間兩個數的平均數 )等.考法(三) 樣本的數字特征與優化決策問題交匯[典例] (2018·口調研周)甲、乙兩人在相同條件下各射擊 10次,每次中靶環數情況如圖所示.(1)請填寫下表(寫出計算過程 ):平均數 方差 命中9環及9環以上的次數甲乙(2)從下列三個不同的角度對這次測試結果進行分析:①從平均數和方差相結合看 (分析誰的成績更穩定 );②從平均數和命中 9環及9環以上的次數相結合看 (分析誰的成績好些 );③從折線圖上兩人射擊命中環數的走勢看 (分析誰更有潛力 ).[解] 由題圖,知甲射擊10次中靶環數分別為 9,5,7,8,7,6,8,6,7,7.將它們由小到大排列為 5,6,6,7,7,7,7,8,8,9.乙射擊10次中靶環數分別為 2,4,6,8,7,7,8,9,9,10.將它們由小到大排列為 2,4,6,7,7,8,8,9,9,10.(1)x甲=101×(5+6×2+7×4+8×2+9)=7(環),x乙=101×(2+4+6+7×2+8×2+9×2+10)=7(環),21222221s甲=10×[(5-7)+(6-7)×2+(7-7)×4+(8-7)×2+(9-7)]=10×(4+2+0+2+4)=1.2,212222222]s乙=10×[(2-7)+(4-7)+(6-7)+(7-7)×2+(8-7)×2+(9-7)×2+(10-7)101×(25+9+1+0+2+8+9)=5.4.填表如下:平均數方差命中9環及9環以上的次數甲71.21乙75.432 2(2)①∵平均數相同, s甲<s乙,∴甲成績比乙穩定.②∵平均數相同,命中 9環及9環以上的次數甲比乙少,∴乙成績比甲好些.③∵甲成績在平均數上下波動,而乙處于上升勢頭,從第三次以后就沒有比甲少的情況發生,∴乙更有潛力.[解題技法]利用樣本的數字特征解決優化決策問題的依據平均數反映了數據取值的平均水平;標準差、方差描述了一組數據圍繞平均數波動的大小.標準差、方差越大,數據的離散程度越大,越不穩定;標準差、方差越小,數據的離散程度越小,越穩定.(2)用樣本估計總體就是利用樣本的數字特征來描述總體的數字特征.[題組訓練]1.對某商店一個月內每天的顧客人數進行統計,得到樣本的莖葉圖 (如圖所示),則該樣本中的中位數、眾數、極差分別是 ( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53解析:選A樣本共30個,中位數為45+47=46;顯然樣本數據出現次數最多的為45,2故眾數為45;極差為68-12=56,故選A.2.甲、乙、丙、丁四人參加某運動會射擊項目選拔賽,四人的平均成績和方差如下表所示:甲乙丙丁平均環數x8.38.88.88.7方差s23.53.62.25.4從這四個人中選擇一人參加該運動會射擊項目比賽,最佳人選是 ( )A.甲

B.乙C.丙

D.丁解析:選

C

由表格中數據可知,乙、丙平均環數最高,但丙方差最小,說明成績好,且技術穩定,選

C.3.某儀器廠從新生產的一批零件中隨機抽取

40個進行檢測,如圖是根據抽樣檢測得到的零件的質量

(單位:克

)繪制的頻率分布直方圖,樣本數據按照

[80,82),[82,84),[84,86),[86,88),[88,90),[90,92),[92,94),[94,96]分成8組,將其按從左到右的順序分別記為第一組,第二組,??,第八組.則樣本數據的中位數在第 ________組.解析:由題圖可得,前四組的頻率為 (0.0375+0.0625+0.0750+0.1000)×2=0.55,則其頻數為 40×0.55=22,且第四組的頻數為 40×0.1000×2=8,故中位數在第四組.答案:四[課時跟蹤檢測 ]A級1.一個頻數分布表 (樣本容量為 30)不小心被損壞了一部分, 只記得樣本中數據在 [20,60)上的頻率為 0.8,則估計樣本在 [40,60)內的數據個數為 ( )A.14

B.15C.16

D.17解析:選B 由題意,樣本中數據在 [20,60)上的頻數為 30×0.8=24,所以估計樣本在 [40,60)內的數據個數為 24-4-5=15.2.(2019長·春質檢)如圖所示是某學校某年級的三個班在一學期內的六次數學測試的平均成績y關于測試序號 x的函數圖象,為了容易看出一個班級的成績變化, 將離散的點用虛線連接,根據圖象,給出下列結論:①一班成績始終高于年級平均水平,整體成績比較好;②二班成績不夠穩定,波動程度較大;③三班成績雖然多數時間低于年級平均水平,但在穩步提升.其中正確結論的個數為 ( )A.0B.1C.2D.3解析:選D①由圖可知一班每次考試的平均成績都在年級平均成績之上,故①正確. ②由圖可知二班平均成績的圖象高低變化明顯,可知成績不穩定,波動程度較大,故②正確.③由圖可知三班平均成績的圖象呈上升趨勢,

并且圖象的大部分都在年級平均成績圖象的下方,故③正確.故選

D.3.(2018

·陽檢測貴

)在某中學舉行的環保知識競賽中,將三個年級參賽學生的成績進行整理后分為 5組,繪制如圖所示的頻率分布直方圖, 圖中從左到右依次為第一、 第二、第三、第四、第五小組,已知第二小組的頻數是 40,則成績在 80~100分的學生人數是 ( )A.15B.18C.20D.25解析:選A根據頻率分布直方圖,得第二小組的頻率是0.04×10=0.4,∵頻數是40,∴樣本容量是

40=100,又成績在

80~100

分的頻率是

(0.01+0.005)×10=0.15,∴成績在0.480~100分的學生人數是

100×0.15=15.故選

A.4.2017年

4月,泉州有四處濕地被列入福建省首批重要濕地名錄,

某同學決定從其中

A,B

兩地選擇一處進行實地考察.因此,他通過網站了解上周去過這兩個地方的人對它們的綜合評分, 并將評分數據記錄為右圖的莖葉圖,記 A,B兩地綜合評分數據的均值分別為 xA,xB,方差分別為s2A,s2B.若以備受好評為依據,則下述判斷較合理的是 ( )A.因為 xA>xB,s2A>s2B,所以應該去 A地B.因為 xA>xB,s2A<s2B,所以應該去 A地C.因為 xA<xB,s2A>s2B,所以應該去 B地D.因為 xA<xB,s2A<s2B,所以應該去 B地解析:選B 因為xA=16×(72+86+87+89+92+94)≈86.67,xB=16×(74+73+8886+95+94)=85,212+(86-86.67)22+(89-86.67)2+(92-86.67)2+(94-sA≈6[(72-86.67)+(87-86.67)86.67)2]≈50.56,21222+(86-222,sB=[(74-85)+(73-85)+(88-85)85)+(95-85)+(94-85)]=766所以xA>xB,sA2<sB2(A數據集中,B數據分散),所以A地好評分高,且評價穩定.故選B.5.(2018青·島三中期中)已知數據x1,x2,?,xn的平均數x=5,方差s2=4,則數據3x1+7,3x2+7,?,3xn+7的平均數和標準差分別為()A.15,36B.22,6C.15,6D.22,36解析:選B∵x1,x2,x3,?,xn的平均數為5,x1+x2+?+xn=5,∴3x1+3x2+?+3xn+7=3x1+x2+?+xn+7=3×5+7=22.nnn∵x1,x2,x3,?,xn的方差為4,∴3x1+7,3x2+7,3x3+7,?,3xn+7的方差是32×4=36,故數據3x1+7,3x2+7,?,3xn+7的平均數和標準差分別為22,6,故選B.6.(2018江·蘇高考)已知5位裁判給某運動員打出的分數的莖葉圖如圖所示,那么這5位裁判打出的分數的平均數為________.解析:這5位裁判打出的分數分別是89,89,90,91,91,因此這5位裁判打出的分數的平均數為89+89+90+91+91=90.5答案:907.為了了解某校高三美術生的身體狀況,抽查了部分美術生的體重,將所得數據整理后,作出了如圖所示的頻率分布直方圖.已知圖中從左到右的前3個小組的頻率之比為3∶5,第2個小組的頻數為15,則被抽查的美術生的人數是________.

1∶解析:設被抽查的美術生的人數為n,因為后2個小組的頻率之和為(0.0375+0.0125)×5=0.25,所以前3個小組的頻率之和為0.75.又前3個小組的頻率之比為1∶3∶5,第2個小組的頻數為15,所以前3個小組的頻數分別為5,15,25,所以n=5+15+25=60.0.75答案:608.某人5次上班途中所花的時間(單位:分鐘)分別為x,y,10,11,9.已知這組數據的平均數為10,方差為2,則|x-y|的值為________.解析:由題意知這組數據的平均數為10,方差為2,可得x+y=20,(x-10)2+(y-10)2=8,設x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4,所以|x-y|=2|t|=4.答案:49.某班100名學生期中考試語文成績的頻率分布直方圖如圖所示,其中成績分組區間是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求圖中a的值;(2)根據頻率分布直方圖,估計這100名學生語文成績的平均分;(3)若這100名學生語文成績某些分數段的人數(x)與數學成績相應分數段的人數(y)之比如表所示,求數學成績在[50,90)之外的人數.分數段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5解:(1)由頻率分布直方圖知 (0.04+0.03+0.02+2a)×10=1,因此a=0.005.(2)因為55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以這100名學生語文成績的平均分為 73分.(3)分別求出語文成績在分數段 [50,60),[60,70),[70,80),[80,90)的人數依次為 0.05×1005,0.4×100=40,0.3×100=30,0.2×100=20.所以數學成績分數段在 [50,60),[60,70),[70,80),[80,90)的人數依次為 5,20,40,25.所以數學成績在 [50,90)之外的人數有 100-(5+20+40+25)=10.B級1.某車間將 10名技工平均分成甲、 乙兩組加工某種零件, 在單位時間內每個技工加工的合格零件數的統

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論