2024年高考復習數學第9章第3節成對數據的統計分析_第1頁
2024年高考復習數學第9章第3節成對數據的統計分析_第2頁
2024年高考復習數學第9章第3節成對數據的統計分析_第3頁
2024年高考復習數學第9章第3節成對數據的統計分析_第4頁
2024年高考復習數學第9章第3節成對數據的統計分析_第5頁
已閱讀5頁,還剩21頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三節成對數據的統計分析

考試要求:掌握散點圖、最小二乘法思想、回歸分析以及獨立性檢驗.

-------※必備知識-回顧教材重“四基—

一、教材概念-結論-性質重現

1.相關關系

兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,

這種關系稱為相關關系.

2.散點圖

將各數據在平面直角坐標系中的對應點畫出來,得到表示兩個變量的一組數據的

圖形,這樣的統計圖叫做地在圖.利用散點圖,可以判斷兩個變量是否相關,相

關時是正相關還是負相關.

3.正相關和負相關

⑴正相關:如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈

現增加的趨勢,我們就稱這兩個變量正相關.

⑵負相關:如果當一個變量的值增加時,另一個變量的相應值呈現減少的趨勢,

則稱這兩個變量質相關.

微提醒■■■

相關關系與函數關系的區別與聯系

(1)相同點:兩者均是指兩個變量的關系.

(2)不同點:①函數關系是一種確定的關系,相關關系是一種非確定的關系.

②函數關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系.

4.線性相關和非線性相關

⑴一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附

近,我們就稱這兩個變量線性相關.

(2)一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變

量非線性相關或曲線相關.

5.樣本相關系數一

變量x和變量y的樣本相關系數r的計算公式如下:「=

他尸[三)"自5T)2

微提醒■■■

(1)當,>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關;當廣

=0時,稱成對樣本數據間沒有線性相關關系.

⑵樣本相關系數r的取值范圍為[-1,1];當|r|越接近1時,成對樣本數據的線

性相關程度越強;當仍越接近。時,成對樣本數據的線性相關程度越弱.

6.一元線性回歸模型

Y=h'Y-4-cip

我們稱-,為丫關于x的一元線性回歸模型,其中丫稱為因變

(E(e)=0,D(e)=a2

量或響應變量,x稱為自變量或解釋變量;。和人為模型的未知參數,。稱為截

距參數,〃稱為斜率參數;e是丫與法+。之間的隨機誤差.

7.線性回歸方程與最小二乘法

回歸直線方程過樣本點的中心(后刃,是回歸直線方程最常用的一個特征.

我們將夕=以+8稱為y關于工的經驗回歸方程,也稱經驗回歸函數或經驗回歸

公式,其圖形稱為經驗回蚪直線.這種求經驗回歸方程的方法叫做最小二乘法,

E(a-,-xXyi-y)Sx.y,~nxy

求得的6,6叫做〃,。的最小二乘估計,共中f2’

31,一】

a=ybx.

8.刻畫回歸效果的方式

(1)殘差圖法:作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或

體重估計值等,這樣作出的圖形稱為殘差圖.若殘差點比較均勻地落在水平的帶

狀區域內,帶狀區域越窄,則說明擬合效果越好.

(2)殘差平方和法:殘差平方和

。,廠%)2,殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果

越差.

9.獨立性檢驗

(1)臨界值/統計量也可以用來作相關性的度量,片越小說明變量之間越獨立,

片越大說明變量之間越相關,片=房鬻怒訴.忽略戶的實際分布與該近

似分布的誤差后,對于任何小概率值a,可以找到相應的正實數以,使得P(£2口)

=。成立,我們稱此為a的臨界值,這個臨界值就可作為判斷廣大小的標準.

(2)基于概率值a的檢驗規則:

當爐2刈時,我們就推斷從)不成立,即認為X和丫不獨立,該推斷犯錯誤的概

率不超過a;當時,我們沒有充分證據推斷法不成立,可以認為X和y

獨立.

這種利用爐的取值推斷分類變量X和y是否獨立的方法稱為X2獨立性檢驗,讀

作“卡方獨立性檢驗”,簡稱獨立性檢驗.

二、基本技能-思想-活動經驗

1.判斷下列說法的正誤,對的畫“J”,錯的畫“X”.

(1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關關系.

(J)

(2)通過經驗回歸方程夕=&+6可以估計預報變量的取值和變化趨勢.(V)

(3)經驗回歸方程夕=提+6中,若4<0,則變量x和),負相關.(X)

(4)因為由任何一組觀測值都可以求得一個經驗回歸方程,所以沒有必要進行相

關性檢驗.(X)

2.(多選題)關于回歸分析,下列說法正確的是()

A.在回歸分析中,變量間的關系若是非確定性關系,那么因變量不能由自變量

唯一確定

B.線性相關系數可以是正的也可以是負的

C.在回歸分析中,如果戶=1或廠=±1,說明x與),之間完全線性相關

D.樣本相關系數/?£(—1,1)

ABC解析:選項D中,樣本的相關系數應滿足一故D錯誤,ABC都

正確.

3.以下四幅散點圖所對應的樣本相關系數的大小關系是()

35

30

25

20

15

10

5

0

(1)樣本相關系數為Q

5

0

5

0

5

0

5

0

O5

1015202530

(3)樣本相關系數為〃

35

30

25

20

15

10

5\

0

05101520253035

(4)樣本相關系數為匕

A.r\>n>n>r4B.r4>ry>n>r\

C.n>n>r4>r2D.r\>r2>r4>n

C解析:由散點圖的特征可知,(1)(3)為正相關,(2)(4)為負相關,所以n>0,

/3>0,r2V0,r4<0.

又(1)(2)中的散點更為集中,更接近于一條直線,故f2<T4,

所以/^</-4<0<r3<n.

4.高二第二學期期中考試,按照甲、乙兩個班學生的數學成績優秀和及格統計

人數后,得到如下列聯表:

優秀及格合計

甲班113445

乙班83745

合計197190

則隨機變量好的值約為()

A.0.600B.0.828

C.2.712D.6.004

A解析:根據列聯表中的數據,可得f=-*8=0600.故選A.

5.若變量),與x的非線性回歸方程是9=2或一1,則當夕的值為2時,x的估計

值為.

-解析:由24一1=2,得x=2,即x的估計值為3

444

--------、關鍵能力?研析考點強“四翼7----------------

考點1相關關系的判斷—基礎性

「多維訓練」

1.有以下五組變量:

①某商品的銷售價格與銷售量;②學生的學籍號與學生的數學成績;③堅持每天

吃早餐的人數與患胃病的人數;④氣溫與冷飲箱售量;⑤電瓶車的重量和行駛每

千米的耗電量.

其中兩個變量成正相關的是()

A.①③B.②④

C.②⑤D.④⑤

D解析:對于①,一般情況下,某商品的銷售價格與銷售量成負相關關系;對

于②,學生的學籍號與學生的數學成績沒有相關關系;對于③,一般情況下,堅

持每天吃早餐的人數與患胃病的人數成負相關關系;對于④,一般情況下,氣溫

與冷飲銷售量成正相關關系;對于⑤,一般情況下,電㈱車的重量和行駛每千米

的耗電量成正相關關系.綜上所述,其中兩個變量成正相關的序號是④⑤.

2.兩個變星的相關關系有①正相關、②負相關、③不相關,則下列散點圖從左

到右分別反映的變量間的相關關系是()

A.①②③B.②③①

C.②①③D.①③②

D解析:對于(1),圖中的點成帶狀分布,且從左到右上升,是正相關關系;對

于(2),圖中的點沒有明顯的帶狀分布,是不相關的;對于(3),圖中的點成帶狀分

布,且從左到右是下降的,是負相關關系.

解題通法

忽視散點圖的結構特點導致錯誤

(1)兩個變量具有正相關關系時,其散點圖是從左下方到右上方的直線附近;

(2)兩個變量具有負相關關系時,其散點圖是左上方到右下方的直線附近.

考點2一元線性回歸模型及其應用——基礎性

「典例引領」

考向1線性回歸分析

例U*維尼綸纖維的耐熱水性能的好壞可以用指標“縮醛化度”y來衡量,這個

指標越高,耐熱水性能也越好.而甲醛濃度是影響縮醛化度y(克分子%)的重要因

素,在生產中常用甲醛濃度Mg/L)去控制這一指標,為此必須找出它們之間的關

系.現安排一批實驗,獲得如下數據:

甲醛濃度

18202224262830

Mg/L)

縮醛化度),

26.8628.3528.7528.8729.7530.0030.36

(克分子%)

(I)畫散點圖,并判斷成對樣本數據是否線性相關;

(2)求樣本相關系數r(精確到0.01),并通過樣本相關系數判斷甲醛濃度與縮解化

度的相關程度和變化趨勢的異同.

解:(1)畫出散點圖如圖所示.

縮解化度),/克分于%

30???

28

26

18202224262830

甲醛濃度或(g/L)

由散點圖可以看出,成對數據呈現出相關關系.

(小2\)_x=—168=2_4.,y_=2^02.—94

1=1

=4900.16,

£7蠟

i=l

=4144,

7

i=l

x5892,

T

r49OO.16-7X24X^^

2A—Try

所以r=2

(4144-7X24)X[S892-7X(^^)]

IE",,)'I可

由此推斷,甲醛濃度與縮醛化度正線性相關,即甲酸濃度與縮酹化度有相同的變

化趨勢,且相關程度很強.

解題通法

解這類問題先畫出散點圖,利用散點圖觀察兩個變量之間的關系,若兩個變量具

有相關關系,再利用樣本相關系數r進行進一步的判斷.

考向2非線性回歸分析

例?."紅鈴蟲是棉花的主要害蟲之一,其產卵數與溫度有關.現收集到一只紅鈴

蟲的產卵數),(個)和溫度M℃)的8組觀測數據,制成圖1所示的散點圖.現用兩

種模型①?勿(。>0,Q0),②jucf+d分別進行擬合,由此得到相應的非

線性回歸方程并進行殘差分析,進一步得到圖2所示的殘差圖.

根據收集到的數據,計算得到如下值:

88

2a-x)2W9f

XZt

i=li=l

252.89646168422688

88

W(4.刃2(%-y)

i=li=l

(劉一£)

48.4870308

表中zi=lny;z—\

8

8

t=l

2=1

8

i=l

(1)根據殘差圖,比較模型①,②的擬合效果,應選擇哪個模型?請說明理由.

(2)根據(1)中所選擇的模型,求出y關于x的非線性經驗回歸方程(計算過程中四

舍五入保留兩位小數),并求溫度為35°C時,產卵數),的預報值.

參考數據:e56,^273,?510=299,e579^327.

’產卵數W個

I140-

I120-*

60-

40-?

20■?

C1..........r

°182022242628303234溫度打七

圖⑴產卵數散點圖

殘差

30-----------------------------

20—K-------------------------------------------r——

昌20夯、冬26方芯電34溫總f

-10-------------------*—1——

-20----------------------------

-30---------------------------

一模型①…一模瑯②

圖⑵兩種模型的殘差圖

解:(1)應該選擇模型①.

理由:模型①殘差點比較均勻地落在水平的帶狀區域中,且帶狀區域的寬度比模

型②帶狀寬度窄,所以模型①的擬合精度更高,回歸方程的預報精度相應就會越

高.故選模型①比較合適.

⑵由⑴知,選用模型①,y=a,b\將兩邊取對數,得lny=(lnZ?)x+lna

令z=lny,z與溫度x可以用經驗回歸方程來擬合,

2(肛—Z)(Zi—z)

則z=(ln6)x+lna,ln6=上―---------------=竺&0.29,

168

,一】

Ina=z-xln/?=2.89~0.29X25=-4.36.

于是有ln>>=0.29x-4.36,

所以產卯數y關于溫度x的非線性經驗回歸方程為y=e°2%436.

當x=35時,),=e029X35-4.36=e5.7%327(個),

所以,在氣溫在35°C時,一個紅鈴蟲的產卵數的預報值為327個.

解題通法

非線性回歸分析的解題步驟

根據原始數據(XJ)作出散點圖

根據散點圖,選擇恰當的擬合函數

作恰當的變換,將其轉化成線性函

數,求經臉回歸方程

在上面的底礎上通過相應的變換,

即可拜非戲&經驗何歸方程

多維訓練

某種昆蟲的日產卵數和時間變化有關,現收集了該昆蟲第1天到第5天的日產卵

數據:

第X天12345

日產卵數M個)612254995

對數據初步處理后得到了如圖所示的散點圖和表中的統計量的值.

xi555

i如W?」n%)

i=li=li=l4=1

155515.9454.75

(1)根據散點圖,利用計算機模擬出該種昆蟲日產卵數),關于X的經驗回歸方程

為),=e,+叫其中e為自然對數的底數),求實數小力的值(精確到0.1).

(2)根據某項指標測定,若日產卵數在區間(e6,e、上的時段為優質產卵期.利用

(1)的結論,估計在第6天到第10天中任取2天,其中哈有1天為優質產卵期的

概率.

解:⑴因為),=*限,兩邊取自然對數,得nv=a+bx.

令z?=lny,得

54.75-5X警X及棄693八/cc

因為加=S5——=0,693,

所以尻0.7.

因為6=五-8沅=*-0.7X3=1.088,

所以gl.l,即gl.l,加0.7.

(2)根據(1)得y=cl.l^.7x

由e6<eL,+0-7x<e8,

得7V」V號

所以在第6天到第10天中,第8,9天為優質產卵期.

從第6天到第10天中任取2天的所有可能結果有(6,7),(6,8),(6,9),(6,

10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10),共10種.

其中恰有1天為優質產卵期的有(6,8),(6,9),(7,8),(7,9),(8,10),(9,

10),共6種.

設從第6天到第10天中任取2天,其中恰有1天為優質產卵期的事件為A,

則P(A)=?

所以從第6天到第10天中任取2天,其中恰有1天為優質產卵期的概率為,

3

考點3殘差分析---應用性

「典例引領」

例?,近年來,中國電影市場蓬勃發展,連創票房奇跡,各地陸續新增了許多影

院.某市新開業的一家影院借助舒適的環境和較好的觀影體驗吸引越來越多的人

前來觀影,該影院的相關負責人統計了剛開業7天內每一天前來觀影的人次,用

(1)該影院的相關負責人分別用兩種模型①y—a+Zu,②y—c?/(c,〃為大丁零

的常數)進行擬合,得到相應的經驗回歸方程并進行殘差分析,得到如圖所示的

殘差圖.根據殘差圖,比較模型①、②的擬合效果,應選擇哪個模型?(給出判斷

即可,不必說明理由)

(2)根據(1)的判斷結果求y關于x的經驗回歸方程,并預測該影院開業第8天前

來觀影的人次.

參考數據:

77

X

y2仙

i=li=l

41354704140

(3)根據(1)選擇的模型按照某項指標測定,當殘差J時,則稱當天為

觀影正常日,反之則稱為“非觀影正常日”.若從該影院開業的這7天中任選3

天進行進一步的數據分析,求這3天中含“非觀影正常日”的概率.

解:(1)應該選擇模型①.

(2)因為+

7

i=l

=4704,x=4,

7

i=l

=140,產=16,

—nxy

4704-7X4X135

所以B=33,

140-7X16

把樣本數據中心點(4,135)代入9=4+RV,得式=3,

所以y關于x的經驗回歸方程為『=3+33占

把x=8代入上式得夕=3+33X8=267,

故該影院開業第8天前來觀影的人次為267.

(3)從殘差圖易知,7天中有5天為“觀影正常日”,記這5天為1,2,3,4,5,

2天“非觀影正常日”為a,b,

所以從7天中選出3天的種數分三類:①(1,2,a),(1,2,b),(1,3,a),(1,

3,b),…,(4,5,d)t(4,5,b),共(4+3+2+l)X2=20種;

②(1,2,3),(1,2,4),…,(3,4,5),共10種;

③(a,b,1),(a,b,2)-,(a,b,5),共5種,

故總種數為35種,含“非觀影正常日”的種數為25種,

所以這3天中含“非現影王常日”的概率為〃=冒=:.

解題通法

利用R2刻畫回歸效果:R[=]_q--------,R2越大,模型擬合效果越好,R2越

z(”一w

1-1

小,模型擬合效果越差.

「多維訓練J

新型冠狀病毒感染疫情發生以來,在世界各地逐漸蔓延.在全國人民的共同努力

和各級部門的嚴格管控下,我國的疫情已經得到了很好的控制.然而,小王同學

發現,每個國家在疫情發生的初期,由于認識不足和措施不到位,感染人數都會

出現快速的增長.如表是小王同學記錄的某國連續8天每日新型冠狀病毒感染確

診的累計人數.

口期代碼XI2345678

累計確診人數y481631517197122

為了分析該國累計感染人數的變化I省勢,〃、王同學分別用兩種模型:①夕

/②夕=4x+c對變量工和),的關系進行擬合,得到相應的經驗回歸方程并進行

殘差分析,殘差圖如下(注:殘差%=%一9):

經過計算得:

8

W(為_君

1=1

(?一刃=728,

8

2?")2

i=l

=42,

8

]々_刃

i=l

(_v~y)=6868,

8

W⑵-刃2

i=i

=3570,其中zi=x£,z=j

8

i=l

(l)根據殘差圖,比較模型①、②的擬合效果,應該選擇哪個模型?請簡要說明理

由.

(2)根據(I)問選定的模型求出相應的經驗回歸方程(系數均保留兩位小數).

(3)由于時差,該國截至第9天新型冠狀病毒感染確診的累計人數尚未公布.小王

同學認為,如果防疫形勢沒有得到明顯改善,在數據公布之前可以根據他在第(2)

問求出的經驗PJ歸方程來對感染人數做出預測,那么估計該地區第9天新型冠狀

病毒感染確診的累計人數足多少?

解:(1)選擇模型①,理由如下:根據殘差圖可以看出,

模型①的估計值和真實值相對比較接近,

模型②的殘差相對比較大,所以模型①的擬合效果相對較好.

(2)由(1)可知y關于x的非線性經驗回歸方程為夕

令2=『,則夕=歷+凡由所給的數據可得2=1X(1+4+9+16+25+36+49+64)

8

=25.5,

y=lx(4+8+16+31+51+71+97+122)=50,

8

B

6868,“

亡”2,

A-'

i?i

則a=y-方女50-1.92X25.5=1.04,

所以),關于x的非線性經驗回歸方程為夕=1.92?+1.04.

(3)將x=9代入非線性經驗回歸方程,可得夕=1.92X92+L04=156.56E57(人),

所以預測該地區第9天新型冠狀病毒感染確診的累計人數約為157人.

考點4列聯表與獨立性檢驗——琮合性

「典例引領」

例0,,某省進行高中新課程改革已經四年了,為了解教伸對新課程教學模式的使

用情況,某一教育機構對某學校的教師關于新課程教學模式的使用情況進行了問

卷調查.共調查了50人,其中有老教師20人,青年教師30人.老教師對新課

程教學模式贊同的有10人,不贊同的有10人;青年教師對新課程教學模式贊同

的有24人,不贊同的有6人.

(1)根據以上數據建立一個2X2列聯表.

⑵依據小概率值a=0.001,能否認為青年教師和老教師在新課程教學模式的使

用上態度有差異?

解:(1)2義2列聯表如下所示.

類別贅同不贊同合計

老教師101020

青年教師24630

合計341650

(2)零假設為M):青年教師和老教師在新課程教學模式的使用上態度沒有差異.

由公式得)=端篙翳&.963V10.828口⑼,根據小概率值段0.001的

獨立性檢驗,沒有充分證據推斷M)不成立,因此明以認為“°成立,即認為青年

老師與老年教師在新課程教學模式的使用上態度沒有差異.

解題通法

列聯表與獨立性檢驗綜合問題的求解方法及注意點

⑴利用”、求出好的值.再利用小概率。的值以及對應的臨

界值來判斷兩個事件是否有關.

(2)解題時應注苣準確詞算,不可錯用公式,準確進行比較與判斷.

「多維訓練」

(2022?鄭州期末)某電視臺在周末晚間推出一檔新的綜藝節目,為了了解節目效

果,一次節目結束后,隨機抽取了500名觀眾(其中男性300名)對節目評分(百分

制),將這300名男性觀眾的評分分組:[50,60),[60,70),(70,80),[80,90),

190,1001,得到如圖所示的頻率分布直方圖.

(1)若把評分低于70分定為“不滿意”,評分不低于70分定為“滿意”.若從

女性觀眾的評分中隨機抽取一份,“不滿意”的概率為0.3,完成下面的2X2列

聯表.

(2)根據(1)中表格的數據,米據“=0.05的獨立性檢驗,能否認為對該綜藝節目是

否滿意與性別有關?

1頻率/組距

0.()3

().025

0.02”

0.03

0.

5060708090100男性觀眾的評分

類別男性觀眾女性觀眾合計

滿意

不滿意

合計

解:(1)因為從女性觀眾的評分中隨機抽取一份,“不滿意”的概率為0.3,

所以女性觀眾不滿意的人數為0.3X200=60,則女性觀眾滿意的人數為200—60

=140.

由頻率分布首方圖可知,男性觀眾不滿意的人數為300X(0.015+0.025)X10=

120,

則男性觀眾滿意的人數為300—120=180,

故列聯表如下:

類別男性觀眾女性觀眾合計

滿意180140320

不滿意12060180

合計300200500

(2)零假設為Ho:對該綜藝節目是否滿意與性別無關.

由⑴中表格中的數據可得,?=筆黑黑煤£2!=等H5.208>3.841=XO.O5,

八320X180X300X20024

根據小概率值a=0.05的獨立性檢驗,我們推斷Ho不成立,即認為對該綜藝節

目是否滿意與性別有關,此推斷犯錯誤的概率不大于0.05.

課時質量評價(五十五)

A組全考點鞏固練

1.(多選題)在下列各圖中,兩個變量具有線性相關關系的圖是()

BC解析:A中各點都在一條直線上,所以這兩個變量之間是函數關系,不是相

關關系;B,C所示的散點圖中,樣本點成帶狀分布,這兩組變量具有線性相關

關系;D所示的散點圖中,樣本點成團狀分別,不是帶狀分布,所以這兩個變量

不具線性相關關系.綜上,具有線性相關關系的是B和C.

2.色差和色度是衡量毛絨玩具質量優劣的重要指標,現抽檢一批產品測得如下

數據:

色差工212325272931

色度y151617212223

已知該產品的色差和色度之間滿足線性相關關系,且夕=O.25X+8,現有一對測

量數據為(32,21.25),則該組數據的殘差(測量值與預洌值的差)為()

A.0.65B.0.75

C.-0.75D.0.95

B解析:樣本中心點坐標為(26,19),代入經驗回歸方程得6=12.5.所以?=0.25x

+12.5,將x=32代入,求解得到對應的預估值為20.5,因而其殘差為21.25—

20.5=0.75.故選B.

3.對兩個變量x,),進行線性相關檢驗,得線性相關系數門=0.7859,對兩個變

量〃,。進行線性相關檢驗,得線性相關系數底=-0.9568,則下列判斷正確的

是()

A.變量x與,,正相關,變量〃與。負相關,變量x與y的線性相關性較強

B.變量x與),負相關,變量〃與。正相關,變量x與y的線性相關性較強

C.變量x與),正相關,變量〃與。負相關,變量“與v的線性相關性較強

D.變量x與y負相關,變量u與v正相關,變量〃與u的線性相關性較強

C解析:由線性相關系數門=0.7859>0知x與),正相關;

由線性相關系數卷=一0.9568V0知負相關.

又|川Vg|,所以變量〃與v的線性相關性比x與),的線性相關性強.

4.為了檢測某種新藥的效果,現隨機抽取100只小白鼠進行試驗,得到如下2X2

列聯表:

未治愈治愈合計

服用藥物104050

未服用藥物203050

合計307()100

則下列說法一定正確的是()

_______n(ad-bc)2

附:£=(其中〃=a+〃+c+d).

(a+b)(c+d)(a+c)(b+d)

臨界值表:

a0.150.100.050.0250.0100.0050.001

Xa2.0722.7063.8415.0246.6357.87910.828

A.在犯錯誤的概率不超過0.05的前提下,認為“小白鼠是否被治愈與是否服用

新藥有關”

B.在犯錯誤的概率不超過0.05的前提下,認為“小白鼠是否被治愈與是否服川

新藥無關”

C.在犯錯誤的概率不超過0.005的前提下,認為“小白鼠是否被治愈與是否服

用新藥有關”

D.在犯錯誤的概率不超過0.005的前提下,認為“小3鼠是否被治愈與是否服

用新藥無關”

A解析:由列聯表中數據,計算必=若襄嚕=詈必-762,且3.841V4.762

人30x70x50x5021

<5.024,所以有95%的把握認為“小白鼠有無被感染與是否注射疫苗有關”.

5.設兩個相關變量x和),分別滿足r=i,y=23/=1,2,…,6.若相關變量

x和y可擬合為非線性經驗回歸方程9=2加氣,則當x=7時,),的估計值為()

A.32B.63

C.64D.128

C解析:令zj=log2y=L1,則

元=々1+2+3+4+5+6)=3.5,2=工(0+1+2+3+4+5)=2.5,

66

2大產,—6£1

I___________70—6X3.5X2.5

所以1,

91-6X3.52

2元一6亍2

u=z-S-x=2.5-lX3.5=~l,

所以2=x-l,即夕=2川,所以當x=7時,y=27d=64.

6.在研究某高中高三年級學生的性別與是否喜歡某學科的關系時,總共調查了

N個學生(N=100/〃,wGN"),其中男女學生各半,男生中60%表示喜歡該學科,

其余表示小喜歡;女生中40%表示喜歡該學科,其余表示小喜歡.若在犯錯誤的

概率不超過0.001的前提下,認為性別與是否喜歡該學科有關,則可以推測N的

最小值為()

附.丫2=______n(ai)2______

?人(a+b)(c+d)(a+c)(b+d)

a0.0500.0100.001

Xa3.8416.63510.828

A.400B.300

C.200D.100

B解析:設男、女學生的人數分別為50,〃,50〃?,建立2X2列聯表如下:

喜歡課程不喜歡課程合計

男生30m20m50/〃

女生20/7?30/775072/

合計50m506100/7?

2_100mx(30mx30m-20mx20m)2_

50mx50mx50mx507n

由題意可得,4m>10.828,解得〃>2.707,

又,〃£N*,所以〃7=3,N=300.故選B.

7.下列說法:①分類變量4與8的隨機變量尤越大,說明“A與B有關系”的

可信度越大;②以模型丁=。m'.去擬合一組數據時,為了求出經驗P1歸方程,設z

=lny,將其變換后得到線性方程z=0.3x+4,貝Uc,k的值分別是e,和0.3;③

在殘差圖中,殘差點分布的帶狀區域的寬度越狹窄,其模型擬合的精度越高;④

若變量x和y滿足關系y=-0.1x+l,且變量y與z正相關,則x與z也正相關,

正確的個數是.

3解析:對于①,根據獨立性原理知,分類變量4與8的隨機變量必越大,說

明“A與8有關系”的可信度越大,所以①正確;

對于②,根據線性回歸模型和對數的運算性質知,以模型y=ce辰去擬合一組數

據時,為了求出經驗回口方程,設z=l”,將其變換后得到經驗回以方程二=().3x

+4,則c,火的值分別是e“和。.3,所以②正確;

對于③,利用殘差分析模型擬合效果時,在殘差圖中,殘差點分布的帶狀區域的

寬度越狹窄,其模型擬合的精度越高,所以③正確;

對于④,若變量x和y滿足關系》=-0.£+1,且變量y與Z正相關,則X與Z

是負相關,所以④錯誤.

綜上,正確命題的序號是①②③,共3個.

8.某醫療研究所為了檢驗某種血清預防感冒的作用,把500名使用血清的人與

另外500名未用血清的人一年中的感冒記錄作比較,提出零假設兒:“這種血

消不能起到預防感冒的作用”,利用2X2列聯表計算得為2a3.918,經查對臨界

值表知P(必23.841)比0.05.則下列結論中,正確結論的序號是_______.

①在犯錯誤的概率不超過0.05的前提下認為“這種血清能起到預防感冒的作

用”;②若某人未使用該血清,則他在一年中有95%的可能性得感冒;③這種血

清預防感冒的有效率為95%;④有95%的把握認為這種血清不能起到預防感冒

的作用.

①解析:因為產=3.918>3.841,

所以對于①,在犯錯誤的概率不超過5%的前提下認為“這種血清能起到預防感

冒的作用”,故①正確;

對于②,若某人未使用該血清,不能說“他在一年中有95%的可能性得感冒”,

故②錯誤;

對于③,這種血清有95%的可能性預防感冒,不是有效率為95%,故③錯誤;

對于④,有95%的把握認為這種血清能起到預防感冒的作用,故④錯誤.

9.為了調杳某地區中學生是否喜歡踢足球,用簡單隨機抽樣的方法從該地區調

查了500名學生,調查結果如下:

項目男女合計

喜歡踢足球40V70

不喜歡踢足球X270Z

合計500

⑴求x,y,z的值;

⑵依據小概率值a=0.01的獨立性檢驗,能否認為該地區的中學生是否喜歡踢足

球與性別有關?

解:(1)由列聯表可得,>'=70-40=30,z=500—70=430,所以工=430—270=

160.

(2)零假設為M):該地區的中學生是否喜歡踢足球與性別無關.由列聯表中的數

據可得,X2=500X(40X270—160X30)->9.9668>6.635=xo.oi

70x430x200x300

根據小概率值a=0.01的獨立性檢臉,我們推斷M)不成立,即認為該地區的中

學生是否喜歡踢足球與性別有關,此推斷犯錯誤的概,率不大于0.01.

10.(2022?中衛一模)醫學中判斷男生的體重是否超標有一種簡易方法,就是用

一個人身高的厘米數減去105所得差值即為該人的標準體重.比如身高175cm

的人,其標準體重為175—105=70kg,一個人實際體重超過了標準體重,我們

就說該人體重超標了.已知某班共有30名男生,從這30名男生中隨機選取6名,

其身高和體重的數據如表所示:

編號123456

身高x(cm)165171160173178167

體重y(kg)606362707158

(1)從這6人中任選2人,求恰有1人體重超標的概率:

(2)依據上述表格信息,用最小二乘法求出了體重y對身高x的經驗回歸方程:y

=0.65x+a,但在用經驗回歸方程預報其他同學的體重時,預報值與實際值吻合

不好,需要對上述數據進行殘差分析,按經驗,對殘差在區間[-3.5,3.5]之外的

同學要重新采集數據.上述隨機抽取的編號為3,4,5,6的四人中,有哪幾位

同學要重新采集數據?

參考公式:殘差擊=>7—6為一%.

解:(1)由圖表可知,編號1的標準體重為165—1()5=60;

編號2的標準體重為171—105=66;

編號3的標準體重為160—105=55:

編號4的標準體重為173—105=68;

編號5的標準體重為178-105=73;

編號6的標準體重為167-105=62.

故編號3,4兩人體重超標,故從6人中任取兩人有髭=15種取法,恰有一人體

重超標共有瑪禺=8種情況,

故片總

(2)x=-X(1654-171+1604-1734-178+167)=169,

6

尸工X(60+63+62+70+71+58)=64,

6

因為經驗回歸直線必過樣本中心(169,64),所以64=0.65X169+6,解得a=一

45.85,

則夕=0.65x-45.85.

殘差分析:

邑=62—0.65X160+45.85=3.85;

e4=70-0.65X173+45.85=3.4;

€5=71-0.65X178+45.85=1.15;

66=58-0.65X167+45.85=-4.7.

故3號、6號需要重新采集數據.

B組新高考培優練

11.針對當下的“讀書熱”,某大學對“學生性別和喜歡讀書是否有關”做了一

次調查,隨機調查了4()名男生和50名女生,經統計得到如下的2X2列聯表:

喜歡不喜歡合計

男a19

女38b

合計

則a-b=()

A.9B.10

C.11D.12

A解析;々=40-19=21,8=50-38=12,所以。-4=9.故選A.

12.為了研究某校男生的腳長x(單位:cm)和身高),(單位:cm)的關系,從該校隨

機抽取20名男生,根據測量數據的散點圖可以看出),與X之間有線性相關關

系.設y關于x的經驗回歸方程為9=旅+優已知

20

W項=460,

i=i

20

A,

i=l

=3240,6=4,該校某男生的腳長為25.5cm,據此估計其身高為()

A.164cmB.168cm

C.172cmD.176cm

C解析:£=翳=23,9=磴^=162,所以162=4X23+。,解得6=70.

所以經驗回歸方程為9=41+70,當x=25.5時,),=172.故選C.

13.福建省采用“3+1+2”新高考模式,其中“3”為全國統考科目語文、數學

和外語;“1”為考生在物理和歷史中選擇一門;“2”為考生在思想政治、地理、

化學和生物四門中再選擇兩門.某中學調查了高一年級學生的選科傾向,隨機抽

取200人,其中選考物理的120人,選考歷史的80人,統計各選科人數如表:

選擇科目

思想政治地理化學生物

選考類別

物理類35509065

歷史類50453035

則下列說法正確的是()

附.什_____

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論