2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第1頁(yè)
2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第2頁(yè)
2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第3頁(yè)
2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第4頁(yè)
2025年高考數(shù)學(xué)一輪復(fù)習(xí)講義:成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三節(jié)成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析

第1課時(shí)變量間的相關(guān)關(guān)系及回歸模型

課標(biāo)解讀考向預(yù)測(cè)

1.結(jié)合具體實(shí)例,了解一元線性回歸模型的含

預(yù)計(jì)2025年高考,變量間的相關(guān)關(guān)系、回歸

義,了解模型中參數(shù)的統(tǒng)計(jì)意義,了解最小

模型主要以應(yīng)用題的方式出現(xiàn),需要在復(fù)雜

二乘原理,掌握一元線性回歸模型中參數(shù)的

的題目描述中找出數(shù)量關(guān)系,建立數(shù)學(xué)模型,

最小二乘估計(jì)方法,會(huì)使用相關(guān)的統(tǒng)計(jì)軟件.

并且運(yùn)用數(shù)學(xué)模型解決實(shí)際問(wèn)題,考查分析

2.針對(duì)實(shí)際問(wèn)題,會(huì)用一元線性回歸模型進(jìn)行

問(wèn)題和處理數(shù)據(jù)的能力.

預(yù)測(cè).

必備知識(shí)——強(qiáng)基礎(chǔ)

知識(shí)梳理

1.變量的相關(guān)關(guān)系

(1)相關(guān)關(guān)系

兩個(gè)變量有關(guān)系,但又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)系稱

為相關(guān)關(guān)系.

⑵散點(diǎn)圖

將各數(shù)據(jù)在平面直角坐標(biāo)系中的對(duì)應(yīng)點(diǎn)畫出來(lái),得到表示兩個(gè)變量的一組數(shù)據(jù)的圖形,這樣

的圖形叫做回散點(diǎn)圖.利用散點(diǎn)圖,可以判斷兩個(gè)變量是否相關(guān),相關(guān)時(shí)是正相關(guān)還是負(fù)

相關(guān).

⑶正相關(guān)和負(fù)相關(guān)

①當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)增加的趨勢(shì),我們就稱這兩個(gè)變量畫

正相關(guān).

②負(fù)相關(guān):當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)減小的趨勢(shì),則稱這兩個(gè)變量

廚負(fù)相關(guān).

(4)線性相關(guān)

①一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在畫一條直線附近,我

們就稱這兩個(gè)變量線性相關(guān).

②一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量非線性相

關(guān)或曲線相關(guān).

2.樣本相關(guān)系數(shù)

(1)相關(guān)系數(shù)r的計(jì)算

變量尤和變量y的樣本相關(guān)系數(shù)r的計(jì)算公式如下:

z孫一,龍y

___________________________

―r>iz_r'i二

A/Z焉fx2yZy—ny2

(2)相關(guān)系數(shù)r的性質(zhì)

①當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)畫歪相關(guān);當(dāng)K0時(shí),稱成對(duì)樣本數(shù)據(jù)畫負(fù)相關(guān);當(dāng)r=0

時(shí),成對(duì)樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.

②樣本相關(guān)系數(shù)r的取值范圍為畫「一1,11.

當(dāng)川越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越畫強(qiáng);

當(dāng)卜|越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越畫弱.

3.一元線性回歸模型

經(jīng)驗(yàn)回歸方程與最小二乘法

我們將£=源+)稱為y關(guān)于X的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形

AA

稱為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的b,。叫做6,a的最

小二乘估計(jì),其中

<n——n__

Z%)(%—y)y,xzyz—nTTV

b=J——z-----------------------=回^~~—.

qZ(即-x)2y,^~nx~-

i=l尸]

A—A——

<a=y—bx.

4.殘差與殘差分析

_____A

(1)殘差:對(duì)于響應(yīng)變量匕通過(guò)觀測(cè)得到的數(shù)據(jù)稱為萬(wàn)口觀測(cè)值,通過(guò)經(jīng)驗(yàn)回歸方程得到的y

稱為何預(yù)測(cè)值,向觀測(cè)值減去畫預(yù)測(cè)值稱為殘差.

(2)殘差分析:殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過(guò)對(duì)殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,

以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.

(3)刻畫回歸效果的方式

①殘差圖法

作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)為自變量無(wú),這樣作出的圖形稱為殘差圖.在殘差圖中,殘差

點(diǎn)比較均勻地分布在以取值為0的橫軸為對(duì)稱軸的水平的帶狀區(qū)域內(nèi),說(shuō)明選用的模型比較

合適,這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高.

②殘差平方和法

nA_____

殘差平方和為2⑴一加2,殘差平方和回越小,模型擬合效果越好.

③利用決定系數(shù)F刻畫回歸效果

nA

X(M—8)2

R2=l—彳-----二一,改越回大,模型擬合效果越好;R2越回小,模型擬合效果越差.

23一y產(chǎn)

常用

八/\--

1.求解經(jīng)驗(yàn)回歸方程的關(guān)鍵是確定回歸系數(shù)a,b,應(yīng)充分利用回歸直線過(guò)點(diǎn)(x,y).

2.根據(jù)經(jīng)驗(yàn)回歸方程計(jì)算的;值,僅是一個(gè)預(yù)測(cè)值,不是真實(shí)發(fā)生的值.

診斷自測(cè)

1.概念辨析(正確的打“小,錯(cuò)誤的打“X”)

AAAA

(1)經(jīng)驗(yàn)回歸方程中,若〃<0,則變量%和y負(fù)相關(guān).()

AAA

(2)經(jīng)驗(yàn)回歸直線至少經(jīng)過(guò)點(diǎn)(xi,yi),⑴,yi),(xn,y”)中的一個(gè)點(diǎn).()

(3)樣本相關(guān)系數(shù)的絕對(duì)值越接近1,成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng).()

(4)殘差平方和越大,線性回歸模型的擬合效果越好.()

答案(l)x(2)x(3)4(4)x

2.小題熱身

(1)甲、乙、丙、丁四位同學(xué)在建立變量尤,y的回歸模型時(shí),分別選擇了4種不同模型,計(jì)

算可得它們的F分別如下表:

X甲乙丙T

R20.980.780.500.85

建立的回歸模型擬合效果最好的是()

A.甲B.乙

C.丙D.丁

答案A

解析此越大,表示回歸模型的擬合效果越好.

(2)某校一個(gè)課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單位:。C)的關(guān)系,在20個(gè)

不同的溫度條件下進(jìn)行種子發(fā)芽實(shí)驗(yàn),由實(shí)驗(yàn)數(shù)據(jù)(如y;)0=l-2,20)得到下面的散點(diǎn)

0%

8%

發(fā)

6%

率4%

2%

O

由此散點(diǎn)圖,在10℃至40℃之間,下面四個(gè)回歸方程類型中,最適宜作為發(fā)芽率〉和溫度

尤的回歸方程類型的是()

A.y=a~\~bxB.y=a+Z?x2

C.y—a-\~bexD.y—a^rblnx

答案D

解析由散點(diǎn)圖分布可知,散點(diǎn)圖分布在一個(gè)對(duì)數(shù)型函數(shù)圖象的附近,因此最適宜作為發(fā)芽

率y和溫度x的回歸方程類型的是y=a+blnx.故選D.

(3)(人教A選擇性必修第三冊(cè)復(fù)習(xí)參考題8T2改編)在一元線性回歸模型Y^bx+a+e中,下

列說(shuō)法正確的是()

A.y=Zzx+a+e是一次函數(shù)

B.響應(yīng)變量Y是由解釋變量x唯一確定的

c.響應(yīng)變量y除了受解釋變量尤的影響外,可能還受到其他因素的影響,這些因素會(huì)導(dǎo)致

隨機(jī)誤差e的產(chǎn)生

D.隨機(jī)誤差e是由于計(jì)算不準(zhǔn)確造成的,可通過(guò)精確計(jì)算避免隨機(jī)誤差e的產(chǎn)生

答案C

解析對(duì)于A,一元線性回歸模型Y=bx+a+e中,方程表示的不是確定性關(guān)系,因此不是

一次函數(shù),所以A錯(cuò)誤;對(duì)于B,響應(yīng)變量y不是由解釋變量X唯一確定的,所以B錯(cuò)誤;

對(duì)于c,響應(yīng)變量y除了受解釋變量X的影響外,可能還受到其他因素的影響,這些因素會(huì)

導(dǎo)致隨機(jī)誤差e的產(chǎn)生,所以C正確;對(duì)于D,隨機(jī)誤差是不能避免的,只能將誤差縮小,

所以D錯(cuò)誤.

(4)若某商品的廣告費(fèi)支出x(單位:萬(wàn)元)與銷售額M單位:萬(wàn)元)之間有如下表所示的對(duì)應(yīng)數(shù)

據(jù):

X24568

y2040607080

AA

根據(jù)表中數(shù)據(jù),利用最小二乘法求得y關(guān)于x的經(jīng)驗(yàn)回歸方程為y=6尤+1.5,當(dāng)廣告費(fèi)支出

為10萬(wàn)元時(shí),銷售額的估計(jì)值為萬(wàn)元.

答案106.5

—1—1

解析X=§x(2+4+5+6+8)=5,y=m<(20+40+60+70+80)=54,所以樣本中心為(5,

AAAA

54),將其代入經(jīng)驗(yàn)回歸方程y=6x+1.5中,有54=56+1.5,解得6=10.5,所以經(jīng)驗(yàn)回歸方

AA

程為y=10.5x+1.5,當(dāng)x=10時(shí),10.5x10+1.5=106.5.

考點(diǎn)探究一提素養(yǎng)

考點(diǎn)一變量間相關(guān)關(guān)系的判斷

例1(1)對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其樣本相關(guān)系數(shù)的比較,正確

的是()

-~~~~~o1~~~~-~

51015202530355101520253035

樣本相關(guān)系數(shù)為小樣本相關(guān)系數(shù)為「2

①②

101520253035101520253035

樣本相關(guān)系數(shù)為n樣本相關(guān)系數(shù)為小

③④

A.r2<-4<0<廠3<r1B.F4<r2<0<ri<r3

C.廠4<廠2〈0〈廠3<r1D.r2<「4<0<r1<-3

答案A

解析由散點(diǎn)圖知圖①與圖③是正相關(guān),故r>0,廠3>0,圖②與圖④是負(fù)相關(guān),故々<0,r4<0,

且圖①與圖②的樣本點(diǎn)集中在一條直線附近,因此尸2<廠4<0<廠3<小

⑵(2023?河北邢臺(tái)階段考試)已知廠1表示變量X與y之間的線性相關(guān)系數(shù),廠2表示變量。與V

之間的線性相關(guān)系數(shù),且ri=0.837,72=一0.957,則()

A.變量x與y之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性強(qiáng)于u與丫之間的相關(guān)性

B,變量x與y之間呈負(fù)相關(guān)關(guān)系,且x與y之間的相關(guān)性強(qiáng)于u與v之間的相關(guān)性

c.變量u與丫之間呈負(fù)相關(guān)關(guān)系,且x與丫之間的相關(guān)性弱于。與v之間的相關(guān)性

D.變量u與v之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性弱于u與丫之間的相關(guān)性

答案c

解析因?yàn)榫€性相關(guān)系數(shù)r1=0.837,廠2=—0.957,所以變量X與丫之間呈正相關(guān)關(guān)系,變量

。與丫之間呈負(fù)相關(guān)關(guān)系,且X與V之間的相關(guān)性弱于U與卜之間的相關(guān)性.故選C.

【通性通法】

判斷相關(guān)關(guān)系的方法

(1)散點(diǎn)圖法:如果樣本點(diǎn)的分布從整體上看大致在某一曲線附近,變量之間就有相關(guān)關(guān)系;

如果樣本點(diǎn)的分布從整體上看大致在某一直線附近,變量之間就有線性相關(guān)關(guān)系.

⑵樣本相關(guān)系數(shù):當(dāng)廠>0時(shí),正相關(guān);當(dāng)廠<0時(shí),負(fù)相關(guān);IH越接近于1,相關(guān)性越強(qiáng).

AA

(3)經(jīng)驗(yàn)回歸方程:當(dāng)b>0時(shí),正相關(guān);當(dāng)6<0時(shí),負(fù)相關(guān).

【鞏固遷移】

1.在一組樣本數(shù)據(jù)(尤1,J1),(尤2,>2),…,(xn,yn)(n^2,XI,X2,X”不全相等)的散點(diǎn)圖

中,若所有樣本點(diǎn)(知刈。=1,2,”)都在直線y=—5+1上,則這組樣本數(shù)據(jù)的樣本

相關(guān)系數(shù)為()

A.-1B.0

C.一;D.1

答案A

解析因?yàn)樗袠颖军c(diǎn)都在直線y=一5+1上,呈現(xiàn)完全負(fù)相關(guān),所以樣本相關(guān)系數(shù)為一1.

2.(2023?天津高考)調(diào)查某種群花萼長(zhǎng)度和花瓣長(zhǎng)度,所得數(shù)據(jù)如圖所示.其中相關(guān)系數(shù)r=

0.8245,下列說(shuō)法正確的是()

A.花瓣長(zhǎng)度和花萼長(zhǎng)度沒有相關(guān)性

B.花瓣長(zhǎng)度和花萼長(zhǎng)度呈負(fù)相關(guān)

C.花瓣長(zhǎng)度和花萼長(zhǎng)度呈正相關(guān)

D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8245

答案C

解析因?yàn)橄嚓P(guān)系數(shù)r=0.8245>0.75,所以花瓣長(zhǎng)度和花萼長(zhǎng)度的相關(guān)性較強(qiáng),并且呈正相

關(guān),所以A,B錯(cuò)誤,C正確;因?yàn)橄嚓P(guān)系數(shù)與樣本的數(shù)據(jù)有關(guān),所以當(dāng)樣本發(fā)生變化時(shí),

相關(guān)系數(shù)也可能會(huì)發(fā)生變化,所以D錯(cuò)誤.故選C.

考點(diǎn)二樣本相關(guān)系數(shù)、決定系數(shù)的應(yīng)用

例2(2022.全國(guó)乙卷)某地經(jīng)過(guò)多年的環(huán)境治理,已將荒山改造成了綠水青山,為估計(jì)一林

區(qū)某種樹木的總材積量,隨機(jī)選取了10棵這種樹木,測(cè)量每棵樹的根部橫截面積(單位:n?)

和材積量(單位:nf),得到如下數(shù)據(jù):

樣本

12345678910總和

號(hào)i

根部

橫截0.040.060.040.080.080.050.050.070.070.060.6

面積

Xi

材積

0.250.400.220.540.510.340.360.460.420.403.9

量,

101010

并計(jì)算得£蠟=0.038,2必=1,6158,2擊y=0.2474.

i=li=\i=\

(1)估計(jì)該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;

(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關(guān)系數(shù)(精確到0.01);

(3)現(xiàn)測(cè)量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和

為186nl2.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數(shù)據(jù)給出該林區(qū)這種樹

木的總材積量的估計(jì)值.

n——

£(爸一x)(%—y)

附:相關(guān)系數(shù)「=I?,

22

A/Z(尤「無(wú))Zy)

\lf=li=l

^1.896^1.377.

解(1)設(shè)這種樹木平均一棵的根部橫截面積為最,平均一棵的材積量為,,

貝?x=*=0.06,y=得=0.39.

10______

2孫一10工y

(2)廠=Iioio

\(X^-io72)(2a-10丁)

\1z=lz=lJ

____________0.2474—10x0.06x0.39__________

-4(0.038-10x0.062)x(1.6158—10x0.392)

_0.01340昨4一0.0134

40.002x0.09480.01可1.8960.01377'"

vnQQ

(3)設(shè)所有這種樹木的根部橫截面積總和為X,總材積量為Y,則5=工r,故¥=儒義186=

I——U.UO

y

1209(m3).

【通性通法】

經(jīng)驗(yàn)回歸方程的擬合效果,可以利用相關(guān)系數(shù)r判斷,當(dāng)|〃|越趨近于1時(shí),兩變量的線性相

關(guān)性越強(qiáng).或利用決定系數(shù)R2判斷,R2越大,擬合效果越好.

【鞏固遷移】

3.我國(guó)機(jī)床行業(yè)核心零部件對(duì)外依存度較高,我國(guó)整機(jī)配套的中高檔功能部件大量依賴進(jìn)口,

根據(jù)中國(guó)機(jī)床工具工業(yè)協(xié)會(huì)的數(shù)據(jù),國(guó)內(nèi)高檔系統(tǒng)自給率不到10%,約90%依賴進(jìn)口.因此,

迅速提高國(guó)產(chǎn)數(shù)控機(jī)床功能部件制造水平,加快國(guó)產(chǎn)數(shù)控機(jī)床功能部件產(chǎn)業(yè)化進(jìn)程至關(guān)重

要.通過(guò)對(duì)某機(jī)械上市公司近幾年的年報(bào)公布的研發(fā)費(fèi)用x(單位:億元)與產(chǎn)品的直接收益

M單位:億元)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),得到下表:

年份2016201720182019202020212022

234681013

y15222740485460

.A

根據(jù)數(shù)據(jù),可建立y關(guān)于x的兩個(gè)回歸模型:模型①:y=4.1x+10.9;模型②:y=21.3C—

14.4.

(1)根據(jù)表格中的數(shù)據(jù),分別求出模型①,②的決定系數(shù)代的大小(結(jié)果保留三位有效數(shù)字);

(2)(i)根據(jù)(1)選擇擬合精度更高、更可靠的模型;

(ii)若2023年該公司計(jì)劃投入研發(fā)費(fèi)用17億元,使用(i)中的模型預(yù)測(cè)可為該公司帶來(lái)多少

直接收益?

回歸模型模型①模型②

7A

Z(yi-yd279.1318.86

i=l

nA

Z2_

附:R2=I—---------=—,

Z(M—y)2

i=l

解(1)因?yàn)?/p>

-15+22+27+40+48+54+60

y=y=38,

7_

所以Z(yi-y)2=232+162+ll2+22+102+162+222=1750,

i=l

7A

E(Mf)2

則模型①的決定系數(shù)出=1一早-----二一=1一卷煉0.955,

Z⑶一…"’

z-1

7A

2(?-%)2

模型②的決定系數(shù)a=1—〒--------二一=1一號(hào)畀0.989.

Z(M一2”

/=1

(2)(i)由⑴知,豚<感所以模型②的擬合精度更高、更可靠.

AA

(ii)由經(jīng)驗(yàn)回歸方程》=21.35—14.4,可得當(dāng)x=17時(shí),y=21.3寸萬(wàn)一14.4M2.93,

所以若2023年該公司計(jì)劃投入研發(fā)費(fèi)用17億元,大約可為該公司帶來(lái)72.93億元的直接收

益.

考點(diǎn)三回歸分析(多考向探究)

考向1一元線性回歸模型

例3已知某綠豆新品種發(fā)芽的適宜溫度在6?22℃之間,一農(nóng)學(xué)實(shí)驗(yàn)室研究人員為研究溫

度x(單位:。C)與綠豆新品種發(fā)芽數(shù)y(單位:顆)之間的關(guān)系,每組選取了成熟種子50顆,分

別在對(duì)應(yīng)的8?14℃的溫度環(huán)境下進(jìn)行實(shí)驗(yàn),得到如下散點(diǎn)圖:

_7__

其中y=24,.Z,x)?-y)=70,

7_

."8-4=176.

1=1

(1)運(yùn)用相關(guān)系數(shù)進(jìn)行分析說(shuō)明,是否可以用線性回歸模型擬合y與x的關(guān)系?

AAA

(2)求出y關(guān)于x的經(jīng)驗(yàn)回歸方程并預(yù)測(cè)在19°C的溫度下,種子的發(fā)芽顆數(shù).

參考公式:相關(guān)系數(shù)

n—一

,工(汨一無(wú))(y,-y)

z^lAAAA

經(jīng)驗(yàn)回歸方程y=+其中人=

2

A/.X.(沏一無(wú))22(y,—y)

\J1=11=1

n——

卷](即一x)A_A_

z,Q=y-bx.

za-I)2

Z=1

參考數(shù)據(jù):^77-8.77.

——i

解(1)根據(jù)題意,得x=7X(8+9+10+11+12+13+14)=11.

7_

2(X,—X)2=(8-11)2+(9-11)2+(10-11)2+(11-11)2+(12-11)2+(13-11)2+(14-11)2

i=l

=28,

_7__________

2

(xz—x)X(%一>)2=^28x176=8"\/7^[70.16.

z=l

因而相關(guān)系數(shù)r=區(qū)港0998.

21(XLX)2R

由于|廠卜0.998很接近1,

,可以用線性回歸模型擬合y與x的關(guān)系.

A57

關(guān)于x的經(jīng)驗(yàn)回歸方程為y=]x—

A57

若x=19,則y=]xl9—]=44顆,

在19℃的溫度下,預(yù)測(cè)種子的發(fā)芽顆數(shù)為44.

【通性通法】

求經(jīng)驗(yàn)回歸方程的步驟

計(jì)算出手陷靖,鼻須%或

步驟一>—?_產(chǎn)

、-?.(xi-x)(y,-y),斗(即-動(dòng)2的值

1=11=1

步驟己〉—利用公式計(jì)算8,b

步驟。一寫出經(jīng)驗(yàn)回歸方程k嬴+8

【鞏固遷移】

4.(2023?安徽馬鞍山第三次教學(xué)質(zhì)量監(jiān)測(cè))為了研究某果園的一種果樹的產(chǎn)量與種植密度的關(guān)

系,某中學(xué)的數(shù)學(xué)興趣小組在該果園選取了一塊種植區(qū)域進(jìn)行了統(tǒng)計(jì)調(diào)查,他們將每株果樹

與其直線距離不超過(guò)1米的果樹株數(shù)x記為其密度,在記錄了該種植區(qū)域內(nèi)每株果樹的密度

后,從中選取密度為0,1,2,3,4的果樹,統(tǒng)計(jì)其產(chǎn)量的平均值y(單位:kg),得到如下統(tǒng)

計(jì)表:

(1)小組成員甲認(rèn)為y與尤有很強(qiáng)的線性相關(guān)關(guān)系,請(qǐng)你幫他利用最小二乘法求出y關(guān)于x的

AAA

經(jīng)驗(yàn)回歸方程y=6x+a;

⑵小組成員乙提出:若利用經(jīng)驗(yàn)回歸方程計(jì)算的平均產(chǎn)量的估計(jì)值:與實(shí)際的平均產(chǎn)量

1nA

〃€1^*)滿足/21%一訓(xùn)>。.5,則應(yīng)該修正模型,尋找更合適的函數(shù)擬合%與y的關(guān)

系.統(tǒng)計(jì)知種植密度分別為5,6的果樹的平均產(chǎn)量為5.5kg、4.4kg,請(qǐng)你以這七組數(shù)據(jù)為

依據(jù)判斷(1)中得到的經(jīng)驗(yàn)回歸方程是否需要修正?

n___

A£孫一"龍〉A(chǔ)_A_

參考公式:b=r-----——,a=y-bx.

2君一〃X2

i=l

__55_

解(l)x=2,y=11,Z%i%=93,Z焉一5%2=10,

i=l/=!

5

故~5二=1.7,。=ybx=14.4,

Z裔一5x2

i=\

A

所以經(jīng)驗(yàn)回歸方程為y=-1.7x+14.4.

AA

(2)令%=0,1,2,3,4,5,6,代入y=—1.7x+14.4,分別得|y—y|=0.6,0,7,0,0.3,0.4,

0.4,0.2,

17A?6

從而721M?一訓(xùn)=亍<0?5,故不需要修正.

考向2非線性回歸模型

例4某工廠生產(chǎn)一種產(chǎn)品,從該種產(chǎn)品中隨機(jī)抽取6件合格產(chǎn)品,測(cè)得數(shù)據(jù)如下:

尺寸x/mm384858687888

質(zhì)量y/g16.818.820.722.42425.5

(1)若按照檢測(cè)標(biāo)準(zhǔn),合格產(chǎn)品的質(zhì)量y與尺寸x之間近似滿足關(guān)系式y(tǒng)=o/(c,d為大于0

的常數(shù)),求y關(guān)于尤的經(jīng)驗(yàn)回歸方程;

(2)已知合格產(chǎn)品的收益z(單位:千元)與合格產(chǎn)品尺寸和質(zhì)量的關(guān)系為z=2y—0.32x,根據(jù)(1)

中經(jīng)驗(yàn)回歸方程分析,當(dāng)合格產(chǎn)品的尺寸x約為何值時(shí)(結(jié)果用整數(shù)表示),收益z的預(yù)報(bào)值最

大?

6666

附:①參考數(shù)據(jù):2(In燈lny?=75.3,£(lnx,)=24.6,£(lny,)=18.3,g(Inx,)2=101.4.

i=li=li=li=l

AAA

②參考公式:對(duì)于樣本⑴,⑷(i=l,2,n),其經(jīng)驗(yàn)回歸直線"=6v+a的斜率和截距的最

n一一n___

A£X(%—v)(%一u)V.77.ViU-nvuA一A——

小二乘估計(jì)公式分別為--------------------=------Z-,。=u—bv,e-2.7182.

E(均一v)2ZW—〃v2

i=li=l

解(1)對(duì)y=c/(c,d>0)兩邊取自然對(duì)數(shù)得lny=lnc+Mnx.

AAAAA

令%=lnx"Ui=lnyi,則〃=血+〃,其中〃=lnc.

根據(jù)所給統(tǒng)計(jì)量及最小二乘估計(jì)公式得

6_____

2刈的一6vu

%=氣----

Xw-6v2

Z=1

66

z(lux/)(In

6

i=\i=1

z(Inwin%)

i=l6

[Z(InXi)]2

6

£(In汨)21=1_____________

6

Z=1

75.3-24.6x18.3^60.271

101.4-24.6M=O54=2,

66

Z(Iny)Z(InXi)

AA——A

Z=1i=\18.3124.6

a=u-dVdx

66^~-5x3=1,

AAA

又〃=lnc=\,所以c=e,

A1

所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為y=e,,2

A1A

⑵由⑴得y=e「,所以z=26&-0.32x=-0.32(5)2+2班.

pA

令則當(dāng)時(shí),z取得最大值,

此時(shí)X=/U72,

所以當(dāng)合格產(chǎn)品的尺寸x約為72時(shí),收益z的預(yù)報(bào)值最大.

【通性通法】

非線性回歸分析的步驟

【鞏固遷移】

5.(2024?淄博診斷)小葉紫檀是珍稀樹種,因其木質(zhì)好備受玩家喜愛.其幼苗從觀察之日起,

第x天的高度為ycm,測(cè)得數(shù)據(jù)如下:

Xi4916253649

y0479111213

數(shù)據(jù)的散點(diǎn)圖如圖所示:

y

124

O

8

6

4

2

OO

205()

為近似描述y與尤的關(guān)系,除了一次函數(shù)y=6x+a,還有y=”5+a和>="2+。兩個(gè)函數(shù)

可選.

A

⑴從三個(gè)函數(shù)中選出“最好”的曲線擬合y與x的關(guān)系,并求出其回歸方程(b保留到小數(shù)點(diǎn)后

1位);

⑵判斷說(shuō)法“高度從1000cm長(zhǎng)到1001cm所需時(shí)間超過(guò)一年”是否成立,并給出理由.

n—一n___

Az(M-x)(y-y)^Xiyi-nxy

參考公式:b=~-----------二-------=—,-----—,

2

Z(Xz—X)Z蠟一

i=li=l

A—A—

a=y-bx.

____77

參考數(shù)據(jù)(其中%=?,%=竟):x=20,u=4,t=668,y=8,2需=4676,Z"?=140,

i=li=l

777

£方=7907396,Z]?=1567,Z〃"=283,

i=lz=li=l

7

z砂i=56575.

i=l

解(1)從散點(diǎn)圖可以看出,曲線的形狀與函數(shù)>=也相似,

故選擇函數(shù)擬合y與X的關(guān)系.

z283—7x4x859

b=140-7X42=2F2-b

A

心8—2.1義4=一0.4,

其經(jīng)驗(yàn)回歸方程為y=21G—。4

(2)將y=1000,1001分別代入經(jīng)驗(yàn)回歸方程,得2.16一0.4=1000和2.16一0.4=1001,

.「1001.41<1000.47

故X2_xi=(jrr13H45%

顯然454>365,

所以,說(shuō)法“高度從1000cm長(zhǎng)到1001cm所需時(shí)間超過(guò)一年”成立.

課時(shí)作業(yè)

A級(jí)基礎(chǔ)鞏固練

一、單項(xiàng)選擇題

1.(2024?湘豫名校模擬)根據(jù)下表樣本數(shù)據(jù):

X23456

y42.5-0.5-2-3

AAA

得到的經(jīng)驗(yàn)回歸方程為y=6x+a,貝ij()

AAAA

A.a>0,b>0B.a>0,b<0

AAAA

C.〃<0,b>0D.a<0,b<0

答案B

A—2+3+4+5+6—

解析由表中的數(shù)據(jù)可得,變量y隨著x的增大而減小,貝防<0,x=--------------------=4,>

4+25—05—2—3AAAA

=——:~~r----------=0.2,又經(jīng)驗(yàn)回歸直線丫=法+”經(jīng)過(guò)點(diǎn)(4,0.2),可得a>0.

2.甲、乙、丙、丁四位同學(xué)各自對(duì)A,8兩個(gè)變量的線性相關(guān)性做試驗(yàn),并用回歸分析的方

法分別求得樣本相關(guān)系數(shù)r與殘差平方和m,如下表:

X甲乙丙T

r0.820.780.690.85

m106115124103

則哪位同學(xué)的試驗(yàn)結(jié)果體現(xiàn)A,8兩個(gè)變量有更強(qiáng)的線性相關(guān)性?()

A.甲B.乙

C.丙D.T

答案D

解析7"的絕對(duì)值越大,機(jī)越小,線性相關(guān)性越強(qiáng).

3.(2023?河北高三校聯(lián)考期末)下列四幅殘差分析圖中,與一元線性回歸模型擬合精度最高的

是()

殘差f殘差

40040

20020.?

0

2.4-6101214觀測(cè):24,6.8町1214觀測(cè)

-200

時(shí)間????時(shí)間

-40()

B

[殘差

10004

5002?????

0;力。”打2臧測(cè)

24.6.B.10L214觀測(cè)?

-500

二?.時(shí)間1.?時(shí)間

-1000

CD

答案D

解析用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明這樣

的模型比較合適,帶狀區(qū)域的寬度越窄,說(shuō)明模型的擬合精度越高,顯然D項(xiàng)的擬合精度最

高.故選D.

人AAA

4.已知某地的財(cái)政收入x與支出y滿足經(jīng)驗(yàn)回歸方程y=bx+a+e(單位:億元),其中6=0.8,

A

a=2,|e|<0.5,如果今年該地區(qū)的財(cái)政收入為10億元,那么支出預(yù)計(jì)不會(huì)超過(guò)()

A.9億元B.10億元

C.9.5彳乙元D.10.5彳乙元

答案D

A

角星析y=0.8xl0+2+e=10+eW10.5.

5.用模型y=ceh擬合一組數(shù)據(jù)時(shí),為了求出經(jīng)驗(yàn)回歸方程,設(shè)z=lny,其變換后得到經(jīng)驗(yàn)

AA

回歸方程為z=0.5x+2,貝b=()

A.0.5B.e05

C.2D.e2

答案D

AAA

解析因?yàn)閥=ce",兩邊取對(duì)數(shù)得lny=ln(ce丘)=lnc+lne"=fcv+lnc,貝>Jz=g:+lnc,而

AAA

z=0.5x+2,于是得lnc=2,RPc=e2.

A

6.根據(jù)一組樣本數(shù)據(jù)(尤i,弘),(物》2),…,(%",%),求得經(jīng)驗(yàn)回歸方程為y=L5x+0.5,

且1=3.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個(gè)樣本點(diǎn)(1.2,2.2)和(4.8,7.8)誤差較大,去除后重新求

得的經(jīng)驗(yàn)回歸直線/的斜率為1.2,貝ij()

A.去除兩個(gè)誤差較大的樣本點(diǎn)后,y的估計(jì)值增加速度變快

B.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的經(jīng)驗(yàn)回歸直線一定過(guò)點(diǎn)(3,4)

A

C.去除兩個(gè)誤差較大的樣本點(diǎn)后,重新求得的經(jīng)驗(yàn)回歸方程為y=1.2x+L4

D.去除兩個(gè)誤差較大的樣本點(diǎn)后,樣本點(diǎn)(2,3.75)對(duì)應(yīng)的殘差為0.05

答案C

解析對(duì)于A,因?yàn)樗匀コ齼蓚€(gè)誤差較大的樣本點(diǎn)后y的估計(jì)值增加速度變慢,

故A錯(cuò)誤;對(duì)于B,當(dāng)(=3時(shí),7=3xl.5+0.5=5,設(shè)去掉兩個(gè)誤差較大的樣本點(diǎn)后,橫

坐標(biāo)的平均值為縱坐標(biāo)的平均值為3',則.二幻十二十…:即―6=加[=3,,,=

吐吐二普二12=生12=5,故B錯(cuò)誤;對(duì)于C,因?yàn)槿コ齼蓚€(gè)誤差較大的樣本點(diǎn)后,

n~2n~2

AA

重新求得經(jīng)驗(yàn)回歸直線/的斜率為1.2,所以5=3xl.2+a,解得。=1.4,所以去除兩個(gè)誤差

AA

較大的樣本點(diǎn)后的經(jīng)驗(yàn)回歸方程為y=L2尤+1.4,故C正確;對(duì)于D,當(dāng)尤=2時(shí),>=1.2x2

A

+14=3.8,y-y=3.75-3.8=—0.05,故D錯(cuò)誤.

二、多項(xiàng)選擇題

7.下列說(shuō)法中正確的是()

A.經(jīng)驗(yàn)回歸分析中,比的值越大,說(shuō)明殘差平方和越小

B.若一組觀測(cè)數(shù)據(jù)(xi,yi),(X2,y2),…,(xn,%)滿足y尸如+a+e;G=l,2,n),且

ei恒為0,則R2=i

C.經(jīng)驗(yàn)回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法

D.畫殘差圖時(shí),縱坐標(biāo)為殘差,橫坐標(biāo)一定是編號(hào)

答案ABC

解析對(duì)于A,經(jīng)驗(yàn)回歸分析中,R2的值越大,說(shuō)明模型的擬合效果越好,則殘差平方和越

小,A正確;對(duì)于B,若一組觀測(cè)數(shù)據(jù)(即,yi),(X2,>2),…,(x?,%)滿足yi=bxi+a+e^i

=1,2,…,ri),且々恒為0,則R2=I,B正確;對(duì)于C,經(jīng)驗(yàn)回歸分析是對(duì)具有相關(guān)關(guān)系

的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法,C正確;對(duì)于D,殘差圖中橫坐標(biāo)可以是樣本編

號(hào),也可以是身高數(shù)據(jù),還可以是體重的估計(jì)值等,D錯(cuò)誤.

8.下列有關(guān)經(jīng)驗(yàn)回歸分析的說(shuō)法中正確的是()

A.經(jīng)驗(yàn)回歸直線必過(guò)點(diǎn)(無(wú),y)

B.經(jīng)驗(yàn)回歸直線就是散點(diǎn)圖中經(jīng)過(guò)樣本數(shù)據(jù)點(diǎn)最多的那條直線

C.當(dāng)樣本相關(guān)系數(shù)/>0時(shí),兩個(gè)變量正相關(guān)

D.如果兩個(gè)變量的相關(guān)性越弱,則團(tuán)就越接近于0

答案ACD

解析對(duì)于A,經(jīng)驗(yàn)回歸直線必過(guò)點(diǎn)(I,7),故A正確;對(duì)于B,經(jīng)驗(yàn)回歸直線在散點(diǎn)圖

中可能不經(jīng)過(guò)任一樣本數(shù)據(jù)點(diǎn),故B不正確;對(duì)于C,當(dāng)樣本相關(guān)系數(shù)r>0時(shí),則兩個(gè)變量

正相關(guān),故C正確;對(duì)于D,如果兩個(gè)變量的相關(guān)性越弱,則|廠|就越接近于0,故D正確.故

選ACD.

三、填空題

9.(2023?廣東廣州模擬)某車間為了提高工作效率,需要測(cè)試加工零件所花費(fèi)的時(shí)間,為此進(jìn)

行了5次試驗(yàn),這5次試驗(yàn)的數(shù)據(jù)如下表:

零件數(shù)x(個(gè))

加工時(shí)間y(min)

若用最小二乘法求得經(jīng)驗(yàn)回歸方程為y=0.67x+54.9,則a的值為

答案68

62+。+75+81+89=61+與,所以

5

10.用模型>=/一1去擬合一組數(shù)據(jù)時(shí),已知如下數(shù)據(jù):2而二18,9丁2丁3"4'5>6=匕48,則實(shí)數(shù)

i=l

k的值為.

答案3

6

解析由y=e"-1得lny=fcr—1,所以以丁2丁3丁4丁5、6=匕48=>左2即—6=18左一6=48,貝!)%=3.

,=1

n.(2023?海南調(diào)研)在一組樣本數(shù)據(jù)8,yD,(%2,竺),…,(X6,詞的散點(diǎn)圖中,若所有樣

1666

本點(diǎn)(如M)(i=l,2,6)都在曲線丁=加一5附近波動(dòng),經(jīng)計(jì)算ZH=12,£M=14,£姆

乙Z=1i=li=\

=23,則實(shí)數(shù)Z?的值為.

宏安—

u木23

6

_z*

解析令方=—,則非線性經(jīng)驗(yàn)回歸方程變?yōu)榫€性經(jīng)驗(yàn)回歸方程,即丁=初一看此時(shí),=氣一

6

ZM

23-z=i14小、,1田14,23117

=不,y=—=y-代入y=6f一],侍不

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論