統計案例(原卷版)_第1頁
統計案例(原卷版)_第2頁
統計案例(原卷版)_第3頁
統計案例(原卷版)_第4頁
統計案例(原卷版)_第5頁
已閱讀5頁,還剩33頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

專題52統計案例

【題型歸納目錄】

題型一:變量間的相關關系

題型二:線性回歸

題型三:非線性回歸

題型四:獨立性檢驗

題型五:誤差分析

【考點預測】

知識點一、變量間的相關關系

1、變量之間的相關關系

當自變量取值一定時,因變量的取值帶有一定的隨機性,則這兩個變量之間的關系叫相關關系.由于

相關關系的不確定性,在尋找變量之間相關關系的過程中,統計發揮著非常重要的作用.我們可以通過收

集大量的數據,在對數據進行統計分析的基礎上,發現其中的規律,對它們的關系作出判斷.

注意:相關關系與函數關系是不同的,相關關系是一種非確定的關系,函數關系是一種確定的關系,

而且函數關系是一種因果關系,但相關關系不一定是因果關系,也可能是伴隨關系.

2、散點圖

將樣本中的n個數據點(x,,%)(i=1,2,)描在平面直角坐標系中,所得圖形叫做散點圖.根據散點圖

中點的分布可以直觀地判斷兩個變量之間的關系.

(1)如果散點圖中的點散布在從左下角到右上角的區域內,對于兩個變量的這種相關關系,我們將它

稱為正相關,如圖(1)所小;

(2)如果散點圖中的點散布在從左上角到右下角的區域內,對于兩個變量的這種相關關系,我們將它

稱為負相關,如圖(2)所不.

y

???????

,??

,*

o5;o

(1)(2)

3、相關系數

若相應于變量X的取值X,,變量y的觀測值為y(1<i<ri),則變量x與y的相關系數

n__

E(X]-x)(%-y)^x^-nxy

?2L,通常用廠來衡量x與y之間的線性關系的強弱,r

唇廠孩唇:-方

的范圍為一.

(1)當r>0時,表示兩個變量正相關;當廠<0時,表示兩個變量負相關.

(2)W越接近1,表示兩個變量的線性相關性越強;H越接近0,表示兩個變量間幾乎不存在線性相

關關系.當加=1時,所有數據點都在一條直線上.

(3)通常當|廠|>0.75時,認為兩個變量具有很強的線性相關關系.

知識點二、線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數關系的兩個變量之間的關系(相關關系)的方法.

對于一組具有線性相關關系的數據(尤1,yi),(%2,J2),...,(X",y"),其回歸方程y=加+。的求法為

〃__“__

£-尤)(yt-v)£X:yt-nxy

b=^—^---------------------T--------------------

一彳了一屋

i=li=\

a=y-bx

其中,X=~txi,y=-tyi'(x,y)稱為樣本點的中心.

n/=in,=i

2、殘差分析

對于預報變量y,通過觀測得到的數據稱為觀測值y,通過回歸方程得到的y稱為預測值,觀測值減去

預測值等于殘差,自稱為相應于點(七,y)的殘差,即有=殘差是隨機誤差的估計結果,通過對殘

差的分析可以判斷模型刻畫數據的效果以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分

析.

U)殘差圖

通過殘差分析,殘差點&,自)比較均勻地落在水平的帶狀區域中,說明選用的模型比較合適,其中這樣

的帶狀區域的寬度越窄,說明模型擬合精確度越高;反之,不合適.

(2)通過殘差平方和。=£(?-%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;

;=|

反之,不合適.

(3)相關指數

Z(y-y,-)2

用相關指數來刻畫回歸的效果,其計算公式是:R2=I--=1'".

Z(2)2

/=!

代越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.

知識點三、非線性回歸

解答非線性擬合問題,要先根據散點圖選擇合適的函數類型,設出回歸方程,通過換元將陌生的非線

性回歸方程化歸轉化為我們熟悉的線性回歸方程.

求出樣本數據換元后的值,然后根據線性回歸方程的計算方法計算變換后的線性回歸方程系數,還原

后即可求出非線性回歸方程,再利用回歸方程進行預報預測,注意計算要細心,避免計算錯誤.

1、建立非線性回歸模型的基本步驟:

(1)確定研究對象,明確哪個是解釋變量,哪個是預報變量;

(2)畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系(是否存在非線性關系);

(3)由經驗確定非線性回歸方程的類型(如我們觀察到數據呈非線性關系,一般選用反比例函數、二

次函數、指數函數、對數函數、幕函數模型等);

(4)通過換元,將非線性回歸方程模型轉化為線性回歸方程模型;

(5)按照公式計算線性回歸方程中的參數(如最小二乘法),得到線性回歸方程;

(6)消去新元,得到非線性回歸方程;

(7)得出結果后分析殘差圖是否有異常.若存在異常,則檢查數據是否有誤,或模型是否合適等.

知識點四、獨立性檢驗

1、分類變量和列聯表

(1)分類變量:

變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯表:

①定義:列出的兩個分類變量的頻數表稱為列聯表.

②2x2列聯表.

一般地,假設有兩個分類變量X和匕它們的取值分別為{xl,尤2}和{yl,y2],其樣本頻數列聯表(稱

為2x2列聯表)為

%為總計

%aba+b

x2Cdc+d

總計a+cb+da+b+c+d

從2x2列表中,依據‘二與工的值可直觀得出結論:兩個變量是否有關系.

a+bc+d

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖表示

列聯表數據的頻率特征.

(2)觀察等高條形圖發現,二與上相差很大,就判斷兩個分類變量之間有關系.

a+bc+d

3、獨立性檢驗

(1)定義:利用獨立性假設、隨機變量K2來確定是否有一定把握認為“兩個分類變量有關系”的方法

稱為兩個分類變量的獨立性檢驗.

(2)公式:K2=---------------------------------,其中〃=a+O+c+d為樣本容量.

(a+b)(c+d)(a+c)(b+d)

(3)獨立性檢驗的具體步驟如下:

①計算隨機變量K?的觀測值%,查下表確定臨界值即:

2

P(K>k0)0.50.400.250.150.100.050.0250.0100.0050.001

k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

②如果左2%,就推斷“x與y有關系”,這種推斷犯錯誤的概率不超過/(片?%);否則,就認為在犯

錯誤的概率不超過°(片?片)的前提下不能推斷“乂與/有關系”.

(2)兩個分類變量X和y是否有關系的判斷標準:

統計學研究表明:

當Q43.841時,認為X與Y無關;

當3.841時,有95%的把握說X與Y有關;

當片>6.635時,有99%的把握說X與/有關;

當片>10.828時,有99.9%的把握說X與¥有關.

【方法技巧與總結】

常見的非線性回歸模型

(1)指數函數型〉=。優(。>0且awl,c>0)

兩邊取自然對數,Iny=In[cax),即Iny=lnc+xlna,

令[y,'=lny,原方程變為y=lnc+尤'Ina,然后按線性回歸模型求出In。,Inc.

[x=X

(2)對數函數型y=+a

令=y,原方程變為y'=bx'+a,然后按線性回歸模型求出6,a.

[x=Inx

(3)塞函數型y=ax〃

兩邊取常用對數,lgy=lg(ax〃),即lgy=mgx+lga,

令,原方程變為y'=nr'+lga,然后按線性回歸模型求出”,Iga.

[x=Igx

(4)二次函數型y=區2+。

令:,原方程變為y'=6x'+a,然后按線性回歸模型求出6,?.

[X=X

(5)反比例函數型y=a+9型

y'=y

令,1,原方程變為y'=6x'+“,然后按線性回歸模型求出6,a.

X=—

、X

【題型歸納目錄】

題型一:變量間的相關關系

題型二:線性回歸

題型三:非線性回歸

題型四:獨立性檢驗

題型五:誤差分析

【典例例題】

題型一:變量間的相關關系

例1.(2022?上海嘉定?高三階段練習)通過抽樣調研發現,當地第三季度的醫院心腦血管疾病的人數和便利

店購買冷飲的人數的相關系數很高,甲認為這是巧合,兩者其實沒有關系:乙認為冷飲的某種攝入成分導

致了疾病;丙認為病人對冷飲會有特別需求:丁認為兩者的相關關系是存在的,但不能視為因果,請判斷

哪位成員的意見最可能成立()

A.甲B.乙C.丙D.丁

例2.(2022?四川?成都七中高三階段練習(理))某統計部門對四組數據進行統計分析后,獲得如圖所示的

散點圖.

35

30

25

20

15

10

5

V5101520253035

相關系數為八

35f-----------------------------

30-.

25-

20-

15-.,

io-.?

5-J*,

5101520253035

相關系數為「3相關系數為&

下面關于相關系數的比較,正確的是)

A.B.r2<r^<rx<r3C.D.

例3.(2022?上海交大附中高三階段練習)某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有

所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽

樣的方法抽取20個作為樣區,調查得到樣本數據(4%)?=1,2,…,20),其中天和力分別表示第,個樣區的

2020

植物覆蓋面積(單位:公頃)和這種野生動物的數量(單位:頭),并計算得£七=60,2%=1200,

Z=1Z=1

20_220_20

=80,X(X-y)2=9000,£卜廠尤)(%->)=800.

z=li=\i=l

(1)估計該地區這種野生動物的數量;

⑵求樣本(%,%)?=1,2,…,20)的相關系數.(精確到0.01)

變式1.(2022?陜西?寶雞市陳倉高級中學高三開學考試(理))對兩個變量無,y進行線性相關檢驗,得線性

相關系數〃=0.8995,對兩個變量a,v進行線性相關檢驗,得線性相關系數-0.9568,則下列判斷正確

的是()

A.變量x與y正相關,變量“與v負相關,變量尤與y的線性相關性較強

B.變量x與y負相關,變量〃與v正相關,變量x與y的線性相關性較強

C.變量x與y正相關,變量〃與v負相關,變量〃與v的線性相關性較強

D.變量尤與y負相關,變量"與v正相關,變量"與v的線性相關性較強

變式2.(2022?全國?高三專題練習)甲、乙、丙、丁四位同學各自對兩變量的線性相關性做試驗,分別求

得樣本相關系數/,如下表:

甲乙丙T

r0.20-0.95-0.120.85

則試驗結果中蒼丁兩變量有更強線性相關性的是()

A.甲B.乙C.丙D.丁

變式3.(2022.江蘇.南京市第一中學高三階段練習)某網絡電視劇已開播一段時間,其每日播放量有如下統

計表:

開播天數X(單

12345

位:天)

當天播放量y

335910

(單位:百萬

次)

(1)請用線性回歸模型擬合y與x的關系,并用相關系數加以說明;

(2)假設開播后的兩周內(除前5天),當天播放量y與開播天數尤服從(1)中的線性關系.若每百萬播放量

可為制作方帶來0.7萬元的收益,且每開播一天需支出1萬元的廣告費,估計制作方在該劇開播兩周內獲得

的利潤.

參考公式:/,石二口七------------,a=y-bx.

歸x"歸y"自…

555_____

參考數據:^xiyi=110,2%;=55,=224,7110-10.5.

i=li=li=l

注:①一般地,相關系數r的絕對值在0.95以上(含0.95)認為線性相關性較強;否則,線性相關性較弱.

②利潤=收益一廣告費.

題型二:線性回歸

例4.(2022.重慶南開中學高三階段練習)重慶位于北半球亞熱帶內陸地區,其氣候特征恰如幾句俗諺:春

早氣溫不穩定,夏長酷熱多伏旱,秋涼綿綿陰雨天,冬暖少雪云霧多.尤其是10月份,晝夜溫差很大,某

數學興趣小組欲研究晝夜溫差大小與患感冒人數多少之間的關系,他們分別到氣象局與某醫院抄錄了2021

年10月某六天的晝夜溫差情況與因患感冒而就診的人數,得到如下資料:

日期第一日第三日第五日第四日第二日第六日

晝夜溫差X(℃)47891214

就診人數y(個)%%%%)6

66_2

其中:%eN*,i=\,2,3,4,5,6,參考數據:=2658,=258,7258?16.

i=li=l'

(D根據散點圖可以認為x與y之間存在線性相關關系,且相關系數r=三,請用最小二乘法求出線性回歸

方程y=6x+a(?,b用分數表示);

(2)分析數據發現:第六日就診人數%=3。,第一日就診患者中有3個小孩,其他患者全是大人,現隨機的

Q

從第一日所有就診患者中選出2人,若2人中至少有一個小孩的概率為二;

①求%的值;

②若%<%<%<為,求%,為,>4,%的值(只寫結果,不要求過程).

2(%-磯%

(參考公式:J————a=y-b'X,

Z")

i=\

例5.(2022?全國?高三專題練習)已知龍,丁的取值如表:

X0134

ya4.34.86.7

若X,y具有線性相關關系,且回歸方程為9=0.95x+2.6,則。=

例6.(2022?河北衡水?高三階段練習)已知一組樣本數據(多,yj,(々,坊),…,(%,%)"22,占,巧,...,

乙不相等),若這組數據的樣本相關系數為T,則在這組樣本數據的散點圖中,所有樣本點(4》)(1=1,

2,〃)所在的曲線可能是()

A.y=-2x+3B.y=x+3C.y=-x1+3D.y=?+3

變式4.(2022?全國?高三專題練習(文))給出下列說法:①回歸直線夕=嬴+&恒過樣本點的中心丘,7),

且至少過一個樣本點;②兩個變量相關性越強,則相關系數⑺就越接近1;③將一組數據的每個數據都加

一個相同的常數后,方差不變;④在回歸直線方程3=2-0.5x中,當解釋變量x增加一個單位時,預報變量

亍平均減少0.5個單位.其中說法正確的是()

A.①②④B.②③④C.①③④D.②④

變式5.(2022?全國?高三專題練習)對于數據組(專切[=1,2,3,...,“),如果由線性回歸方程得到的對應于自

變量者的估計值是力,那么將稱為相應于點(乙,%)的殘差.某工廠為研究某種產品產量無(噸)與

所需某種原材料丫噸)的相關性,在生產過程中收集4組對應數據(x,y)如下表所示:

X3456

y2.534m

根據表中數據,得出,關于x的線性回歸方程為y=0.7x+〃,據此計算出樣本點(4,3)處的殘差為一0.15,

則表中m的值為()

A.3.3B.4.5C.5D.5.5

變式6.(2022.全國?高三專題練習)已知兩個變量工和,之間有線性相關關系,經調查得到如下樣本數據,

X34567

y3.52.41.1-0.2-1.3

根據表格中的數據求得同歸方程亍=%+&,則下列說法正確的是()

A.a>0,b>0B.a>0,b<0

C.a<0,b>0D.a<0,b<0

變式7.(2022.全國?高三專題練習)為研究某種細菌在特定環境下,隨時間變化的繁殖情況,得到如下實驗

數據:

天數X(天)3456

繁殖個數y(千個)2.5344.5

由最小二乘法得>與x的線性回歸方程為3=0.7x+&,則當x=7時,繁殖個數》的預測值為()

A.4.9B.5.25

C.5.95D.6.15

變式8.(2022?北京師大附中高三階段練習(文))為了規定工時定額,需要確定加工某種零件所需的時間,

為此進行了5次試驗,得到5組數據:(工,%),(孫力),(毛,%),(%,%),(%,%),由最小二乘法求得回歸直線

方程為y=0.67x+54.9.若己知占+々+%+%+%=15°,則%+%+%+%+%=

A.75B.155.4C.375D.466.2

變式9.(2022?廣東?順德一中高三階段練習)據一組樣本數據(%,%),(々,為),…,(%,%),求得經驗回歸

方程為a=L5x+0.5,且;=3.現發現這組樣本數據中有兩個樣本點(122.2)和(4.8,7.8)誤差較大,去除后

重新求得的經驗回歸直線/的斜率為1.2,則()

A.去除兩個誤差較大的樣本點后,丁的估計值增加速度變快

B.去除兩個誤差較大的樣本點后,重新求得的回歸方程一定過點(3,4)

C.去除兩個誤差較大的樣本點后,重新求得的回歸方程為a=L2x+L4

D.去除兩個誤差較大的樣本點后,相應于樣本點(2,3.75)的殘差為0.05

變式10.(2022.全國?高三專題練習)新冠肺炎疫情發生以來,中醫藥全面參與疫情防控救治,做出了重要

貢獻.某中醫藥企業根據市場調研與模擬,得到研發投入億元)與產品收益y(億元)的數據統計如下:

研發投入X(億元)12345

產品收益y(億元)3791011

(1)計算X,y的相關系數r,并判斷是否可以認為研發投入與產品收益具有較高的線性相關程度?(若

0.3<|r|<0.75,則線性相關程度一般,若|川>0.75,則線性相關程度較高)

(2)求出y關于x的線性回歸方程,并預測研發投入20(億元)時產品的收益.

555

2

參考數據:£(尤,-可2=10,E(x-y)=4o,^(x,-x)(z-y)=i9.

z=li=li=l

附:相關系數公式:r=「,回歸直線方程的斜率A=J-----------------,截距

Vi=lVz=li-l

d=y-bx.

變式11.(2022.全國?模擬預測(文))2020年,國慶“遇上”中秋,中國人把這個“超長黃金周”過出了年味.

假期期間,全國各大旅游景點、車站、機場人頭攢動的景象也吸引了世界的目光.外國媒體、專家和網友“實

名羨慕”,這一派熱鬧景象證明了抗疫的成功,也展示了中國經濟復蘇的勁頭.抗疫的成功離不開國家強大的

醫療衛生體系,下表是某省2013年至2019年醫療衛生機構數》(單位:萬個):

年份2013201420152016201720182019

年份代號,1234567

醫療衛生機構數y4.24.34.54.74.84.84.9

(1)求y關于f的線性回歸方程、=命+&(a,3保留兩位小數);

(2)規定若某年的實際醫療衛生機構數與估計值的差的絕對值不超過500個,則稱該年是“吻合”年.利用(1)

的結果,假設2020年該省醫療衛生機構數的估計值為實際值,現從2013年至2020年這8年中任選3年,

其中“吻合,,年的個數為X,求X的分布列與數學期望.

7

參考數據:工4%=1322,7=4.6.

Z=1

參考公式:線性回歸方程y=中斜率和截距的最小二乘估計公式分別為:b=「----------,

Ef=l"

a=y—bt.

變式12.(2022?全國?高三專題練習)在我國抗疫期間,素有“南抖音,北快手”之說的小視頻除了給人們帶

來生活中的快樂外,更在于傳遞了一種正能量,為抗疫起到了積極的作用,但一個優秀的作品除了需要有

很好的素材外,更要有制作上的技術要求,某同學學習利用“快影”軟件將已拍攝的素材進行制作,每次制作

分三個環節來進行,其中每個環節制作合格的概率分別為3:,三4,:2,只有當每個環節制作都合格才認為一

453

次成功制作,該小視頻視為合格作品.

(1)求該同學進行3次制作,恰有一次合格作品的概率;

(2)若該同學制作10次,其中合格作品數為X,求X的數學期望與方差;

(3)該同學掌握技術后制作的小視頻被某廣告公司看中,聘其為公司做廣告宣傳,決定試用一段時間,每

天制作小視頻(注:每天可提供素材制作個數至多40個),其中前7天制作合格作品數》與時間f如下表:(第

f天用數字t表示)

時間(,)1234567

合格作品數(V)3434768

其中合格作品數(V)與時間")具有線性相關關系,求,關于「的線性回歸方程(精確到0.01),并估算第14天

能制作多少個合格作品(四舍五入取整)?

.£占%一“

(參考公式》=號------=上———7^,6=3-威,參考數據:1^=163.)

七年-wx-一;=1

z=li=\

題型三:非線性回歸

例7.(2022.廣東.順德一中高三階段練習)在國家大力發展新能源汽車產業的政策下,我國新能源汽車的產

銷量高速增長.已知某地區2014年底到2021年底新能源汽車保有量的數據統計表如下:

年份(年)20142015201620172018201920202021

年份代碼X12345678

保有量W千輛1.952.924.386.589.8715.0022.5033.70

888

參考數據:9=12.1]=2.1,£x;=204,=613.7,£必=92.4,,其中

z=li=lf=l

J=Iny,1g2P0.30,lg3?0.48,1gee0.43.

人力千輛

35

30

25

20

15

10

5

O12345678

(1)根據統計表中的數據畫出散點圖(如圖),請判斷9=&與5;=e&+<5哪一個更適合作為y關于x的經驗

回歸方程(給出判斷即可,不必說明理由),并根據你的判斷結果建立y關于龍的經驗回歸方程:

(2)假設每年新能源汽車保有量按(1)中求得的函數模型增長,且傳統能源汽車保有量每年下降的百分比相

同.若2021年底該地區傳統能源汽車保有量為500千輛,預計到2026年底傳統能源汽車保有量將下降10%.

試估計到哪一年底新能源汽車保有量將超過傳統能源汽車保有量.

參考公式:對于一組數據(%,V/),(%,嶺),…,(""M),其經驗回歸直線£=/"+&的斜率和截距的最小

Z(M;-M)(v;-V)Zujvi-nu-V

二乘估計公式分別為B=上匕--------=%---------,a=v-^u-,;

22

Z(w;-M)工uf-nu

1=1i=l

例8.(2022?全國?高三專題練習)2020年的“金九銀十”變成“銅九鐵十”,全國各地房價“跳水”嚴重,但某地

二手房交易卻“逆市”而行.下圖是該地某小區2019年11月至2020年H月間,當月在售二手房均價(單位:

萬元/平方米)的散點圖.(圖中月份代碼1至13分別對應2019年H月至2020年11月)()

A當月在手二手房

L°4-均儕....

1.02-???*

1.00-??

0.98-?*

0.96-

?

0.94-

°12345678910111213月份代碼x

根據散點圖選擇、=。+6?和'=。+〃111萬兩個模型進行擬合,經過數據處理得到的兩個回歸方程分別為

y=0.9369+0.0285石和y=0.9554+0.0306Inx,并得到以下一些統計量的值:

)=0.9369+0.0285&y=0.9554+0.03061nx

R20.9230.973

注:£是樣本數據中關的平均數,亍是樣本數據中了的平均數,則于列說法不一定成立的是()

A.當月在售二手房均價y與月份代碼x呈正相關關系

B.根據>=0.9369+0.02856可以預測2021年2月在售二手房均價約為1.0509萬元/平方米

C.曲線y=0.9369+0.02854與y=0.9554+0.0306Inx的圖形經過點(x,y)

D.y=0.9554+0.0306Inx回歸曲線的擬合效果好于_y=0.9369+0.0285Vx

例9.(2022?全國?高三專題練習)一只紅鈴蟲的產卵數y和溫度x有關,現收集了6組觀測數據,y(單位:

個)與溫度x(單位:℃)得到樣本數據(8%)(i=l,2,3,4,5,6),令z,=ln/,并將(4馬)繪制成

如圖所示的散點圖.若用方程y=ae"對y與x的關系進行擬合,則()

z八

4■

3-??

2-?,,

1-,

——I——I——I——I——I——I-

20212223242526x

A.a>l,b>0B.a>l,b<0

C.Ovavl,b>0D.0<a<l,b<0

變式13.(2022?全國?高三專題練習)用模型y=a*M(a>0)擬合一組數據時,令z=lny,將其變換后得到

h

回歸直線方程z=2x+a,則一=()

a

A.eB.—C.—D.2

e2

變式14.(2022?全國?高三專題練習)在一組樣本數據(4丹),(巧,%),匕,(天,為)的散點圖中,若所有

7

樣本點(4%)(,=1,2,L,7)都在曲線y=aln(%-1895)+12.15附近波動,經計算T895)=210.77,

z=i

77

=73.50,^ln(x,.-1895)=23.10,則實數。=()

Z=1Z=1

A.一0.5B.0.5C.-iD.1

變式15.(2022?全國?高三專題練習)如圖是一組實驗數據構成的散點圖,以下函數中適合作為》與無的回

歸方程的類型是()

2x

A.y=ax+bB.y=ax+cc.y=b\ogax+cD.y=ba+c

變式16.(2022?全國?高三專題練習)如圖是一組實驗數據構成的散點圖,以下函數中適合作為丫與x的回

歸方程的類型是()

?

x

x

A.y=ax+bB.y=ax"+cC.y=b\ogax+cD.y=ba+c

變式17.(多選題)(2022?全國?高三專題練習)在對具有相關關系的兩個變量進行回歸分析時,若兩個變量

不呈線性相關關系,可以建立含兩個待定參數的非線性模型,并引入中間變量將其轉化為線性關系,再利

用最小二乘法進行線性回歸分析.下列選項為四個同學根據自己所得數據的散點圖建立的非線性模型,且散

點圖的樣本點均位于第一象限,則其中可以根據上述方法進行回歸分析的模型有()

A.y-cxx+c2x

C.y=q+ln(x+c2)

變式18.(2022?全國?高三專題練習)我國為全面建設社會主義現代化國家,制定了從2021年到2025年的“十

四五”規劃.某企業為響應國家號召,匯聚科研力量,加強科技創新,準備增加研發資金.現該企業為了了

解年研發資金投入額x(單位:億元)對年盈利額》(單位:億元)的影響,研究了“十二五”和“十三五”規

劃發展期間近10年年研發資金投入額占和年盈利額%的數據.通過對比分析,建立了兩個函數模型:①

y=a+歐;②y=其中a、夕、彳、t均為常數,e為自然對數的底數.令%=X;,”=In%G=1,2,…,10),

經計算得如下數據:

1010

XS(x-y)2u

Z=1Z=1

26215652680

10°101010

£(x,.-x)(v,.-v)

V力%-7)ZU-7)2

?=1Z=1i=li=\

5.36112501302.612

(1)請從相關系數的角度,分析哪一個模型擬合程度更好?

(2)根據(1)的選擇及表中數據,建立y關于尤的回歸方程;(系數精確到o.oi)

(3)若希望2021年盈利額y為250億元,請預測2021年的研發資金投入額了為多少億元.(結果精確到0.01)

變式19.(2022.全國?高三專題練習)在疫情防控常態化的背景下,山東省政府各部門在保安全,保穩定的

前提下有序恢復生產,生活和工作秩序,五一期間,文旅部門在落實防控舉措的同時,推出了多款套票文

旅產品,得到消費者的積極回應.下面是文旅部門在某地區推出六款不同價位的旅游套票,每款的套票價

格x(單位:元)與購買人數y(單位:萬人)的數據如下表:

旅游類別城市展館科技游鄉村特色游齊魯紅色游登山套票游園套票觀海套票

套票價格X(元)394958677786

購買數量y(萬人)16.718.720.622.524.125.6

在分析數據、描點繪圖中,發現散點(匕,①集中在一條直線附近,其中”=1叫,co,.=lny;

6666

附:①可能用到的數據:?>叫=753£匕=246?>產1832>;=101.4.

i=\i=\i=\z=l

②對于一組數據(匕,sj,?,①2),…,3,3”),其回歸直線質=加+<5的斜率和截距的最小二乘估計值分別

£vimi-rivm

^b=—..................,a=m-bv

”-怖2

,=i

(1)根據所給數據,求y關于龍的回歸方程;

ee

(2)按照文旅部門的指標測定,當購買數量y與套票價格x的比在區間-,-上時,該套票受消費者的歡迎

程度更高,可以被認定為“熱門套票”,現有三位同學從以上六款旅游套票中,購買不同的三款各自旅游.記

三人中購買“熱門套票”的人數為X,求隨機變量X的分布列和期望.

變式20.(2022.全國?高三專題練習)數據顯示,中國在線直播用戶規模及在線直播購物規模近幾年都保持

高速增長態勢,下表為2017—2021年中國在線直播用戶規模(單位:億人),其中2017年—2021年對應的

代碼依次為1—5.

年份代碼尤12345

市場規模y3.984.565.045.866.36

參考數據:歹=5.16,V=1.68,^v,.y,.=45.10,其中匕=嘉.

1=1

參考公式:對于一組數據(qyj,(v2,%),…,(匕,%),其回歸直線5=加+力的斜率和截距的最小二乘

2匕%一〃藥

估計公式分別為3=嚀--------,a=y-bv.

2—2

匕一次

Zz=i

(1)由上表數據可知,可用函數模型9=+d擬合y與x的關系,請建立y關于x的回歸方程(6,g的值

精確到0.01);

(2)已知中國在線直播購物用戶選擇在品牌官方直播間購物的概率為p,現從中國在線直播購物用戶中隨機抽

取4人,記這4人中選擇在品牌官方直播間購物的人數為X,若P(X=3)=尸(X=4),求X的分布列與期

望.

變式21.(2022?湖南.長沙市明德中學高三開學考試)近期國內疫情反復,對我們的學習生活以及對各個行

業影響都比較大,某房地產開發公司為了回籠資金,提升銷售業績,讓公司旗下的某個樓盤統一推出了為

期10天的優惠活動,負責人記錄了推出活動以后售樓部到訪客戶的情況,根據記錄第一天到訪了12人次,

第二天到訪了22人次,第三天到訪了42人次,第四天到訪了68人次,第五天到訪了132人次,第六天到

訪了202人次,第七天到訪了392人次,根據以上數據,用x表示活動推出的天數,y表示每天來訪的人次,

繪制了以下散點圖.

八川人次)

400

350

300

250

200

150

100

50

O

⑴請根據散點圖判斷,以下兩個函數模型y=a+法與y=(c,d均為大于零的常數)哪一個適宜作為

人次y關于活動推出天數元的回歸方程類型?(給出判斷即可,不必說明理由);

(2)根據(1)的判斷結果及下表中的數據,求y關于元的回歸方程,并預測活動推出第8天售樓部來訪的入

17

次,參考數據:其中匕=lg、,v=-Xvz.

'z=l

7

£%匕084

V1O

Z=1

1.8458.556.9

八z七/一〃孫

線性回歸方程:§=》%+金,其中B=t---------丁,金=丁一令%.

2X;-

i=l

(3)己知此樓盤第一天共有10套房源進行銷售,其中6套正價房,4套特價房,設第一天賣出的4套房中特

價房的數量為久求4的分布列與數學期望.

題型四:獨立性檢驗

例10.(2022?江蘇?南京市秦淮中學高三階段練習)某校為引導學生學習黨史,校黨委宣傳組織了黨史知識

競賽,對前來參賽的150名學生(男生100人,女生50人),成績不低于80分的學生為“黨史達人”,成績

低于80分的學生為“非黨史達人”,統計了他們的成績情況,結果如下:男生中有60人被評為“黨史達人”,

女生中有40人被評為“黨史達人”.

(1)完善列聯表,并判斷:是否有99%的把握認為黨史成績優秀與否與性別有關?

性別

黨史達人非黨史達人

是否為黨史達人

男生

女生

(2)如果用這150名學生中,男生和女生“黨史達人”的頻率分別代替該校男生和女生被評為“黨史達人”的概

率,且每位學生是否被評為“黨史達人”相互獨立,現從該校學生中隨機抽取3人(2男1女),設隨機變量X

表示“3人中黨史達人”的人數,試求X的分布列和數學期望.

n(ad-bc)2

附:K2=n=a+b+c+d

(a+/?)(c+d)(a+c)(6+d)'

P(K2>k]0.100.050.0250.010.005

k2.7063.8415.0246.6357.879

例11.(2022?四川?樹德中學高三階段練習(文))根據分類變量x與y的觀察數據,計算得至1」片=2.974.依

據下面給出的臨界值表,

0.500.400.250.150.100.050.0250.0100.005

k00.4550.7081.3232.0722.7063.8415.0246.6357.879

可知下列判斷中正確的是()

A.有95%的把握認為變量x與y獨立

B.有95%的把握認為變量x與y不獨立

C.變量x與y獨立,這個結論犯錯誤的概率不超過10%

D.變量x與y不獨立,這個結論犯錯誤的概率不超過10%

例12.(2022?浙江省蒼南中學高三階段練習)在新高考改革中,浙江省新高考實行的是7選3的3+3模式,

即語數外三門為必考科目,然后從物理、化學、生物、政治、歷史、地理、技術(含信息技術和通用技術)

7門課中選考3門.某校高二學生選課情況如下列聯表一和列聯表二(單位:人)

選物理不選物理總計

男生340110450

女生140210350

總計480320800

表一

選生物不選生物總計

男生150300450

女生150200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論