




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三節統計案例
學習要求-公眾號:新課標試卷:1,會作兩個有關聯變量的數據的散點圖,會利用散點圖認識變
量間的相關關系,
2,了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程.
3.了解獨立性檢驗(只要求2X2列聯表)的基本思想、方法及其簡單應用,了解回歸分析的
基本思想、方法及其簡單應用,在本小節中,需要了解一些常見的統計方法,并能應用這些方法
解決一些實際問題.
必備知識?整合
L兩個變量的線性相關
(1)正相關:
在散點圖中,點散布在從①左下角到②右上角的區域,對于兩個變量的這種相關關
系,我們將它稱為正相關.
(2)負相關:
在散點圖中,點散布在從③左二角到⑷右下角的區域,對于兩個變量的這種相關關
系,我們將它稱為負相關.
(3)線性相關關系、回歸直線:
如果散點圖中點的分布從整體上看大致在⑤.一條直線附近,那么就稱這兩個變量之間
具有線性相關關系,這條直線叫做回歸直線.
(4)最小二乘法:
求回歸直線,使得樣本數據的點到它的⑥.距離的平方和最小的方法叫做最小二乘法.
(5)回歸方程:
方程y功肝。是具有線性相關關系的兩個變量的一組數據(打%),(心④,…,(即人)的回歸
方程,其中a”是待定參數.
n
E(xrx)(yry)
b=
nQ
L(片9)2MJ卜戒
1=1
a=?y-bx,
2.回歸分析
⑴回歸分析是對具有⑧」的兩個變量進行統計分析的一種常用方法.
(2)樣本點的中心:
nn
對于一組具有線性相關關系的數據(為加,(勒必),…,(及外茂工£孫歹二工£如⑨
^i=ii=i
為樣本點的中心.
Zxiyrnxy
(3)相關系數:r=
當r>0時,表明兩個變量⑩正相關;
當2<0時,表明兩個變量?負相關,
廠的絕對值越接近于1,表明兩個變量的線性相關性?越強.2的絕對值越接近于0,表明
兩個變量之間?幾乎不存在線性相關關系,通常如大于或等于?0.75時,認為兩個變量
有很強的線性相關性,
3.獨立性檢驗
⑴分類變量:變量的不同“值”表示個體所屬的?不同類別,像這樣的變量稱為分類變
量.
⑵列聯表:列出的兩個分類變量的?頻數表,稱為列聯表,一般地,假設有兩個分類變量
才和K它們的可能取值分別為{打而}和{y.,同,其樣本頻數列聯表(稱為2X2列聯表)為
總計
X\ab升b
照Cdc^d
總計卅CKd
則可構造一個隨機變量〃=?,…,其中爐?外加Nd.
一(a+b)(c+d)(a+c)(b+d)-----------
(3)獨立性檢驗:
利用獨立性假設、隨機變帚?K來確定是否有一定的把握認為“兩個分類變量?有
關系”的方法稱為兩個分類變量的獨立性檢驗.
OSM
1,判斷正誤(正確的打“J”,錯誤的打“X”),
(1)“名師出高徒”可以解釋為教師的教學水平與學生的成績成正相關關系.()
(2)通過回歸直線方程y%戶a可以估計預報變量的取值和變化趨勢.()
(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關性檢驗.
()
⑷事件4關系越密切,則由觀測數據計算得到的尤的觀測值越大.()
答案⑴J⑵J(3)X⑷J
2.根據如下樣本數據;
X34567
y4.02.5-0.50.5-2.0
得到的回歸方程為尸力代出若折7.9,則x每增加一個單位,y就()
A.增加1.4個單位B.減少1.4個單位
C.增加1.2個單位D.減少1.2個單位
答案B根據樣本數據可得,專5,聲0.9,由于樣本點的中心伉力滿足尸6代&,所以
0.9二6X5+7.9,可得IF-\.4.故選B.
3.(人教A版選修2-3P97習題3.2T1改編)在研究吸煙是否對患肺癌有影響的案例中,通過
對列聯表的數據進行處理,計算得到隨機變量『的觀測值左056,632,在犯錯誤的概率不超過
0.0C1的前提下,下面說法正確的是()
下表供參考:
P/2睛0.0250.0100.0050.001
標5.0246.6357.87910.828
A.由于隨機變量V的觀測值力10.828,所以“吸煙與患肺癌有關系并且這個結論犯錯誤的
概率不超過0.001
B.由于隨機變量斤的觀測值828,所以“吸煙與患肺癌有關系”:并且這個結論犯錯誤的
概率不低于0.001
C.由于隨機變量^的觀測值力10.828,所以“吸煙與患肺癌沒有關系”,并且這個結論犯錯誤
的概率不超過0.001
D.由于隨機變量/的觀測值010.828,所以“吸煙與患肺癌沒有關系”,并且這個結論犯錯誤
的概率不低于0.001
答案A因為隨機變量〃的觀測值妗56.632〉10.828,
所以在犯錯誤的概率不超過0.001的前提下,認為“吸煙與患肺癌有關系”.
故選A.
4.(人教B版選修2-3P94A5改編)己知兩個變量為y的關系可以近似地用函數萬a爐來表示,
通過兩邊取自然對數變換后得到一個線性函數,利用最小二乘法得到的線性回歸方程為
下2+0.5匕則乂y的近似函數關系式為.
答案y=exi
解析令z=ln7=ln(a/)=lna+Mnx,
對照回歸方程r2+0.5右
毗/"礙
???My的近似函數關系式為片。小.
5,(易錯題)為了考察某種病毒疫苗的效果,現隨機抽取100只小鼠進行試驗,得到如下列聯表:
感染未感染合計
服用104050
未服用203050
合計3070100
附,OK?
P(冷L)0.1000.0500.0250.010
k02.7063.8415.0246.635
根據上表,有的把握認為“小鼠是否被感染與服用疫苗有關”.
答案95舟
解析根據列聯表中數據,計算出駕端哼*4.762>3.841,
對照數表知,有95微把握認為“小最是否被感染與服用疫苗有關”.
。易錯分析由于對2X2列聯表中國Ac、d的位置不清楚,在代入公式時代錯了數值導致計
算結果錯誤.
關鍵能力,突破
考點=相關關系的判斷值既
1.在一組樣本數據(鳥凹),(羯血,…,(島%)(廬2,xh及,…,兒不全相等)的散點圖中,若
所有樣本點(居7.)(7=1,2,…,〃)都在直線吁戶1上,則這組樣本數據的相關系數為()
A.-lB.0
C.-D.1
2
答案I)所有樣本點均在同一條斜率為正數的直線上,則樣本的相關系數最大,為1,所以
選D.
2.(2020湖南張家界月考)對四組數據進行統計,獲得如圖所示的散點圖,關于其相關系數的
比較,正確的是)
35
30
25
20
15
105
0
相關系敢為。相關系數為,:
(D②
相關系數為。和關系數為。
③④
A.打<匕<0<舄<丁1
B.司5<0"1您
C.水水0〈水石
D.冰水0<水舄
答案A易知題中圖①與圖③是正相關,圖②與圖④是負相關,且圖①與圖②中的樣本點
集中分布在一條直線附近,則小水0(費",故選A.
3.某公司的科研人員在7塊并排、形狀和大小相同的試驗田上對某棉花的新品種進行施化
肥量>對產量y影響的試驗,得到如下表所示的一組數據(單位:kg):
施化肥量X15202530354045
棉花產量y330345365405445450455
⑴畫出散點圖;
(2)判斷施化肥量x與棉花產量y是否具有相關關系.
解析(D散點圖如圖所示:
梅花產餐”kg
500
450
400
200
01020304050隨化肥fitx/ka
(2)由散點圖知,各組數據的對應點大致都在一條直線附近,所以施化肥量x與棉花產量y
具有線性相關關系.
名師點評
判斷相關關系的方法:
(1)回歸方程法:利用回歸方程中x的系數b的正負判斷.
(2)散點圖法;如果所有的樣本點都落在某一曲線附近,那么變量之間就有相關關系;如果所
有的樣本點都落在某一直線附近,那么變量之間就有線性相關關系.
(3)相關系數法:利用相關系數判斷,|「越趨近于1,相關性越強.
考點且回歸分析,多元分析‘
角度一線性回歸方程及應用
典例1(2020山西長治模擬)《中國詩詞大會》是中央電視臺于2016年推出的原創文化
類電視節目,中央電視臺為了解該節目的收視情況,抽查北方與南方各5個城市,得到觀看該節
目的人數(單位:千人)如莖葉圖所示,但其中一個數字被污損.
北方南方
897378
210806
(1)若將被污損的數字視為0十中10個數字中的一個,求北方觀眾平均人數超過南方觀眾
平均人數的概率;
(2)該節目的播出極大激發了觀眾學習詩詞的熱情,現在隨機統計了4位觀眾每周學習詩詞
的平均時間y(單位:小時)與年齡爪單位:歲),并制作了對照表(如表所示):
年齡x(單位:歲)20304050
每周學習詩詞的
33.53.54
平均時間y(單位:小時)
由表中數據分析,x與y成線性相關關系,試求線性回歸方程,并預測年齡為60歲的觀眾每
周學習詩詞的平均時間.
“
£位
1
Qb
n
22=y-
E-_
X.一nX
I1
=l
解析(1)設被污損的數字為X,由北方觀眾平均人數超過南方觀眾平均人數得
78+79+82+81+80.73+77+78+86+80+X”
〉=>Kb,
5--------------5
即A=0,1,2,3,4,5,
二所求概率嘮
(2)x=ix(20+30+40+50)=35,
4
歹[x(3+3.5+3.5+4)=3.5,
A4r升490,
44
又£xy=20X3+30X3.5+40X3.5+50X4=505,£x?=202+302+402+502=5400,
i=ii=i
八
?,?1b=--5-0-5-4-9-0-r=0.03,
5400-4x35?
Aa=3.5-0.03X35=2.45,
Ay=0.03外2,45,
.當戶60時,y二4.25.
故年齡為60歲的觀眾每周學習誓詞的平均時間大約為4.25小時,
角度二非線性回歸方程及應用
典例2(2020安徽黃山二模)某苗圃基地擬選用某種植物支援荒山綠化,在相同種植條件
下,對該種植物幼苗從種植之日起,第x天的高度y(單位:cm)進行觀測,下表是某株幼苗的觀測
數據:
第才/p>
高度y/fem0479111213
作出如下散點圖:
⑴請根據散點圖判斷尸3戶人與尸6&+d中哪一個更適宜作為幼苗高度/關于時間x的回
歸方程類型;(給出判斷即可,不必說明理由)
(2)根據⑴的判斷結果及表中數據,建立y關于x的回歸方程.已知幼苗的高度達到29cm
才可以移植,預測苗圃基地需要培育多長時間.
777777
Ex:
EXjEXiYiE同
rJ1
i=l營湎1?=1中<=i1=1i=i
140285615674676283
解析(1)由散點圖可知,產Sr更適宜作為幼苗高度y關于時間x的回歸方程類型.
⑵令〃二爪,則尸川G+d構造新的成對數據,如下表所示:
/p>
P=Vx1234567
y0479111213
求得百4,7=8.
£-
M〃
-r
iy埠UV
-283-7X4X859
i=7l-2U
£-1407X1628,
』17rg
3
一
平-
.
r-c-7
,?.y關于〃的回歸方程為蟾
Zo7
則y關于x的回歸方程為胃岳年
3
-
取尸29,可得29二?7解得g195天.
Zb
???預測苗圃基地需要培育195天.
角度三相關系數及其應用
典例3(2020課標全國〃,18,12分)某沙漠地區經過治理,生態系統得到很大改善,野生動
物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些
地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據3,z)(;=1,2,…,20),其
中>和乂分別表示第/個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得
2020202020
Zx=60,Zyp\200,£(J-X)2=80,£(必-歹尸二9000,Z(y-y)=800.
i=li=li=li=li=l
(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動
物數量的平均數乘地塊數);
⑵求樣本u,yj(7=1,2,…,20)的相關系數(精確到求01);
(3)根據現有統計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地
區這種野生動物數量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.
n
附:相關系數廣2n2,V2^1.414.
££心
-X)
=l(=1
20
解析⑴由己知得樣本平均數方1卷與匕*。,從而該地區這種野生動物數量的估計值為
60X200=12000.
⑵樣本(檢入)(凡2,…,20)的相關系數
20
廠¥產田(力爭____2*o94
J2020V80X90003
(3)分層抽樣:根據植物覆蓋面積的大小對地塊分層,再對200個地塊進行分層抽樣.
理由如下:由⑵知各樣區的這種野生動物數量與植物覆蓋面積有很強的正相關.由于各地塊間
植物覆蓋面積差異很大,從而各地塊間這種野生動物數量差異也很大,采用分層抽樣的方法較好
地保持了樣本結構與總體結構的一致也提高了樣本的代表性,從而可以獲得該地區這種野生動
物數量更準確的估計,
名師點評
L線性回歸分析問題:
(1)求線性回歸方程:
結合公式和已知數據,求出取歹等數據,再求回歸系數b,a.
(2)利用回歸方程進行預測,把線性回歸方程看作一次函數,求函數值.
(3)利用回歸直線判斷正、負相關,系數匕決定是正相關還是負相關,
2.模型擬合效果的判斷:
⑴殘差平方和越小,模型的擬合效果越好.
(2)相關指數〃越大,模型的擬合效果越好.
3,非線性回歸方程的求法:
⑴根據原始數據(>/)作出散點圖,
(2)根據散點圖選擇恰當的擬合函數.
(3)作恰當的變換,將其轉化成線性函數,求線性回歸方程.
(4)在(3)的基礎上通過相應變換,即可得到非線性回歸方程.
哥對訓練
1.已知某企業近3年的前7個月的月利潤(單位:百萬元)如下面的折線圖所示:
⑴試問這3年的前7個月中哪個月的月平均利潤最高;
⑵通過計算判斷這3年的前7個月的總利潤的發展趨勢;
⑶第3年的前4個月的數據如'F表,用線性回歸的擬合模型估計第3年8月份的利潤.
月份x1234
利潤y(單位:百萬元)4466
由?八Tu£蟲㈤仇-y)^xnxy
相關公式:b土、----廣寧--i-y-r---1
ET廠后2£%卜府2
1=1i=i1
a=y-bx.
解析(1)由折線圖可知這3年的5月和6月的平均利潤最高.
(2)第1年的前7個月的總利潤為
1+2+3+5+6+7+4=28(百萬元),
第2年的前7個月的總利潤為2+5+5+4+5+5+5=31(百萬元),
第3年的前7個月的總利澗為4+4+6+6+7+6+8=41(百萬元),
故這3年的前7個月的總利潤呈上升趨勢.
2222
(3)Vx=2.5,y=5,,Sx?=l+2+3+4=30,X4+2X4+3X6+4X6=54,二吟治簧。8,
a-5-2.5X0.8=3,/.y=0.8x+3,
當齊8時,y=0,8X8+3=9,4.
,估計第3年8月份的利潤為9.4百萬元.
2.(2019廣西聯考)某公司為了準確地把握市場,做好產品生產計劃,對過去四年的數據進行整理
得到了第x年與年銷售量「(單位:萬件)之間的關系如表:
X1234
y12284256
⑴在圖中畫出表中數據的散點圖;
兩件
60
50
40
30
20
10
―01~123^1/4
(2)根據(1)中的散點圖判斷y與x的回歸模型的類型,并用相關系數加以說明;
⑶建立y關于>的回歸方程,預測第5年的銷售量約為多少.
I44£(x--x)(y.-y)
附力r(y廣力2^327,遙石2.24,£幾片418.相關系數「"藍'{回歸方程飛出
N1=11=1
£片力中才y_—
的斜率和截距的最小二乘估計分別為如二---------,spy-bx.
Lxf-nx2
解析(1)作出的散點圖如圖:
0I234〃年
(2)由⑴散點圖可知,各點大致分布在一條直線附近,故可用線性回歸模型擬合y與x的關系.
又打,爐*£*=30,
//i=i
£](后動(必-歹)二*0=&y=418-4x|Xy=73,
J?]?療)2=Jg*4.2=卜0-4乂(|)二帆、2,24,
4
S(xrx)(yry)
一i=i73
1_r二七一--七0.9966.
2.24X32.7
2
_E(xrx).L(yry)
,?)與》的相關系數近似為0.9966,說明y與丫的線性相關程度相當強,,可以用線性回歸模
型擬合y與x的關系.
..4____
£XiVi-4xy
⑶由⑵知設y=b^Q,b=氣-----=-
£備4連5
i=i123
a于位:2.故y關于*的回歸方程為y號尸2,當尸5時,y—X5-2二71,
預測第5年的銷售量約為71萬件.
3.(2020福建南平三模)千百年來,人們一直在通過不同的方式傳遞信息.在古代,烽火狼煙、飛
鴿傳書、快馬驛站等通信方式被人們廣泛傳知;第二次工業革命后,科技的進步帶動了電訊事業
的發展,電報、電話的發明讓通信領域發生了翻天覆地的變化;之后,計算機和互聯網的出現則
使得“千里眼”“順風耳”變為現實,……,此時此刻,5G的到來即將給人們的生活帶來顛覆性
的變革.某科技創新公司基于領先的技術水平,豐富的移動互聯網應用等明顯優勢,該公司的5G
經濟收入在短期內逐月攀升,業內預測,該創新公司在第1個月至第7個月的5G經濟收入y(單
(1)為了更充分運用大數據、人工智能、5G等技術,公司需要派出員工實地考察,檢測產品性能
和使用狀況,公司領導要從報名的五名科技人員從B、C、D、£中隨機抽取3個人前往,則/、B
同時被抽到的概率為多少?
⑵根據散點圖判斷,尸己盧6與片c?人由c,d均為大于零的常數)哪一個更適宜作為5G經濟
收入y關于月份x的回歸方程類型?(給出判斷即可,不必說明理由)并根據你的判斷結果及表中
的數據,求出y關于x的回歸方程;
⑶請你預測該公司8月份的5G經濟收入.
參考數據:
其中設v=igy,右igy(-
參考公式:對于一組具有線性相關關系的數據(檢匕)(41,2,3,…,力,其回歸直線〃邛ea的斜率
.n_八
Lx;v;-n5cv?
和截距的最小二乘估計公式分別為用耳「廣a行邛x.
a/,nx
解析(1)從爾氏C、〃、£中隨機抽取3個人,其基本事件為
(44。,(44〃),(4氐£),(4C〃),(4C£),(4〃£),(&C;鹵,(&CQ,(4〃"),匕〃£),共
10個,48同時被抽到的事件為(45,0,UB,。),(4&£),共3個,則48同時被抽到的概率為
3
10,
⑵根據散點圖判斷,產。?"更適宜作為5G經濟收入y關于月份x的回歸方程類型.
對六c,〃兩邊同時取常用對數,得1g片lg(c?(/)=lgc+xlgd./.rigc+jlgd,
Vx=y=4,萬二產?L54,_£xf=140,
.7
J^V_50-12-7X4X1.54,^^
d2
.L?-7X140-7X4228
把樣本中心點(4,1.54)代入尸1gc+0,25?茍得1g北0.54,
,折0.54+0.25*,即1g發0.54+0.25*,?'.y關于》的回歸方程為
y二1嚴電25n0°"X(IO025)-3.47X10*25;
⑶由⑵得力二3.47X10產
把年8代入上式得,y=3.47X10°25XM47,
故預測該公司8月份的5G經濟收入為347百萬元.
整直目獨立性檢驗葡頻
典例4某工廠有25周歲以上(含25周歲)的工人300名,25周歲以下的工人200名,為研
究工人的日平均生產件數是否與年齡有關,現采用分層抽樣的方法,從中選取了100名工人,先
統計了他們某月的日平均生產件數,然后按工人的年齡分為“25周歲以上(含25周歲)”和“25
周歲以下”兩組,再將兩組工人的日平均生產件數分成5
組:[50,60),[60,70),[70,80),[80,90),[90,100],分別加以統計,得到如圖所示的頻率分布直
方圖.
典率
組距
0.0330.....................[―
0.0200.....................
QXX1S0----------?
<)-1mloo.4的0平
25則歲以的25周歲聞均生產的k
⑴根據“25周歲以上(含25周歲)組”的頻率分布直方圖,求25周歲以上(含25周歲)組
的工人的日平均生產件數的中位數的估計值(四舍五入保留整數);
(2)規定日平均生產件數不少于80的工人為生產能手,請你根據己知條件完成2X2列聯表,
并判斷是否有90黜把握認為“生產能手與工人所在的年齡組有關”.
生產能手非生產能手合計
25周歲以上(含25周歲)組
25周歲以下組
合計
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
P(儲]%)0.1000.0500.0100.001
kn2.7063.8416.63510.828
解析采用分層抽樣的方法,從“25周歲以上(含25周歲)組”應選取工人
100X正抵=60(名),從“25周歲以下組”應選取工人100X正巖:40(名).
(1)由“25周歲以上(含25周歲〕組”的頻率分布直方圖可知,其中位數為
70+iox空牌吧三73(件),
綜上,25周歲以上(含25周歲)組的工人日平均生產件數的中位數的估計值為73件.
(2)由頻率分布直方圖可知,25周歲以上(含25周歲)組的生產能手共有60X[(0,020
0+0,0050)X10kl5(名),25周歲以下組的生產能手共有40X[(0,0325+0,005
0)X10]=15(名),則2X2列聯表如下:
生產非生產
合計
能手能手
25周歲以上
154560
(含25周歲)組
25周歲以下組152540
合計3070100
冰型蒜絮手書司.786〈2.706,所以沒有90嫡把握認為“生產能手與工人所在的
年齡組有關”.
方法技巧
獨立性檢驗的一般步驟
1.求“有多大把握”“犯錯誤的概率”的題型:
(1)根據樣本數據列出2X2列聯表;
(2)計算隨機變量片的觀測值k,查表確定臨界值心(符合42外的最大Ab);
(3)推斷有口-戶(筋X100軸)把握認為有關系,或在犯錯誤的概率不超過P(r2禽)的前
提下認為有關系,
2.判斷是否有回舶<)把握的題型:
(1)根據樣本數據列出2X2列聯表;
⑵計算隨機變量尸的觀測值k,根據川粉[1-尸(/》左)]X100%求產(左2%)),查表確定臨界
值均,比較北與4的大小;
(3)判斷是否有用轆]把握認為有關系.
哥對訓練
(202()課標〃健,18,12分)某學生興趣小組隨機調查了某市100天中每天的空氣質量等級和當
天到某公園鍛煉的人次,整理數據得到下表(單位:天):
鍛煉人次
[0,200](200,400](400,600]
空氣質量等級
1(優)21625
2(良)51012
3(輕度污染)678
4(中度污染)720
(1)分別估計該市一天的空氣質量等級為1,2,3,4的概率;
(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數據用該組區間的中點值為代表);
⑶若某天的空氣質量等級為1或2,則稱這天“空氣質量好”;若某天的空氣質量等級為3或4,
則稱這天“空氣質量不好”.根據所給數據,完成下面的2X2列聯表,并根據列聯表,判斷是否
有95輛把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關.
人次W400人次》400
空氣質量好
空氣質量不好
附?/二____…兒)_____
叩…(a+b)(c+d)(a+c)(b+d)'
0.0500.0100.001
Ao3.8416.63510,828
彳解析(1)由所給數據,該市一天的空氣質量等級為1,2,3,4的概率的估計值如下表:
空氣質量等級1234
概率的估計值0.430.270.210.09
(2)一天中到該公園鍛煉的平均人次的估計值為京X(100X20+300X35+500X45),350.
⑶根據所給數據,可得2X2列聯表:
人次W400人次>400
空氣質量好3337
空氣質量不好228
根據列聯表得“00X(33X8-22X37)工£
55x45x70x30
由于5.820〉3,841,故有95舶勺把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關.
I夯基提能作亞|
A組基礎達標
1.(2020安徽淮南月考)變量X與y相對應的一組數據為
(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量〃與『相對應的一組數據為
(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).△表示變量?與X之間的線性相關系數,不表示
變量/與〃之間的線性相關系數,則()
A.涼水0B.0<*QC."0"D.r2=r1
答案C對于變量Y與4而言,HfiX的增大而增大,故Y與X成正相關,即石〉0;對于變量「與
〃而言"/隨〃的增大而減小,故,與U成負相關,即水0,故選C.
2.(2020課標全國I,5,5分)某校一個課外學習小組為研究某作物種子的發芽率y和溫度x(單
位:t)的關系,在20個不同的溫度條件下進行種子發芽實驗,由實驗數據(必必)(;=1,2,…,20)
得到下面的散點圖;
由此散點圖,在10℃至4(TC之間,下面四個回歸方程類型中最適宜作為發芽率y和溫度X的
回歸方程類型的是()
A.y=a^bxB.六肝加C.片行6e'D.y=a^blnx
答案D觀察題中散點圖可知,散點圖用光滑曲線連接起來比較接近對數型函數的圖象,故選D.
3.(2020江西南昌大學附中模擬)某公司在2015-2019年的收入與支出情況如下表所示:
收入4億元)2.22.64.05.35.9
支出y(億元)0.21.52.02.53.8
根據表中數據可得回歸方程為尸0.8Ha,依此估計該公司收入為8億元時的支出為()
A.4.2億元B.4.4億元C.5.2億元口.5.4億元
答案C
4.為了解某社區居民購買水果和牛奶的年支出費用與購買食品的年支出費用的關系,隨機調查
了該社區5戶家庭,得到如下統計表:
購買食品的年支
2.092.152.502.842.92
出費用"萬元
購買水果和牛奶的
1.251.301.501.701.75
年支出費用"萬元
根據上表可得回歸方程y%戶Q,其中加0.59,a-y-bxf據此估計,該社區一戶購買食品的年支出
費用為3.00萬元的家庭購買水果和牛奶的年支出費用約為()
A.1.795萬元B.2.555萬元
C.1.915萬元D.1.945萬元
2,09十2,15十2,50十2,84+2.92_250(萬元)
答案AX'
-1.25+1.30+1.50+1.70+1.75.「“十一、
y=---------------------=L50(77兀)
匕二0.59,則好片加口).025,y=0.59Ao.025,故該社區購買食品的年支出費用為3.00萬元的家庭
購買水果和牛奶的年支出費用約為y=0.59X3.00+0.025=1.795(萬元).
5.為了研究某班學生的腳長x(單位:用米)和身高y(單位:厘米)的關系,從該班隨機抽取10名
學生,根據測量數據的散點圖可以看出y與>之間有線性相關關系,設其回歸直線方程為點
1010
已知E出=225,Ey尸1600,加4.該班某學生的腳長為24,據此估計其身高為()
i=li=l
A.ieoB.163C.166D.170
答案C由題意可知工二22.5,尸160,?',160=4X22.5+a,解得Q=70,?',尸4肝70,?'.當產24
時,發4X24+70=166,故選C.
6.某單位為了了解用電量y(千瓦時)與氣溫x(C)之間的關系,隨機統計了某4天的用電量與當
天氣溫,并制作了如下對照表:
氣溫(℃)181310-1
用電量(千瓦時)24343864
由表中數據得回歸直線方程度從葉。中的爐-2,預測當氣溫為-4c時,用電量為千瓦
時.
答案68
解析回歸直線過樣本點的中心區》),由已知得*吧產二10,歹二2.34:38+64二10,將(4,物)
代入y二-2戶a,解得a=60,則/-2m'60、當行-4時,盧(-2)X(-4)+60=68,即當氣溫為-4℃時,用
電量約為68千瓦時.
7.一個車間為了規定工時,需要確定加工零件所花費的時間,為此進行了10次試驗來收集數據,
由第,.次試驗零件個數元(單位:個)與加工零件所花費的時間匕(單位:小時)的數據資料,得
10101010
L%r80,Z%二20,Lx^=184,X壯二720,那么加工零件所花費的時向y與零件個數¥之間的線
i=li=li=li=l
性回歸方程為.
答案y=0.3六0.4
解析爐10,所以工二二£々=£=8,歹=二£=個=2,又Exf-/]J2=720-
nf=i10"i=l10[=i
n*
10X82=80,E即%-麗=184-10X8X2=24,由此得b=-=0.3,a=y-hx=2-0,3X8=-0,4,
i=l80
故所求線性回歸方程為y=0.3J-0.4.
8.(2019河北名校聯考)某企業有兩個分廠生產某種零件,按規定內徑尺寸(單位:mm)的值落在
[29.94,30.06)內的零件為優質品,從兩個分廠生產的零件中各抽出了500件,量其內徑尺寸,得
如下統計表:
甲廠:
分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)
頻數126386182
分組[30.02,30.06)[30.06,30.10)[30.10,30.14]
頻數92614
乙廠:
分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)
頻數297185159
分組[30.02,30.06)[30.06,30.10)[30.10,30.14]
頻數766218
(1)試分別估計兩個分廠生產的零件的優質品率;
⑵由以上統計數據完成下面2X2列聯表,并判斷是否有99血把握認為“兩個分廠生產的零件
的質量有差異”.
甲廠乙廠總計
優質品
非優質品
總計
附:鼠宙窗然
0.0500.0250.0100.0050.001
k3.8415.0246.6357.87910.828
解析⑴從甲廠抽查的500件產品中有360件優質品,從而估計甲廠生產的零件的優質品率為
夢1。眸72%;
從乙廠抽查的500件產品中有320件優質品,從而估計乙廠生產的零件的優質品率為
320
薪X10。依64%
(2)完成的2X2列聯表如下:
甲廠乙廠總計
優質品360320680
非優質品140180320
總計5005001000
由表得禰號恐鬻等?,353>6,635,所以有9網把握認為“兩個分廠生產的零件
的質量有差異”.
B組能力拔高
9.某公司為了了解廣告投入對銷售收益的影響,在若干地區各投入4萬元廣告費用,并將各地的
銷售收益繪制成頻率分布直方圖(如圖所示).由于工作人員操作失誤,橫軸的數據丟失,但可以
確定橫軸是從0開始計數的.
(1)根據頻率分布直方圖計算圖中各小長方形的寬度;
(2)估計該公司投入4萬元廣告費用之后,對應的銷售收益的平均值(以各組的區間中點值代表
該組的取值);
(3)該公司按照類似的研究方法,測得另外一些數據,并整理得到下表:
廣告投入>(單位:萬元)12345
銷售收益y(單位:萬元)2327
表中的數據顯示,X與y之間存在線性相關關系,請將⑵中的結果填入空白欄,并求出y關于
彳的線性回歸方程.
_n__n__
£(xrx)(yry)£x^-nxy
相關公式:加3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論