




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
專題28統計案例和回歸方程
【考點預測】
知識點一、變量間的相關關系
1、變量之間的相關關系
當自變量取值一定時,因變量的取值帶有一定的隨機性,則這兩個變量之間的關系叫相關關系.由于
相關關系的不確定性,在尋找變量之間相關關系的過程中,統計發揮著非常重要的作用.我們可以通過收
集大量的數據,在對數據進行統計分析的基礎上,發現其中的規律,對它們的關系作出判斷.
注意:相關關系與函數關系是不同的,相關關系是一種非確定的關系,函數關系是一種確定的關系,
而且函數關系是一種因果關系,但相關關系不一定是因果關系,也可能是伴隨關系.
2、散點圖
將樣本中的n個數據點(x,,%)(,=1,2,…,?)描在平面直角坐標系中,所得圖形叫做散點圖.根據散點圖
中點的分布可以直觀地判斷兩個變量之間的關系.
(1)如果散點圖中的點散布在從左下角到右上角的區域內,對于兩個變量的這種相關關系,我們將它
稱為正相關,如圖(1)所示;
(2)如果散點圖中的點散布在從左上角到右下角的區域內,對于兩個變量的這種相關關系,我們將它
稱為負相關,如圖(2)所示.
(1)(2)
3、相關系數
若相應于變量l的取值玉,變量丁的觀測值為%(IV〃),則變量x與〉的相關系數
〃__n_
E(%-x)(%-y)2-nxy
r=IJ,I丁,通常用廠來衡量x與夕之間的線性關系的強弱,r
的范圍為-1VrVI.
(1)當r>0時,表示兩個變量正相關;當r<0時,表示兩個變量負相關.
(2)N越接近1,表示兩個變量的線性相關性越強;卜|越接近0,表示兩個變量間幾乎不存在線性相
關關系.當網=1時,所有數據點都在一條直線上.
(3)通常當上|>0.75時,認為兩個變量具有很強的線性相關關系.
知識點二、線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數關系的兩個變量之間的關系(相關關系)的方法.
對于一組具有線性相關關系的數據(XI,力),(X2,/),…,(X",%),其回歸方程i=+Z的求法為
n__n___
八E(西--y)ExJ-nxy
b=—----------------=號---------
t(七一^^x^-nx2
Z=1Z=1
a=y-bx
_i?_i?__
其中,x=-tXi,y=-tJyi,(X,y)稱為樣本點的中心.
,i
n=ni=i
2、殘差分析
對于預報變量y,通過觀測得到的數據稱為觀測值%,通過回歸方程得到的S稱為預測值,觀測值減
去預測值等于殘差,自稱為相應于點(4X)的殘差,即有?=殘差是隨機誤差的估計結果,通過對
殘差的分析可以判斷模型刻畫數據的效果以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差
分析.
(1)殘差圖
通過殘差分析,殘差點(%?)比較均勻地落在水平的帶狀區域中,說明選用的模型比較合適,其中這
樣的帶狀區域的寬度越窄,說明模型擬合精確度越高;反之,不合適.
(2)通過殘差平方和。=『分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;
;=1
反之,不合適.
(3)相關指數
£(%-%)2
用相關指數來刻畫回歸的效果,其計算公式是:心=1-4~—?
Z(z-y)2
Z=1
發越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.
知識點三、獨立性檢驗
1、分類變量和列聯表
(1)分類變量:
變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯表:
①定義:列出的兩個分類變量的頻數表稱為列聯表.
②2x2列聯表.
一般地,假設有兩個分類變量X和匕它們的取值分別為{xl,x2}和{jl,y2),其樣本頻數列聯表(稱
為2x2列聯表)為
%總計
aba+b
Cdc+d
總計a+cb+da+b+c+d
從2x2列表中,依據二與二的值可直觀得出結論:兩個變量是否有關系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖表示
列聯表數據的頻率特征.
(2)觀察等高條形圖發現,與'相差很大,就判斷兩個分類變量之間有關系.
a+bc+d
3、獨立性檢驗
(1)定義:利用獨立性假設、隨.機變量犬2來確定是否有一定把握認為“兩個分類變量有關系”的方法
稱為兩個分類變量的獨立性檢驗.
(2)公式:K2=-----"竺二巴--------,其中力=°+b+c+d為樣本容量.
(a+b)(c+d)(a+c)(b+d)
(3)獨立性檢驗的具體步驟如下:
①計算隨機變量K?的觀測值左,查下表確定臨界值勺:
2
P(K>k0)0.50.400.250.150.100.050.0250.0100.0050.001
ko0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828
②如果42虧,就推斷“x與y有關系”,這種推斷犯錯誤的概率不超過"K?2幻);否則,就認為在犯
錯誤的概率不超過p(K2N/)的前提下不能推斷“X與y有關系”.
(2)兩個分類變量x和y是否有關系的判斷標準:
統計學研究表明:
當片43.841時,認為X與y無關;
當片>3.841時,有95%的把握說X與y有關;
當片>6.635時,有99%的把握說X與丫有關;
當片>10.828時,有99.9%的把握說X與Y有關.
【典型例題】
例1.(山東省棗莊市2024屆高三學期3月模擬考試數學試題)某兒童醫院用甲、乙兩種療法治療小兒消化
不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到兩種療法治療數據的列聯表:
療效
療法合計
未治愈治愈
甲155267
乙66369
合計21115136
經計算得到力2x4.881,根據八概率值a=0.005的獨立性檢驗(已知/獨立性檢驗中無。儂=7.879),則可
以認為()
A.兩種療法的效果存在差異
B.兩種療法的效果存在差異,這種判斷犯錯誤的概率不超過0.005
C.兩種療法的效果沒有差異
D.兩種療法的效果沒有差異,這種判斷犯錯誤的概率不超過①005
【答案】C
【解析】零假設為X。:療法與療效獨立,即兩種療法效果沒有差異.
2
根據列聯表中的數據,Z-4.881<7,879=%,005,根據小概率值a=0.005的獨立性檢驗,
沒有充分證據推斷以。不成立,
因此可以認為“°成立,
即認為兩種療法效果沒有差異.
故選:C.
例2.(四川省成都市2024屆高三學期第二次診斷性檢測文科數學試題)對變量x,y有觀測數據(%,%乂ieN*),
得散點圖1;對變量",v有觀測數據(%,vJ(ieN*),得散點圖2/表示變量xj之間的線性相關系數,馬表
示變量w#之間的線性相關系數,則下列說法正確的是()
A.變量x與〉呈現正相關,且聞<聞B.變量x與〉呈現負相關,且間>|目
C.變量x與了呈現正相關,且間>聞D.變量x與了呈現負相關,且同<問
【答案】C
【解析】由題意可知,變量的散點圖中,了隨X的增大而增大,所以變量X與了呈現正相關;
再分別觀察兩個散點圖,圖1比圖2點更加集中,相關性更好,所以線性相關系數間>目.
故選:C.
例3.(FHsxl225yli36)如圖,去掉點。(3,10)后,下列說法錯誤的是()
"y.£(10,12)
?0(3,10)
?C(4,5)
?B(2,4)
"(1,3)
-0x
A.相關系數廠變大
B.殘差平方和變大
C.決定系數R2變大
D.解釋變量x與預報變量y的相關性變強
【答案】B
【解析】去掉。(3,10)后,其他數據都在一條直線附近,變量x與變量夕的相關性變強,模型擬合效果變
好,故殘差平方和變小.
例4.(湖南省2024年普通高等學校招生全國統一考試考前演練二數學試題)某騎行愛好者在專業人士指導
下對近段時間騎行鍛煉情況進行統計分析,統計每次騎行期間的身體綜合指標評分x與騎行用時V(單位:
小時)如下表:
身體綜合指標評分(X)12345
用時(了/小時)9.58.87.876.1
由上表數據得到的正確結論是()
555
參考數據:一可、10,'(%一刃、7.06,£億一可同一刃=-8.4,V70^X8.402.
1=1J=1Z=1
-初入-7)
參考公式:相關系數:=IL.
也(%一)*(%-刃2
VZ=1Z=1
A.身體綜合指標評分x與騎行用時y正相關
B.身體綜合指標評分x與騎行用時了的相關程度較弱
C.身體綜合指標評分x與騎行用時了的相關程度較強
D.身體綜合指標評分x與騎行用時了的關系不適合用線性回歸模型擬合
【答案】C
5
'(%-可(K-7)
-8.4
【解析】因為相關系數,=i=l
557V10x7.06
Z=1Z=1
即相關系數近似為-1/與X負相關,且相關程度相當高,從而可用線性回歸模型擬合了與X的關系.
所以選項ABD錯誤,C正確.
故選:C.
例5.(四川省成都市第七中學2024屆高三學期期末數學試題)在某病毒疫苗的研發過程中,需要利用基因
編輯小鼠進行動物實驗.現隨機抽取100只基因編輯小鼠對該病毒疫苗進行實驗,得到如下2x2列聯表(部
分數據缺失):
被某病毒感染未被某病毒感染合計
注射疫苗1050
未注射疫苗3050
合計30100
a0.10.050.010.0050.001
%2.7063.8416.6357.87910.828
計算可知,根據小概率值々=的獨立性檢驗,分析“給基因編輯小鼠注射該種疫苗能起到預防該病毒
感染的效果”()
n(ad-bc)~,,
附:Z2-----------------,n=a+b+c+a.
(a+b)(c+d)(a+c)(b+d)
A.0.001B.0.05C.0.01D.0.005
【答案】B
【解析】完善2x2列聯表如下:
被某病毒感染未被某病毒感染合計
注射疫苗104050
未注射疫苗203050
合計3070100
假設:“給基因編輯小鼠注射該疫苗不能起到預防該病毒感染的效果”.
100(10x30-20x40)2
因為:力2?4.762,而3.841<4.762<6.635,
30x70x50x50
所以根據小概率值a=0.05的獨立性檢驗,推斷久不成立.
即認為“給基因編輯小鼠注射該疫苗能起到預防該病毒感染的效果”.
故選:B
例6.(云南省曲靖市2024屆高三學期第一次質量監測數學試題)已知變量V關于x的回歸方程為3=/“。-6,
若對3=a一°6兩邊取自然對數,可以發現inj與無線性相關.現有一組數據如下表所示:
X12345
yee3e4e6e7
貝U當x=6時,預測了的值為()
A.9B.8C.e9D.e8
【答案】C
【解析】令〃=lny,由了=可得〃=足了=3x—0.6,如下表所不:
X12345
yee3e4e6e7
u13467
1+2+3+4+5c-1+3+4+6+7
由表格中的數據可得已=------------------=3,u=-------------------=44.2,
55
貝!I有步-0.6=4.2,解得務=1,6,故「=屋6工46,
當x=6時,y=e1,^6-0,6=e9.
故選:C.
例7.(山東省濱州市2024屆高三學期期末數學試題)某學校一同學研究溫差x(單位:。C)與本校當天新
增感冒人數了(單位:人)的關系,該同學記錄了5天的數據:
X568912
y1620252836
由上表中數據求得溫差x與新增感冒人數了滿足經驗回歸方程3=癥+2.6,則下列結論不乖理的是()
A.x與了有正相關關系B.經驗回歸直線經過點(8,25)
C.3=2.4D.x=9時,殘差為0.2
【答案】C
【解析】由表格可知,X越大,V越大,所以X與y有正相關關系,故A正確;
_5+6+8+9+12。_16+20+25+28+36?
x——o,y—=25,
樣本點中心為(8,25),經驗回歸直線經過點(8,25),故B正確;
將樣本點中心代入直線方程,得25=筋+2.6,所以5=2.8,故C錯誤;
y=2.8x+2.6,當尤=9時,9=27.8,了-夕=28-27.8=0.2,故D正確.
故選:C
例8.(云南省大理白族自治州2024屆高三第二次復習統一檢測數學試題)已知某種商品的廣告費支出x(單
.(殘差=觀測
【答案】-1.5
【解析】x=1x(l+3+4+5+7)=4,j=|x(15+20+30+40+45)=30,
因為回歸直線過點(4,30),代入?=5.5x+4,可得30=5.5x4+碗=8,
當x=7時,3=5.5x7+8=38.5+8=46.5,
所以殘差為45-46.5=-1.5.
故答案為:-1.5
例9.(天津市八校聯考2023-2024學年高三學期期末質量調查數學試卷)學習于才干信仰,猶如運動于健
康體魄,持之已久、行之愈遠愈受益.為實現中華民族偉大復興,全國各行各業掀起了“學習強國”的高潮.某
老師很喜歡“學習強國”中“挑戰答題”模塊,他記錄了自己連續七天每天一次最多答對的題數如下表:
天數X1234567
一次最多答對題數y12151618212427
777
參考數據:x=4,歹=19,\>;=140,?>;=2695,£%乂=600,2.45,
z=lz=li=l
由表中數據可知該老師每天一次最多答對題數y與天數x之間是相關(填“正”或"負”),其相關系數
(結果保留兩位小數)
【答案】正0.99
【解析】由表中數據得了隨x的增大而增大,
所以該老師每天一次最多答對題數y與天數x之間是正相關,
£町-7取
r=-------——
600-7x4x191能;,4二0.99
V140-7x4272695-7xl92!V72V427x2.45
故答案為:正;0.99.
例10.(2024年普通高等學校招生全國統一考試數學文科猜題卷(七))近年來,隨著國家對新能源汽車產
業的支持,很多國產新能源汽車迅速崛起,其因顏值高、動力充沛、提速快、空間大、用車成本低等特點
得到民眾的追捧,但是充電難成為影響新能源汽車銷量的主要原因,國家為了加快新能源汽車的普及程度,
在全國范圍內逐步增建充電樁.某地區2019-2023年的充電樁數量及新能源汽車的年銷量如表所示:
年份20192020202120222023
充電樁數量X/萬臺13579
新能源汽車年銷量M萬輛2537485872
(1)已知可用線性回歸模型擬合了與x的關系,請用相關系數加以說明(結果精確到0.001);
(2)求了關于x的線性回歸方程,預測當該地區充電樁數量為24萬臺時,新能源汽車的年銷量是多少萬輛?
£(x,.-x)(y2.-y)
參考公式:相關系數一下士,回歸方程f=&+%中斜率和截距的最小二乘估計公式分
V1=11=1
.__
別為6=i1I-,a=y-bx.
5_5_5________
參考數據:£(X,-X)2=40,=1326,]*%=1430,753040^230.3041.
1=1i=li—1
-1—1
【解析】(1)由題知x=《x(l+3+5+7+9)=5,y=《x(25+37+48+58+72)=48,
5_5_5
又E(X,-X)2=40,-"=1326,£X,%=1430,
1=1i=li=l
5
-5
1430-5x5x48230
?999,
一740x1326530.3041
因為歹與x的相關系數近似為0.999,非常接近1,
所以y與x的線性相關程度很高,可以用線性回歸模型擬合丁與x的關系.
.f(x,-x)(Z-7)230——
(2)b3-j----------------==5.75,&=y-6x=48-5.75x5=19.25,
40
Z=1
所以y關于x的線性回歸方程為3=5.75X+19.25.
當x=24時,5.75x24+19.25=157.25,
故當充電樁數量為24萬臺時,該地區新能源汽車的年銷量為157.25萬輛.
例11.(湖北省七市州2024屆高三學期3月聯合統一調研測試數學試題)某高中學校為了解學生參加體育
鍛煉的情況,統計了全校所有學生在一年內每周參加體育鍛煉的次數,現隨機抽取了60名同學在某一周參
加體育鍛煉的數據,結果如下表:
一周參加體育鍛煉次數01234567合計
男生人數1245654330
女生人數4556432130
合計579111086460
(1)若將一周參加體育鍛煉次數為3次及3次以上的,稱為“經常鍛煉”,其余的稱為“不經常鍛煉”.請完成
以下2x2列聯表,并依據小概率值a=0.1的獨立性檢驗,能否認為性別因素與學生體育鍛煉的經常性有關
系;
鍛煉
性別合計
不經常經常
男生
女生
合計
(2)若將一周參加體育鍛煉次數為0次的稱為“極度缺乏鍛煉”,“極度缺乏鍛煉”會導致肥胖等諸多健康問
題.以樣本頻率估計概率,在全校抽取20名同學,其中“極度缺乏鍛煉”的人數為X,求E(X)和。(X);
(3)若將一周參加體育鍛煉6次或7次的同學稱為“運動愛好者”,為進一步了解他們的生活習慣,在樣本的
10名“運動愛好者”中,隨機抽取3人進行訪談,設抽取的3人中男生人數為Y,求Y的分布列和數學期望.
2_n(ad-6c了
附:,(a+6)(c+d)(a+c)(b+d)n-a+b+c+d
a0.10.050.01
%2.7063.8416.635
【解析】(1)根據統計表格數據可得列聯表如下:
鍛煉
性別合計
不經常經常
男生72330
女生141630
合計213960
零假設為"。:性別與鍛煉情況獨立,即性別因素與學生體育鍛煉的經常性無關;
根據列聯表的數據計算可得
60(7x16-23x14)260x(7x30)2140
Z2---------------------=------X3.590>2.706=%1
21x39x30x3021x39x30x3039
根據小概率值a=0.1的獨立性檢驗,推斷久不成立,
即性別因素與學生體育鍛煉的經常性有關系,此推斷犯錯誤的概率不超過0.1
(2)因學校總學生數遠大于所抽取的學生數,故X近似服從二項分布,
易知隨機抽取一人為“極度缺乏鍛煉”者的概率尸**
即可得丫~8(20,《],
故£(X)=20x'=9,£>(X)=20x—x—.
v7123v7121236
(3)易知10名“運動愛好者”有7名男生,3名女生,
所以F的所有可能取值為0』,2,3;
且y服從超幾何分布:
/^0/~*31z^rl
尸(丫=。)=符=占,尸(y=i)=眷21_7
5oiZU5o120^-40
故所求分布列為
Y0123
17217
P
120404024
可得3如4+1><02*+3><>票
例12.(陜西省漢中市漢臺區2024屆高三學期第四次校際聯考數學試題)大學生劉銘去某工廠實習,實習
結束時從自己制作的某種零件中隨機選取了10個樣品,測量每個零件的橫截面積(單位:mm2)和耗材量
(單位:mm3),得到如下數據:
樣本號i12345678910總和
零件的橫截面積X,0.030.050.040.070.070.040.050.060.060.050.52
耗材量%0.240.400.230.550.500.340.350.450.430.413.9
10(10_2
并計算得?>比=0.2143,-I。x=1.4336乂0t
j=li=l
(1)估算劉銘同學制作的這種零件平均每個零件的橫截面積以及平均一個零件的耗材量;
(2)求劉銘同學制作的這種零件的橫截面積和耗材量的樣本相關系數(精確到0.01);
(3)劉銘同學測量了自己實習期制作的所有這種零件的橫截面積,并得到所有這種零件的橫截面積的和為
182mm2,若這種零件的耗材量和其橫截面積近似成正比,請幫劉銘計算一下他制作的零件的總耗材量的估
,71.49136?1.221
【解析】(1)樣本中10個這種零件的橫截面積的平均值》=芥=0.052,
樣本中10個這種零件的耗材量的平均值夕=芳=0.39,
由此可估算劉銘同學制作的這種零件平均每個零件的橫截面積為0.052mm2,
平均一個零件的耗材量為0.39mm3.
2%乂TO盯
0.2143-10x0.052x0.39
(2)r=4
fz2-io72V1.49136xl0~
i=l
1.151.15
0.94,
71,49136?1.221
這種零件的橫截面積和耗材量的樣本相關系數為0.94.
(3)設這種零件的總耗材量的估計值為rmn?,
又已知這種零件的耗材量和其橫截面積近似成正比,
0.052182,
二,=--->解得f=1365mm3,
0.39t
故這種零件的總耗材量的估計值為1365mm3.
例13.在一次抽樣調查中測得5個樣本點,得到下表及散點圖.
X0.250.5124
y1612521
加
16-
14-
12-?
10-
8-
6~
4-
2-?
*
_______I___|____|_____]?
O1234X
⑴根據散點圖判斷y=a+&與了=c+hx-哪一個適宜作為y關于x的回歸方程;(給出判斷即可,不必說明
理由)
(2)根據(1)的判斷結果試建立了與X的回歸方程;(計算結果保留整數)
^x^-n-x-y^(x,.-x)(y,,-j)
參考公式:b=R,----------=-----------,a=y-bx
^xj-n-x2之伍-可②
z=li=\
【解析】(I)由題中散點圖可以判斷,y=c+左適宜作為V關于X的回歸方程;
(2)令f=x-,則>=。+〃,原數據變為
t4210.50.25
y1612521
由表可知V與t近似具有線性相關關系,計算得F=;=1.55,
_16+12+5+2+1
了=—5—=72,
「4x16+2x12+1x5+0.5x2+0.25x1-5x1.55x7.238.45,
42+22+12+0.52+0.252-5x1.5529.3
所以,c=y-la=7.2-4x1.55=1,則夕=由+1.
所以歹關于》的回歸方程是夕=2+1.
【過關測試】
一、單選題
1.對四組數據進行統計,獲得以下散點圖,關于其樣本相關系數的比較,下列結論正確的是()
3535
3030
2525
2020
1515
1010
55
0510152025303505101520253035
樣本相關系數為小樣本相關系數為上
3535
3030
2525
2020
1515
1010
55
0510152025303505101520253035
樣本相關系數為-3樣本相關系數為-4
A.r2<r4<0<r3<rIB.r4<r2<0<rx<r3
C.〃<馬<0<々"D.弓<q<0"<4
【答案】B
【解析】由給出的四組數據的散點圖可以看出,
左側兩圖是正相關,樣本相關系數大于0,則4〉。,4〉。,
右側兩圖是負相關,樣本相關系數小于0,則々<0,〃<0,
下方兩圖的點相對更加集中,所以相關性較強,所以々接近于1,G接近于一1,
上方兩圖的點相對分散一些,所以相關性較弱,所以彳和4比較接近0,
由止匕可得q<4<0<4<4.
故選:B.
2.(上海市普陀區桃浦中學2024屆高三學期期末數學試題)下列命題中,真命題的是()
A.若回歸方程P=-2x+0.1,則變量歹與1負相關
B.線性回歸分析中決定系數用來刻畫回歸的效果,若該值越小,則模型的擬合效果越好
C.若樣本數據須,馬,???,/()的方差為2,則數據3石,3%2,…J%。的方差9
D.若P(/)與尸(3)獨立,則P(/uB)=P(4|5)P(4)
【答案】A
【解析】對于A,回歸方程為>=-2x+0.1,又???6=—0.2<0,所以變量歹與“負相關,故A正確,
對于B,線性回歸分析中決定系數改用來刻畫回歸的效果,若及2值越大,說明模型的擬合效果越好,故B
錯誤.
對于C,若樣本數據石,%2,…,再oo的方差為2,則數據3再,3%,…,3/o的方差32x2=18,故C錯誤,
對于D,擲一枚骰子,設事件/:點數小于3,則p(/)=;;
事件8:點數為偶數,則尸(2)=:,尸(")=:,
所以尸(4B)=P(A)P⑻,即尸⑷與P(B)獨立,
又尸(4|8)=與卻=q=(,P(AUB)=^P(A\B)P(A),故D錯誤.
9(8)36
,'2
故選:A.
3.(內蒙古呼和浩特市2024屆高三學期學業質量監測數學試題)用模型了=優底擬合一組數據組
(x"J(i=l,2,3,…,7),其中%+%+…+5=14,設2=lny,得變換后的線性回歸方程為]=x+l,則
%%,,,%=()
A.e35B.e21C.35D.21
【答案】B
【解析】由題意得1=網+%;…+號=2,
故z=x+l=3,
BPInj/j+Iny2+—I-\ny7=3x7=21,
故In5%…%)=21,解得必力…%=e2:
故選:B
4.(上海市浦東新區2024屆高三學期期中教學質量檢測數學試卷)通過隨機抽樣,我們繪制了如圖所示的
某種商品每千克價格(單位:百元)與該商品消費者年需求量(單位:千克)的散點圖.若去掉圖中右下方
246810每千克價格/百元
消費者年需求量與商品每千克價格的散點圖
A.“每千克價格”與“年需求量”這兩個變量由負相關變為正相關
B.“每千克價格”與“年需求量”這兩個變量的線性相關程度不變
C.“每千克價格”與“年需求量”這兩個變量的線性相關系數變大
D.“每千克價格”與“年需求量”這兩個變量的線性相關系數變小
【答案】D
【解析】對于A:去掉圖中右下方的點A后,根據圖象,兩個變量還是負相關,A錯誤;
對于BCD:去掉圖中右下方的點A后,相對來說數據會集中,相關程度會更高,
但因為是負相關,相關系數會更接近-1線性相關系數會變小,故D正確,BC錯誤.
故選:D.
二、多選題
5.(2024屆廣東省湛江市高三一模數學試題)某養老院有110名老人,經過一年的跟蹤調查,過去的一年
中他們是否患過某流行疾病和性別的相關數據如下表所示:
是否患過某流行疾病
性別合計
患過該疾病未患過該疾病
男a=20ba+b
女Cd=50c+d
合計a+c80110
下列說法正確的有()
n(ad-bcY
參考公式:z2其中n=a+b+c+d.
(a+6)(c+d)(a+c)G+d)
附表:
a0.10.050.0250.010.001
%2.7063.8415.0246.63510.828
a+bc+d
B.力2>6.635
C.根據小概率值a=0.01的獨立性檢驗,認為是否患過該流行疾病與性別有關聯
D.根據小概率值夕=0.01的獨立性檢驗,沒有充分的證據推斷是否患過該流行疾病與性別有關聯
【答案】ABC
【解析】根據列聯表中的數據可求得a=20,6=30,c=10,d=50;
對于A,代入計算可得一-=->——-=正確;
a+b5c+a6
對于B,經計算可得力2=U°x(20x50-30x10)2-7,486>6,635-可得B正確;
30x80x50x60
對于CD,結合附表數值以及獨立性檢驗的實際意義,可認為根據小概率值a=0.01的獨立性檢驗,認為是
否患過該流行疾病與性別有關聯,即C正確,D錯誤;
故選:ABC
6.(河北省滄州市泊頭市聯考2024屆高三學期高考模擬考試數學試題)下表是某地從2019年至2023年能
源消費總量近似值7(單位:千萬噸標準煤)的數據表:
年份20192020202120222023
年份代號X12345
能源消費總量近似值了(單位:千萬噸標準煤)44.244.646.247.850.8
以X為解釋變量,y為響應變量,若以戈=仇尤+4為回歸方程,則決定系數&y0.9298,若以
為回歸方程,則咫。0.9965,則下面結論中正確的有()
A.變量x和變量y的樣本相關系數為正數
B.%=仇%2+出工+。2比%=4工+%的擬合效果好
C.由回歸方程可準確預測2024年的能源消費總量
D.y=3b1+ax
【答案】ABD
【解析】對于A選項:隨著變量x的增加,變量了也在增加,故變量V和變量x成正相關,即樣本相關系數
為正數,正確;
對于B選項:因為無>庶,故%=為,+%》+。2比%=¥+4的擬合效果好,正確;
對于C選項:回歸方程可預測2024年的能源消費總量,不可準確預測,錯誤;
對于D選項:由回歸方程必過樣本中心點,可知歹=34+%,正確.
故選:ABD.
7.(FHsxl225yll36)(多選)某學校為了調查學生對“只要學習夠努力,成績一定有奇跡”這句話的認可程度,
隨機調查了90名本校高一、高二的學生,得到如下列聯表.用樣本估計總體,則下列說法正確的是(參考數
據:-不,n=a+b+c+d,P(x2>6.635)=0.010,P(Z2>10.828)=0.001)()
(a+o)(c+a)(a+c)(o+a)
認可不認可總計
高一202040
高二401050
總計603090
A.高一高二大約有66.7%的學生認可這句話
B.高一高二大約有99%的學生認可這句話
C.依據a=0.01的獨立性檢驗,認為學生對這句話認可與否與年級有關
D.在犯錯誤的概率不超過0.01的前提下,認為學生對這句話認可與否與年級無關
【答案】AC
【解析】隨機調查了90名學生,其中一共有60名學生認可,所以認可率大約為66.7%,1=加.:
abcdacba
90x20x1040x202
=9.因為6.635<9<10.828,故C正確,D錯誤.故選AC.
40x50x60x30
8.(安徽省蕪湖市安徽師范大學附屬中學2024屆高三第二次模擬考試數學試題)已知由樣本數據
2,3,…,10)組成的一個樣本,得到回歸直線方程為,=r+3,且1=4.剔除一個偏離直線較大的異常
點(-5,-1)后,得到新的回歸直線經過點(6,-4).則下列說法正確的是
A.相關變量x,y具有正相關關系
B.剔除該異常點后,樣本相關系數的絕對值變大
C.剔除該異常點后的回歸直線方程經過點(5,-1)
D.剔除該異常點后,隨x值增加相關變量y值減小速度變小
【答案】BC
【解析】依題意,原樣本中,1=T+3=-l,
剔除一個偏離直線較大的異常點(-5,-1)后,新樣本中,p=4xl0-(-5)=5p=-lxl0-(-l)=_b
因此剔除該異常點后的回歸直線方程經過點(5,-1),C正確;
由新的回歸直線經過點(6,-4),得新的回歸直線斜率為二=新,因此相關變量x,y具有負相關關系,
6-5
A錯誤;
又則剔除該異常點后,隨x值增加相關變量y值減小速度變大,D錯誤;
由剔除的是偏離直線較大的異常點,得剔除該點后,新樣本數據的線性相關程度變強,即樣本相關系數的
絕對值變大,B正確.
故選:BC
9.(湘豫名校聯考2024年2月高三第一次模擬考試數學試題)下列說法中,正確的是()
A.設有一個經驗回歸方程為?=1-2》,變量x增加1個單位時,j)平均增加2個單位
B.已知隨機變量自?N(0,,),若尸C>2)=0.2,則尸(一24442)=0.6
C.兩組樣本數據x,,x2,x3,x4和%,%,力,乂的方差分別為s;,si.若已知%+%=10且無,.<%。=1,2,3,4),
則S:=
D.已知一系列樣本點(x,,%)(z,=l,2,3,…)的經驗回歸方程為夕=3尤+3,若樣本點⑺,3)與(2,〃)的殘差
相等,則3刃+〃=10
【答案】BC
【解析】若有一個經驗回歸方程f=l-2x,隨著x的增大,夕會減小,A錯誤;
曲線關于x=0對稱,因為尸4>2)=0.2,所以尸代<-2)=0.2,
所以尸(_2Vg42)=l—/片>2)_尸?<_2)=0.6,B正確;
141414141
=i"=£,所以元
因為七+N4tM+7=z/+i5>,=a
Z=1""Z=1'?i='=1l'i=l'
2
4
x;—2X]X+x之+xj—2X2X+x之+…+%j—2X4X+x2
4
x;+%2+x;+x:-(2/+212+29+2%4)x_2
4
_xf+xf+xf+%4_2,-2_+-^2+x3+x4-2
------------------------ZoA-TX----------------X,
44
同理可得聞=仝”一干
(10-X)2+(10-X)2+(10-X)2+(10-X)2
1234-(10-x)2
4
400—20(%]+%2+、3+%4)+x;+x;+x;+%:
-(10-x)2
4
—廣+*。。+2-丁丁』」,
故s:=s;,C正確;
經驗回歸方程為,=3x+&,且樣本點(m,3)與(2,n)的殘差相等,
貝!|3-(3加+&)=〃一(6+&)=>3機+〃=9,D錯誤.
故選:BC.
10.(河南省部分重點中學2024屆高三學期2月質量檢測數學試題)已知變量尤/之間的經驗回歸方程為
y^~x+a,且變量xj的數據如下表所示:
6
X5681214
y108651
則下列說法正確的是()
A.變量%》之間負相關B.5=13
C.當x=3時,可估計V的值為11D.當x=8時,殘差為-1
【答案】AC
【解析】對于A選項,由-1■<(),可得變量X/之間負相關,故A選項正確;
6
_1_1
對于B選項,x=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高考歷史總復習高中歷史必修二八大專題知識復習提綱
- 安徽省百校聯贏名校大聯考2025屆九年級下學期中考二模道德與法治卷(含答案)
- 美相設計課程培訓
- 2025事業單位考試題庫及答案200題
- 護士儀容禮儀
- 深度剖析研究設計
- 物業員工日常行為規范
- 小學信息技術第1課 建立班級課程表教案設計
- 透析患者心衰的護理查房
- 建筑工程質量控制教案
- 2025年初級社會工作者綜合能力全國考試題庫(含答案)
- 幼兒園讀書分享會課件
- 天然氣維搶修崗位培訓
- 2024年我國人口老齡化問題與對策
- 螞蟻咬傷患者的護理
- 生物質氣化耦合氫合成綠色甲醇一體化項目可行性研究報告寫作模板-申批備案
- 新146道100以內四個數字的加減法混合題目
- 小學語文“的、地、得”專項練習(附答案)
- 《機器人技術應用項目教程》(第二版)課件 2-項目三 威綸觸摸屏的組態設計 任務一 觸摸屏的組態與連接;觸摸屏控制氣缸推動
- 《Linux系統管理與配置》課件-項目三-任務5-Linux防火墻
- 2024至2030年中國去中心化標識符(DID)市場現狀研究分析與發展前景預測報告
評論
0/150
提交評論