高考數學二輪復習專項訓練:統計與成對數據的統計分析(含答案及解析)_第1頁
高考數學二輪復習專項訓練:統計與成對數據的統計分析(含答案及解析)_第2頁
高考數學二輪復習專項訓練:統計與成對數據的統計分析(含答案及解析)_第3頁
高考數學二輪復習專項訓練:統計與成對數據的統計分析(含答案及解析)_第4頁
高考數學二輪復習專項訓練:統計與成對數據的統計分析(含答案及解析)_第5頁
已閱讀5頁,還剩52頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2025二輪復習專項訓練23

統計與成對數據的統計分析

[考情分析]高考近幾年考查熱點,主要考查線性回歸分析和獨立性檢驗,以實際應用題的

形式出現,題目閱讀量大,難度中檔.

【練前疑難講解】

一、用樣本估計總體

1.統計中的四個數據特征:

(1)眾數:在樣本數據中,出現次數最多的那個數據.

(2)中位數:在樣本數據中,將數據按從小到大順序排列,位于最中間的數據.如果數據的個

數為偶數,就取中間兩個數據的平均數作為中位數.

(3)平均數:樣本數據的算術平均數,即X=)X1+X2+…+/).

(4)方差與標準差:

1——————

52=-[(%]—X)2+(X2-X)2H---H(x?—尤)2],

s=q;[(xi-Xy+(尤2-X)2H---l-(x?—X)2].

2.頻率分布直方圖的兩個結論:

(1)小長方形的面積=組距>頻<率贏=頻率.

(2)各小長方形的面積之和等于1.

二、回歸分析

1.經驗回歸直線;=晨+聯經過樣本點的中心(三,V),若無取某一個值,代入經驗回歸方

AAA

程y=bx+a中,可求出y的估計值.

2.樣本相關系數:

當廠>0時,稱成對樣本數據正相關;當K0時,稱成對樣本數據負相關.

三、獨立性檢驗

1.獨立性檢驗的一般步驟

(1)根據樣本數據列成2X2列聯表;

(2)根據公式

/二/耳而喘毋E不,計算的值;

(3)查表比較/與臨界值的大小關系,作統計判斷.

2./的值越大,對應假設事件辦成立(兩類變量相互獨立)的概率越小,”不成立的概率越

大.

一、單選題

1.(2024?黑龍江哈爾濱?一模)為了迎接2025年第九屆亞冬會的召開,某班組織全班學生

開展有關亞冬會知識的競賽活動.已知該班男生35人,女生25人.根據統計分析,男生

組成績和女生組成績的方差分別為s;、s;,該班成績的方差為則下列結論中一定正確

的是()

B.T

A.s1

2

7s;+5s;D.八七

C.s1

12

2.(2024?天津和平?一模)某市為了減少水資源浪費,計劃對居民生活用水實施階梯水價制

度,為確定一個比較合理的標準,從該市隨機調查了100位居民,獲得了他們某月的用水

①估計居民月均用水量低于1.50?的概率為0.25;②估計居民月均用水量的中位數約為

2.1m3;③該市有40萬居民,估計全市居民中月均用水量不低于3m3的人數為6萬;④

根據這100位居民的用水量,采用樣本量按比例分配的分層隨機抽樣的方法,抽取了容量

為20人的樣本,則在用水量區間。52]中應抽取4人.

A.1B.2C.3D.4

二、多選題

3.(2024?湖南衡陽?模擬預測)中國雪鄉哈爾濱的看雪最佳時間在11月中旬到次年的2月

上旬,某旅游公司設計了一款冰雪文創產品.試營銷以來,這款冰雪文創產品定價x(單

位:元)與銷量、(單位:萬件)的數據如下表所示:

產品定價X(單位:元)99.51010.511

銷量y(單位:萬件)1110865

則下列結論正確的是()

參考公式:廠=1廠,?

\恒%-可5(%-刃~

VZ=1Z=1

555

參考數據:£(%—可=2.5,2(%-5)=26,£(—)(%-予)=-8,765?8.06.

i=li=li=l

A.產品定價x的平均值是10元

B.產品定價x與銷量y存在正相關關系

C.產品定價X與銷量y滿足一元線性回歸模型

D.產品定價x與銷量V的相關系數r7-0.99

4.(23-24高三下?山東荷澤?開學考試)下列說法正確的是()

A.若隨機變量X?以2,0.2),則尸(X=2)=0.2

B.若經驗回歸方程?=族+&中的A>0,則變量了與'正相關

C.若隨機變量x?N(0,s,且P3<-J=p,貝|]尸[0<J<m=g-p

D.若事件A與B為互斥事件,則A的對立事件與8的對立事件一定互斥

三、填空題

5.(2024?山東濟南?二模)現有A,2兩組數據,其中A組有4個數據,平均數為2,方差

為6,8組有6個數據,平均數為7,方差為1.若將這兩組數據混合成一組,則新的一組數

據的方差為.

6.(2024?廣西?二模)設實數x,y(4<x<y),滿足1,3,4,龍,》y+2的平均數與

50%分位數相等,則數據尤,》y+2的方差為.

四、解答題

7.(2024?安徽蕪湖,二模)據新華社北京2月26日報道,中國航天全年預計實施100次左

右發射任務,有望創造新的紀錄,我國首個商業航天發射場將迎來首次發射任務,多個衛

星星座將加速組網建設;中國航天科技集團有限公司計劃安排近70次宇航發射任務,發射

290余個航天器,實施一系列重大工程任務.由于航天行業擁有廣闊的發展前景,有越來越

多的公司開始從事航天研究,某航天公司研發了一種火箭推進器,為測試其性能,對推進

器飛行距離與損壞零件數進行了統計,數據如下:

飛行距離x(kkm)5663717990102110117

損壞零件數y(個)617390105119136149163

88

參考數據:元=86,y=112,82743,^x,2=62680

i=lz=l

⑴建立y關于x的回歸模型9=贏+&,根據所給數據及回歸模型,求y關于龍的回歸方程

(B精確到0.1,&精確到1);

(2)該公司進行了第二項測試,從所有同型號推進器中隨機抽取100臺進行等距離飛行測

試,對其中60臺進行飛行前保養,測試結束后,有20臺報廢,其中保養過的推進器占比

30%,請根據統計數據完成2x2列聯表,并根據小概率值c=0.01的獨立性檢驗,能否認為

推進器是否報廢與保養有關?

保養未保養合計

報廢20

未報廢

合計60100

£(王-丁)(%-y)

附:回歸方程亍=意+&中斜率和截距的最小二乘估計公式分別為-----------

£(乙-a

1=1

_2n(ad-bc}

a=y-bx,K=-------------------,n=a+b+c+d;

(a+b)(c+d)(a+c)(b+d)

2

P(K>kQ)0.250.10.050.0250.010.001

1.3232.7063.8415.0246.63510.828

8.(2022?全國?高考真題)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣

(衛生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例

(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下

數據:

不夠良好良好

病例組4060

對照組1090

(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛生習慣有差異?

⑵從該地的人群中任選一人,A表示事件"選到的人衛生習慣不夠良好”,8表示事件"選到

的人患有該疾病".儒1與M的比值是衛生習慣不夠良好對患該疾病風險程度的

一項度量指標,記該指標為R.

尸(A|B)P(A|B)

(回)證明:

P(A|B)-P(A|B)

(回)利用該調查數據,給出尸(Al3),P(A|心的估計值,并利用(回)的結果給出R的估計

值.

n{ad-bc)~

附K?=

(〃+b)(c+d)(a+c)(Z?+d)

P(K2>k]0.0500.0100.001

k3.8416.63510.828

【基礎保分訓練】

一、單選題

1.(23-24高三下?廣東?開學考試)國家統計局發布的2018年至2022年我國居民消費水平

情況如圖所示,則下列說法正確的是()

(居民消費水平:

農村居民消費水平>農村人口數+城鎮居民消費水平x城鎮人口數

農村人口數+城鎮人口數

?金額/元

3799538289

38672

3490034043口居民消費水平

|—|31013

29004^7504574^叼農村居民消費水平

25245

3430口城鎮居民消費水平

19336

15S2I16^(M

I1R39^

^^

9668^

^^S

20182019202020212022

A.2018年至2022年我國居民消費水平逐年提高

B.2018年至2022年我國城鎮居民消費水平逐年提高

C.2018年至2022年我國居民消費水平數據的60%分位數為27504元

D.2022年我國城鎮人口數比農村人口數的1.5倍還要多

2.(2023?貴州黔東南?模擬預測)"說文明話、辦文明事、做文明人,樹立城市新風尚!創

建文明城市,你我共同參與!”為宣傳創文精神,華強實驗中學高一(2)班組織了甲乙兩

名志愿者,利用一周的時間在街道對市民進行宣傳,將每天宣傳的次數繪制成如下頻數分

布折線圖,則以下說法不正聊的為()

甲、乙志愿者宣傳次數的頻數分布折線圖

A.甲的眾數小于乙的眾數B.乙的極差小于甲的極差

C.甲的方差大于乙的方差D.乙的平均數大于甲的平均數

3.(2024?海南?模擬預測)某機構統計了1000名演員的學歷情況,制作出如圖所示的餅狀

圖,其中本科學歷的人數為630.現按比例用分層隨機抽樣的方法從中抽取200人,則抽取

的碩士學歷的人數為()

博士及以上

A.11B.13C.22D.26

4.(2023?福建泉州?模擬預測)某市物價部門對某商品在5家商場的售價x(元)及其一天

的銷售量V(件)進行調查,得到五對數據(七,%)(i=l,2,3,4,5),經過分析、計算,得

x=10,9=8,尤,V之間的經驗回歸方程是:夕=-3.2%+4,則相應于點(9510)的殘差

為()

A.0.4B.1.5C.8D.9.6

二、多選題

5.(2024?河南三門峽?模擬預測)某燈具配件廠生產了一種塑膠配件,該廠質檢人員某日隨

機抽取了100個該配件的質量指標值(單位:分)作為一個樣本,得到如下所示的頻率分

布直方圖,則(同一組中的數據用該組區間的中點值作代表)()

A.m=0.030

B.樣本質量指標值的平均數為75

C.樣本質量指標值的眾數小于其平均數

D.樣本質量指標值的第75百分位數為85

6.(2024廣東?二模)若y是樣本數據占,%,鼻m4的平均數,則()

A.芯,々/3,匕的極差等于三,3,尤3,匕,,的極差

B.占,%,當,匕的平均數等于占,X2,玉,匕,y的平均數

C.百,尤2,工3,七的中位數等于再,工2,為3,匕,丫的中位數

D.國,%,毛,匕的標準差大于Xvx2,x3,x^,y的標準差

7.(2024?云南昆明?模擬預測)某城市在創建文明城市的活動中,為了解居民對“創建文明

城市”的滿意程度,組織居民給活動打分(分數為整數,滿分100分),從中隨機抽取一個

容量為100的樣本,發現數據均在[40,100]內.現將這些分數分成6組并畫出樣本的頻率分

如圖所示.觀察圖形,則下列說法正確的是()

A.頻率分布直方圖中第三組的頻數為15

B.根據頻率分布直方圖估計樣本的眾數為75分

C.根據頻率分布直方圖估計樣本的中位數為74分

D.根據頻率分布直方圖估計樣本的平均數為73分

8.(2024?湖北武漢?模擬預測)某科技公司統計了一款App最近5個月的下載量如表所

示,若y與x線性相關,且線性回歸方程為9=-0.6彳+。,則()

月份編號X12345

下載量y(萬次)54.543.52.5

A.'與x負相關B.a=5.6

C.預測第6個月的下載量是2.1萬次D.殘差絕對值的最大值為0.2

三、填空題

9.(2024?全國?模擬預測)某小組5位同學各拋擲一枚正方體骰子,將正面向上的點數按從

小到大的順序記錄下來,得到一組統計數據.已知這組數據的平均數為整數,最大值為

6,中位數為3,方差為1.6,則這組數據的眾數為.

10.(2024?四川成都?一模)某區為了解全區12000名高二學生的體能素質情況,在全區高

二學生中隨機抽取了1000名學生進行體能測試,并將這1000名的體能測試成績整理成如下

頻率分布直方圖.根據此頻率分布直方圖,這1000名學生平均成績的估計值為.

11.(2024?陜西西安?模擬預測)某企業近年來的廣告費用尤(百萬元)與所獲得的利潤V

(千萬元)的數據如下表所示,已知V與X之間具有線性相關關系.

年份20182019202020212022

廣告費用X/百萬元1.51.61.71.81.9

潤y/千萬元1.622.42.53

⑴求y關于*的線性回歸方程;

⑵若該企業從2018年開始,廣告費用連續每一年都比上一年增加10萬元,根據(1)中

所得的線性回歸方程,預測2025年該企業可獲得的利潤.

_n_n__

參考公式:3=上。-----------T---------,a=y-bx.

丁『之x;-位2

i=li=l

12.(2024?全國?模擬預測)中國新能源汽車企業在10余年間實現了“彎道超車",使我國一

躍成為新能源汽車產量連續7年居世界第一的全球新能源汽車強國.某新能源汽車配件企業

積極加大科研力度,生產效益逐步攀升.該企業在今年I月份至5月份的生產利潤V(單

位:億元)關于月份尤的數據如下表所示:

月份X12345

生產利潤y(億元)268910

⑴試求y與尤之間的相關系數r,并利用r說明y與x是否具有較強的線性相關關系;(若

舊>0.75,則認為兩個變量具有較強的線性相關性)

(2)為擴大生產,該企業在M大學啟動了校園招聘,分別招聘A、B兩個工程師崗位,兩個

崗位都各設有3門筆試科目大學的碩士畢業生張無忌決定參加這次應聘,且每門科目考

12

試是否通過相互獨立.若張無忌報考A崗位,每門筆試科目通過的概率依次為5,7,彳,

其中0<r<l;若張無忌報考B崗位,每門筆試科目通過的概率均為;.且張無忌只能報考

A,B兩個崗位中的一個.若以筆試中通過科目數的數學期望為依據作出決策,得出張無忌

更有希望通過A崗位的筆試,試求t的取值范圍.

附:參考數據:£仁-q2=10,±(%_討=40,之1,T(y,T=i9.

i=li=li=l

相關系數『=i產?.

J決紗

13.(2024?湖南長沙?模擬預測)為了了解高中生運動達標情況和性別之間的關系,某調查

機構隨機調查了100名高中生的情況,統計他們在暑假期間每天參加體育運動的時間,并

把每天參加體育運動時間超過30分鐘的記為"運動達標",時間不超過30分鐘的記為"運動

欠佳",已知運動達標與運動欠佳的人數比為3回2,運動達標的女生與男生的人數比為

201,運動欠佳的男生有5人.

⑴根據上述數據,完成下面2x2列聯表,并依據小概率值c=0.05的獨立性檢驗,能否認

為學生體育運動時間達標與性別因素有關系;

運動達標情況

性別合計

運動達標運動欠佳

男生

女生

合計

(2)現從"運動達標”的學生中按性別用分層隨機抽樣的方法抽取6人,再從這6人中任選2.

人進行體能測試,求選中的2人中恰有一人是女生的概率.

n(ad-bc)~

參考公式/=n—a+b+c+d.

(a+6)(c+d)(a+c)(b+d)

a0.10.050.01

Xa2.7063.8416.635

14.(2024?陜西?二模)為了引導學生閱讀世界經典文學名著,某學校舉辦“名著讀書日”活

動,每個月選擇一天為“名著讀書日",并給出一些推薦書目.為了了解此活動促進學生閱讀

文學名著的情況,該校在此活動持續進行了一年之后,隨機抽取了校內100名學生,調查

他們在開始舉辦讀書活動前后的一年時間內的名著閱讀數量,所得數據如下表:

多于5本少于5本合計

活動前3565100

活動后6040100

合計95105200

(1)試通過計算,判斷是否有99.9%的把握認為舉辦該讀書活動對學生閱讀文學名著有促進

作用;

(2)已知某學生計劃在接下來的一年內閱讀6本文學名著,其中4本國外名著,2本國內名

著,并且隨機安排閱讀順序.記2本國內名著恰好閱讀完時的讀書數量為隨機變量X,求

X的數學期望.

n(ad-bc')2

參考公式:K2=n=a+b+c+d

(a+6)(c+d)(a+c)(6+d),

臨界值表:

2

P(K>k0)0.100.050.0250.0100.0050.001

2.7063.8415.0246.6357.87910.828

【能力提升訓練】

一、單選題

1.(2021?河南鄭州,一模)某調查機構對全國互聯網行業進行調查統計,得到整個互聯網行

業從業者年齡分布餅狀圖,90后從事互聯網行業崗位分布條形圖,則下列結論錯誤的是

()

80前3%90后從事互聯網行業崗位分布圖

技術39.6%

運營17%

市場13.2%

設計12.3%

職能9.8%

產品6.5%

其他■1.6%

注:90后指1990年及以后出生,80后指1980-1989年之間出生,80前指1979年及以前出

生.

A.互聯網行業從業人員中從事技術和運營崗位的人數占總人數的三成以上

B.互聯網行業中從事技術崗位的人數超過總人數的20%

C.互聯網行業中從事運營崗位的人數90后一定比80前多

D.互聯網行業中從事技術崗位的人數90后一定比80后多

2.(2024?四川?模擬預測)某市教育主管部門為了解高三年級學生學業達成的情況,對高三

年級學生進行抽樣調查,隨機抽取了1000名學生,他們的學業達成情況按照從高到低都分

布在A,民C,RE五個層次內,分男、女生統計得到以下樣本分布統計圖,則下列敘述正確

的是()

女生學業達成男生學業達

頻率分布直方圖成分布扇形圖

本頻率/組距

3a-----------------------I-------------

2.5a--------------------

2a——----

1.5a-------------------------

a------------------------------

----------------->

oABCDE學業達

成層次

A.樣本中A層次的女生比相應層次的男生人數多

B.估計樣本中男生學業達成的中位數比女生學業達成的中位數小

C.。層次的女生和E層次的男生在整個樣本中頻率相等

D.樣本中8層次的學生數和C層次的學生數一樣多

3.(2022?天津和平?模擬預測)某校隨機抽取了400名學生進行成績統計,發現抽取的學

生的成績都在50分至100分之間,進行適當分組畫出頻率分布直方圖如圖所示,下列說法

正確的是()

A.直方圖中尤的值為0.040

B.在被抽取的學生中,成績在區間[70,80)的學生數為30人

C.估計全校學生的平均成績為84分

D.估計全校學生成績的樣本數據的80%分位數約為93分

4.(2024?安徽合肥?模擬預測)某停車場在統計停車數量時數據不小心丟失一個,其余六個

數據分別是10,8,8,11,16,8,若這組數據的平均數、中位數、眾數成等差數列,則

丟失數據的所有可能值的和為()

A.21B.24C.27D.32

5.(2024?河北?一模)某校為了解本校高一男生身高和體重的相關關系,在該校高一年級隨

機抽取了7名男生,測量了他們的身高和體重得下表:

身高X(單位:cm)167173175177178180181

體重y(單位:kg)90545964677276

由表格制作成如圖所示的散點圖:

收單位:cm

100-

90-?

80-

70-??

60-.??

50--

40-

30-

20-

10-

166168170172174176178180102彈位:kg

由最小二乘法計算得到經驗回歸直線乙的方程為9其相關系數為小經過殘差分

析,點(167,90)對應殘差過大,把它去掉后,再用剩下的6組數據計算得到經驗回歸直線

4的方程為9=&x+電,相關系數為4.則下列選項正確的是()

B.bl<b2,al<a^,i[>r2

C.bx>b2,a1<a2,rx>r2D.bx>b2,a^>a-,,rx<r2

6.(2024?湖北荊州?三模)根據變量y和x的成對樣本數據,由一元線性回歸模型

Y=bx+a+e

得到經驗回歸模型y=bx+a,求得如圖所示的殘差圖.模型誤差

E(e>)=0,£)(e)=o-2

()

木殘差

A.滿足一元線性回歸模型的所有假設

B.不滿足一元線性回歸模型的E(e)=O的假設

C.不滿足一元線性回歸模型的。⑻=/假設

D.不滿足一元線性回歸模型的E(e)=0和D(e)=(T2的假設

二、多選題

7.(23-24高三下?福建?開學考試)據國家統計局網站2023年9月15日消息,8月份,社

會消費品零售總額為37933億元,同比增長4.6%(同比一般情況下是指本年第N月與去

年的第N月比).其中,除汽車以外的消費品零售額為33820億元,增長5」%.1團8月份,

社會消費品零售總額為302281億元,同比增長7.0%.其中,除汽車以外的消費品零售額為

271888億元,增長7.2%.2022年8月至2023年8月社會消費品零售總額同比增速如下:

A.2023年1~8月份,社會消費品零售總額的月平均值約為25422.6億元

B.2022年8月份,社會消費品零售總額約為36264.8億元

C.除掉2022年8月至2023年8月社會消費品零售總額同比增速數據的最大值和最小

值所得數據的標準差比原數據的標準差小

D.2022年8月至2023年8月社會消費品零售總額同比增速數據的極差比中位數的8

倍還多

8.(2023?廣東?二模)現有甲、乙、丙三位籃球運動員連續5場籃球比賽得分情況的記錄數

據,已知三位球員得分情況的數據滿足以下條件:

甲球員:5個數據的中位數是26,眾數是24;

乙球員;5個數據的中位數是29,平均數是26;

丙球員:5個數據有1個是32,平均數是26,方差是9.6;

根據以上統計數據,下列統計結論一定正確的是()

A.甲球員連續5場比賽得分都不低于24分

B.乙球員連續5場比賽得分都不低于24分

C.丙球員連續5場比賽得分都不低于24分

D.丙球員連續5場比賽得分的第60百分位數大于24

9.(2024?湖北鄂州?一模)下列命題正確的是()

A.若樣本數據的頻率分布直方圖為單峰不對稱,且在右邊"拖尾",則樣本數據的平均

數大于中位數

B.若散點圖的散點均落在一條斜率非。的直線上,則決定系數發=1

C.數據占,4,凡,匕,毛的均值為4,標準差為1,則這組數據中沒有大于5的數

D.數據12,23,35,47,61的75百分位數為47

三、填空題

1O

10.(2024?河南新鄉?二模)若一組數據4,%,%,%,%的平均數為3,方差為彳,則

這個數的平均數為,方差為.

%,a2,a3,%,%,96

11.(2024?廣東?一模)已知a,b,c是正整數,且ae[10,20],fee(20,30],ce(30,40],

當a,b,c方差最小時,寫出滿足條件的一組a,b,。的值______.

四、解答題

12.(2024?河南?三模)PM2.5是指環境空氣中直徑小于或等于2.5微米的顆粒物.它能較

長時間懸浮于空氣中,其在空氣中含量越高,說明空氣污染越嚴重.城市中的PM2.5成分

除揚塵等自然因素外,燃料的燃燒也是一個重要來源.某市環境檢測部門為檢測燃油車流

量對空氣質量的影響,在一個檢測點統計每日過往的燃油車流量x(單位:輛)和空氣中

的PM2.5的平均濃度V(單位:)ig/m3).檢測人員采集了50天的數據,制成2x2列聯表

(部分數據缺失):

燃油車日流量x<1500燃油車日流量X21500合計

PM2.5的平均濃度y<1001624

PM2.5的平均濃度y?ioo20

合計22

⑴完成上面的2x2列聯表,并根據小概率值0=0.005的獨立性檢驗,能否認為PM2.5的平

均濃度小于100ng/m3與燃油車日流量小于1500輛有關聯?

⑵經計算得V與x之間的回歸直線方程為y=0.12x-73.86,且這50天的燃油車的日流量尤

的標準差工=249,PM2.5的平均濃度V的標準差s,=36.若相關系數「滿足㈤20.75,則

判定所求回歸直線方程有價值;否則判定其無價值.

①判斷該回歸直線方程是否有價值;

50

②若這50天的燃油車的日流量無滿足=1.23x108,試求這50天的pM2.5的平均濃度

1=1

y的平均數歹(利用四舍五入法精確到o.i).

n^ad-bc^

參考公式:/二其中〃=a+/?+c+d.

(Q+b)(c+d)(a+c)(b+d)'

a0.010.0050.001

%6.6367.87910.828

,‘£(%-牙)(%-9)Ex^^rixy

回歸方程亍=&+暮,其中3=上―-----------T--------------,a=y-bx;

£(七-元y而2

i=li=]

相關系數〃:i.

#(x,.-x)2^(y,.-y)2

Vz=li=l

參考數據:^-X1.23=0.0246,2492=62001,

J2397999x1548.55.

13.(2024?重慶,一模)實現"雙碳目標"是黨中央作出的重大戰略決策,新能源汽車、電動

汽車是重要的戰略新興產業,對于實現"雙碳目標”具有重要的作用.為了解某市電動汽車

的銷售情況,調查了該市某電動汽車企業近6年產值情況,數據如下表所示:

年份201820192020202120222023

編號x123456

產值W百萬輛91830515980

⑴若用模型y=a-e加擬合y與X的關系,根據提供的數據,求出y與X的經驗回歸方程

(精確到0.01);

(2)為了進一步了解車主對電動汽車的看法,從某品牌汽車4s店當日5位購買電動汽車和3

位購買燃油汽車的車主中隨機選取4位車主進行采訪,記選取的4位車主中購買電動汽車

的車主人數為X,求隨機變量X的分布列與數學期望,

66

參考數據:X%=20.88,X%%=80.58,其中%=In%.

z=li=\

參考公式:對于一組數據(4其)?=1,2,3,…,其經驗回歸直線》=加+6的斜率截距的

〃——

^x^-nx-y

最小二乘估計分別為BR---------泊=y-bx.

力尤;-rix2

i=l

14.(2023?河北?模擬預測)5G技術對社會和國家十分重要.從戰略地位來看,業界一般將

其定義為繼蒸汽機革命、電氣革命和計算機革命后的第四次工業革命.某科技集團生產

A,B兩種5G通信基站核心部件,下表統計了該科技集團近幾年來在A部件上的研發投入

x(億元)與收益y(億元)的數據,結果如下:

研發投入X(億元)12345

收益y(億元)3791011

⑴利用樣本相關系數廠說明是否可以用線性回歸模型擬合y與x的關系(當We[0.75,1]

時,可以認為兩個變量有很強的線性相關性);

⑵求出y關于尤的經驗回歸方程,并利用該方程回答下列問題:

①若要使生產A部件的收益不低于15億元,估計至少需要投入多少研發資金?(精確到

0.001億元)

②該科技集團計劃用10億元對A,8兩種部件進行投資,對B部件投資x(14x46)元所

獲得的收益y近似滿足>=0.9》-3+3.7,則該科技集團針對A,8兩種部件各應投入多少

研發資金,能使所獲得的總收益尸最大.

n.

附:樣本相關系數

可(%-日

回歸直線方程的斜率3=J-----------------,截距/=亍-5"

Z=1

15.(2024?全國?模擬預測)隨著人工智能的進一步發展,ChatGPT逐漸進入大眾視

野.ChatGPT是一種基于人工智能的語言模型,具備卓越的自然語言處理能力、廣泛的知

識覆蓋范圍和富有創造性的回答能力,是人們學習、工作與生活中的出色助手.盡管如

此,也有部分人認為ChatGPT會對人類未來工作產生威脅,由于其在提高工作效率方面的

出色表現,將在未來取代一部分人的職業.現對200家IT企業開展調查,統計每家企業一

年內應用ChatGPT的廣泛性及招聘人數的增減,得到數據結果統計如下表所示:

ChatGPT應用廣泛性招聘人數減少招聘人數增加合計

廣泛應用6050110

沒有廣泛應用405090

合計100100200

⑴根據小概率。=0.01的獨立性檢驗,是否有99%的把握認為IT企業招聘人數的增減與

ChatGPT應用的廣泛性有關?

⑵用頻率估計概率,從招聘人數減少的企業中隨機抽取30家企業,記其中廣泛應用

ChatGPT的企業有X家,事件"X=L"的概率為尸(X=^).求X的分布列并計算使

P(X=Q取得最大值時女的值.

n(ad-be)2,

附:z2(a+b)(c+d)(a+c)(6+d)'其中〃=4+6+°+小

a0.10.050.01

Xa2.7063.8416.635

2025二輪復習專項訓練23

統計與成對數據的統計分析

[考情分析]高考近幾年考查熱點,主要考查線性回歸分析和獨立性檢驗,以實際應用題的

形式出現,題目閱讀量大,難度中檔.

【練前疑難講解】

一、用樣本估計總體

1.統計中的四個數據特征:

(1)眾數:在樣本數據中,出現次數最多的那個數據.

(2)中位數:在樣本數據中,將數據按從小到大順序排列,位于最中間的數據.如果數據的個

數為偶數,就取中間兩個數據的平均數作為中位數.

(3)平均數:樣本數據的算術平均數,即X=)X1+X2+…+/).

(4)方差與標準差:

1——————

52=-[(%]—X)2+(X2-X)2H---H(x?—尤)2],

s=q;[(xi-Xy+(尤2-X)2H---l-(x?—X)2].

2.頻率分布直方圖的兩個結論:

(1)小長方形的面積=組距>頻<率贏=頻率.

(2)各小長方形的面積之和等于1.

二、回歸分析

1.經驗回歸直線;=晨+聯經過樣本點的中心(三,V),若無取某一個值,代入經驗回歸方

AAA

程y=bx+a中,可求出y的估計值.

2.樣本相關系數:

當廠>0時,稱成對樣本數據正相關;當K0時,稱成對樣本數據負相關.

三、獨立性檢驗

1.獨立性檢驗的一般步驟

(1)根據樣本數據列成2X2列聯表;

(2)根據公式

/二/耳而喘毋E不,計算的值;

(3)查表比較/與臨界值的大小關系,作統計判斷.

2./的值越大,對應假設事件辦成立(兩類變量相互獨立)的概率越小,”不成立的概率越

大.

一、單選題

1.(2024?黑龍江哈爾濱?一模)為了迎接2025年第九屆亞冬會的召開,某班組織全班學生

開展有關亞冬會知識的競賽活動.已知該班男生35人,女生25人.根據統計分析,男生

組成績和女生組成績的方差分別為s;、s;,該班成績的方差為則下列結論中一定正確

的是()

B.T

A.s1

2

7s;+5s;D.八七

C.s1

12

2.(2024?天津和平?一模)某市為了減少水資源浪費,計劃對居民生活用水實施階梯水價制

度,為確定一個比較合理的標準,從該市隨機調查了100位居民,獲得了他們某月的用水

①估計居民月均用水量低于1.50?的概率為0.25;②估計居民月均用水量的中位數約為

2.1m3;③該市有40萬居民,估計全市居民中月均用水量不低于3m3的人數為6萬;④

根據這100位居民的用水量,采用樣本量按比例分配的分層隨機抽樣的方法,抽取了容量

為20人的樣本,則在用水量區間。52]中應抽取4人.

A.1B.2C.3D.4

二、多選題

3.(2024?湖南衡陽?模擬預測)中國雪鄉哈爾濱的看雪最佳時間在11月中旬到次年的2月

上旬,某旅游公司設計了一款冰雪文創產品.試營銷以來,這款冰雪文創產品定價x(單

位:元)與銷量、(單位:萬件)的數據如下表所示:

產品定價X(單位:元)99.51010.511

銷量y(單位:萬件)1110865

則下列結論正確的是()

參考公式:廠=1廠,?

\恒%-可5(%-刃~

VZ=1Z=1

555

參考數據:£(%—可=2.5,2(%-5)=26,£(—)(%-予)=-8,765?8.06.

i=li=li=l

A.產品定價x的平均值是10元

B.產品定價x與銷量y存在正相關關系

c.產品定價X與銷量y滿足一元線性回歸模型

D.產品定價X與銷量y的相關系數3-0.99

4.(23-24高三下?山東荷澤?開學考試)下列說法正確的是()

A.若隨機變量X?建2,0.2),則尸(X=2)=0.2

B.若經驗回歸方程?=菽+&中的另>0,則變量尤與V正相關

C.若隨機變量x?N(0,s,且p[j<-S=p,則P[o<j<\=;-p

D.若事件A與3為互斥事件,則A的對立事件與3的對立事件一定互斥

三、填空題

5.(2024?山東濟南?二模)現有A,2兩組數據,其中A組有4個數據,平均數為2,方差

為6,8組有6個數據,平均數為7,方差為1.若將這兩組數據混合成一組,則新的一組數

據的方差為.

6.(2024?廣西?二模)設實數x,y(4<x<y),滿足1,3,4,龍,》y+2的平均數與

50%分位數相等,則數據尤,》y+2的方差為.

四、解答題

7.(2024?安徽蕪湖,二模)據新華社北京2月26日報道,中國航天全年預計實施100次左

右發射任務,有望創造新的紀錄,我國首個商業航天發射場將迎來首次發射任務,多個衛

星星座將加速組網建設;中國航天科技集團有限公司計劃安排近70次宇航發射任務,發射

290余個航天器,實施一系列重大工程任務.由于航天行業擁有廣闊的發展前景,有越來越

多的公司開始從事航天研究,某航天公司研發了一種火箭推進器,為測試其性能,對推進

器飛行距離與損壞零件數進行了統計,數據如下:

飛行距離x(kkm)5663717990102110117

損壞零件數y(個)617390105119136149163

參考數據:于=86,9=112,£>,“=82743,^=62680

i=li=l

⑴建立y關于x的回歸模型£=嬴+&,根據所給數據及回歸模型,求y關于x的回歸方程

(B精確到0.L6精確到1);

(2)該公司進行了第二項測試,從所有同型號推進器中隨機抽取100臺進行等距離飛行測

試,對其中60臺進行飛行前保養,測試結束后,有20臺報廢,其中保養過的推進器占比

30%,請根據統計數據完成2x2列聯表,并根據小概率值1=0.01的獨立性檢驗,能否認為

推進器是否報廢與保養有關?

保養未保養合計

報廢20

未報廢

合計60100

?(%-元)(y-方

附:回歸方程y=bx+a中斜率和截距的最小二乘估計公式分別為b=―......................

可2

Z=1

_2n(ad-bc}

d=y-bx,K=-----------------------------,n=a+b+c+d;

(a+b)(c+d)(a+c)(b+d)

2

P(K>kQ)0.250.10.050.0250.010.001

1.3232.7063.8415.0246.63510.828

8.(2022?全國?高考真題)一醫療團隊為研究某地的一種地方性疾病與當地居民的衛生習慣

(衛生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例

(稱為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論