獨立性檢驗(原卷版)-概率統計題型全歸納_第1頁
獨立性檢驗(原卷版)-概率統計題型全歸納_第2頁
獨立性檢驗(原卷版)-概率統計題型全歸納_第3頁
獨立性檢驗(原卷版)-概率統計題型全歸納_第4頁
獨立性檢驗(原卷版)-概率統計題型全歸納_第5頁
已閱讀5頁,還剩10頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

專題11獨立性檢驗

例1.2019年11月5日至10日,第二屆中國國際進口博覽會在上海舉行.某宣傳媒體組織業內人士對某

型號智能機器人進行評分,所得情況如圖所示:

(I)試估計業內人士評分的平均數以及方差(用每個小矩形底邊中點近似替代本組數據);

(II)為了調查評分與性別是否具有相關性,研究人員隨機抽取了60位參加評分的業內人士,其中男性與

女性人數各一半,根據已知條件完成下面2x2列聯表,據此資料,是否有90%的把握認為評分的高低與性

別有關?

分數不低于60分低于60分合計

男性1630

女性1030

合計60

參考公式:(1)K2=---------ft(^dbe)-------,其中〃二1+匕+0+^.

(a+c)(b+d)(Q+b)(c+d)

22

(2)DX=(xl-EX)xpl+(x2-EXyxp2+...+(xn-EX)xpn.

參考數據:

例2.某校舉行了一次數學競賽,為了了解本次競賽學生的成績情況,從中抽取了部分學生的分數(得分取

正整數,滿分為100分)作為樣本(樣本容量為")進行統計,按照[50,60),[60,70),[70,80),[80,

90),[90,100]的分組作出頻率分布直方圖,已知得分在[50,60),[90,100]的頻數分別為16,4.

(I)求樣本容量〃和頻率分布直方圖中的a,6的值;

(II)估計本次競賽學生成績的平均數(同一組中的數據用該組區間的中點值代表);

(III)在選取的樣本中,若男生和女生人數相同,我們規定成績在70分以上稱為“優秀”,70分以下稱為

“不優秀”,其中男女生中成績優秀的分別有24人和30人,請完成列聯表,并判斷是否有90%的把握認為

“學生的成績優秀與性別有關”?

男生女生總計

優秀

不優秀

總計

0.100.050.0100.0050.001

名片囪0)

3.841

k02.7066.6357.87910.828

附:片=——<ad-bcf------,其中”=a+b+c+d.

(Q+Z?)(c+d)(Q+c)(b+d)

例3.某健身館為了宣傳健身效果,吸引顧客,特別請專業的評估機構對他們500名學員的鍛煉成果進行評

估打分(滿分100分),并且認為評分不低于80分的參與者為健身達人,得到如表:

健身達人非健身達總計

男20050250

女100150250

總計300200500

(I)判斷能否在犯錯誤的概率不超過0.001的前提下認為健身達人與性別有關系?

(H)若500名學員中40歲以上的有100人,30歲到40歲的有300人,30歲以下的100人,先從中分層

抽取5人進行抽獎活動,再從這5人中抽取兩位對其進行全年免單活動,求兩人全年免單都在30歲到40

歲之間的概率是多少?

附:

尸(胃肉)0.150.100.050.0250.0100.0050.001

k2.0722.7063.8415.0246.6357.87910.828

片=——<ad-bcf——,其中〃=a+Hc+d.

(a+b)(c+d)(Q+c)(b+d)

例4.某公司為了推廣某項技術,對旗下200名員工的年齡和人數進行了統計,統計其對這項技術的接受程

度,從而為后期宣傳工作做準備,并繪制了如下頻率分布直方圖.

(I)根據如圖求樣本年齡的中位數和平均數(同一組中的數據用該組區間的中點值為代表)(保留兩位小

數);

(H)若將樣本分為兩個年齡段,年齡在區間[18,38)和[38,68]分別稱為“青少年”和“中老年”,根據

相關條件完成下表,并判斷是否有95%的把握認為對新技術接受程度與年齡段有關?

青少年中老年合計

接受2090

不接受110

合計200

參考公式:K2=------................,其中〃=a+"c+d.

(Q+b)(c+d)(Q+c)(Z?+d)

參考數據:

尸(曉鹵)0.0500.0100.001

k3.8416.63510.828

0182838485868年齡

例5.“微信運動”已成為當下熱門的健身方式,小王的微信朋友圈內也有大量好友參與了“微信運動”,他

隨機選取了其中的40人(男、女各20人),記錄了他們某一天的走路步數,并將數據整理如下:

積極型懈怠型總計

總計

0-20008001-10000>10000

1性臚J2001-50905001-8000

男12368

女021062

(I)若采用樣本估計總體的方式,試估計小王的所有微信好友中每日走路步數超過5000步的概率;

(II)已知某人一天的走路步數超過8000步被系統評定“積極型”,否則為“懈怠型”,根據題意完成下面

的2x2列聯表,并據此判斷能否有95%以上的把握認為“評定類型”與“性別”有關?

1

2n(ad-be)

(a+b)(c+d)(a+c)(b+d)

Pg.k。)0.100.050.0250.010

k。2.7063.8415.0246.635

例6.為了調查某大學學生在周日上網的時間,隨機對100名男生和100名女生進行了不記名的問卷調查,

得到了如下的統計結果:表1:男生上網時間與頻數分布表

上網時間(分鐘)[30,40)[40,50)[50,60)[60,70)[70,80]

人數525302515

表2:女生上網時間與頻數分布表

上網時間(分鐘)[30,40)[40,50)[50,60)[60,70)[70,80]

人數1020402010

(I)若該大學共有女生750人,試估計其中上網時間不少于60分鐘的人數;

(II)完成表3的2x2列聯表(此表應畫在答題卷上),并回答能否有90%的把握認為“學生周日上網時間

與性別有關”?

(III)從表3的男生中“上網時間少于60分鐘”和“上網時間不少于60分鐘”的人數中用分層抽樣的方

法抽取一個容量為5的樣本,再從中任取兩人,求至少有一人上網時間超過60分鐘的概率.

表3:

上網時間少于60分鐘上網時間不少于60分鐘合計

男生———

女生———

合計———

附:r=----------也士-------,其中〃=a+b+c+d

(a+b)(c+d)(a+c)(b+d)

pg.k。)0.500.400.250.150.100.050.0250.0100.0050.001

k00.4550.7081.3232.0722.7063.845.0246.6357.87910.83

例7.某種疾病可分為1、I[兩種類型,為了解該疾病類型與性別的關系,在某地區隨機抽取了患該疾病的

病人進行調查,其中男性人數為z,女性人數為2z,男性患I型病的人數占男性病人的*,女性患I型病

的人數占女性病人的L

3

I型病II型病合計

合計

(1)完成2x2聯表若在犯錯誤的概率不超過0.005的前提下認為“所患疾病類型”與“性別”有關,求男

性患者至少有多少人?

(2)某藥品研發公司欲安排甲乙兩個研發團隊來研發此疾病的治療藥物,兩個團隊各至多安排2個接種周

期進行試驗.每人每次接種花費風根>。)元.甲團隊研發的藥物每次接種后產生抗體的概率為p,根據以

往試驗統計,甲團隊平均花費為-2〃/+6加;乙團隊研發的藥物每次接種后產生抗體的概率為q,每個周

期必須完成3次接種,若一個周期內至少出現2次抗體,則該周期結束后終止試驗,否則進入第二個接種

周期.假設兩個研發團隊每次接種后產生抗體與否均相互獨立.

若p=2q,從兩個團隊試驗的平均花費考慮,該公司應選擇哪個團隊進行藥品研發?

sn{ad-bc)2

(Q+b)(c+d)(〃+c)(b+d)

尸(屋.人)0.100.050.010.0050.001

k。2.7063.8416.6357.87910.828

例8.某房產中介統計了深圳市某高檔小區從2018年12月至2019年11月當月在售二手房均價(單位:萬

元/平方米)的散點圖,如圖所示,圖中月份代碼1至12分別對應2018年12月至2019年11月的相應月

根據散點圖選擇丫=々+法和'='+力加兩個模型進行擬合,根據數據處理得到兩個回歸方程分別為

y=6.9057+0.0195尤和j=6.8639+OAOUlnx,并得到以下一些統計量的值:

9=6.9057+0.01951y=6.8639+0.1012/nx

12

殘差平方和2(%-女)20.01485570.0048781

?=1

12

總偏差平方和£(%-%了0.069193

Z=1

(1)請利用相關指數甯判斷哪個模型的擬合效果更好;

(2)某位購房者擬于2020年5月份購買深圳市福田區s(50Bk160)平方米的二手房(欲購房為其家庭首套

房).若該小區所有住房的房產證均已滿3年,請你利用(1)中擬合效果更好的模型解決以下問題:

⑺估算該購房者應支付的購房金額.(購房金額=房款+稅費;房屋均價精確到0.01萬元/平方米)

(而)若該購房者擬用不超過760萬元的資金購買該小區一套二手房,試估算其可購買的最大面積(精確到1

平方米)

附注:根據有關規定,二手房交易需要繳納若干項稅費,稅費是按照房屋的計稅價格進行征收.(計稅價格

=房款)

征收方式見如表:

購買首套房面積S(平方米)s,,9090<5?144s>144

契稅(買方繳納)的稅率1%2%4%

參考數據:歷2*0.69,Zn3~1.10,歷7a2.83,加19y2.94,應21.41,621.73,717?4.12,J19?4.36,

£(%-討

參考公式:相關指數女=1-上」~.

Su-x)2

/-=1

例9.從某小區抽取50戶居民進行月用電量調查,發現其用電量都在50到350度之間,頻率分布直方圖如

.4類用戶3類用戶

97706

86517S9

98285678

87109789

圖1圖2

(1)求頻率分布直方圖中x的值并估計這50戶用戶的平均用電量;

(2)若將用電量在區間[50,150)內的用戶記為A類用戶,標記為低用電家庭,用電量在區間[250,350)

內的用戶記為3類用戶,標記為高用電家庭,現對這兩類用戶進行問卷調查,讓其對供電服務進行打分,

打分情況見莖葉圖如圖2:

①從3類用戶中任意抽取1戶,求其打分超過85分的概率;

②若打分超過85分視為滿意,沒超過85分視為不滿意,請填寫下面列聯表,并根據列聯表判斷是否有95%

的把握認為“滿意度與用電量高低有關”?

滿意不滿意合計

A類用戶

3類用戶

合計

附表及公式:

20.0500.0100.001

P(K..k0)

k。3.8416.63510.828

K?_n(ad-be)2

n=a+b+c+d.

(a+b)(c+d)(a+c)(b+d)

例10.某工廠有25周歲以上(含25周歲)工人300名,25周歲以下工人200名.為研究工人的日平均生

產量是否與年齡有關.現采用分層抽樣的方法,從中抽取了100名工人,先統計了他們某月的日平均生產

件數,然后按工人年齡在“25周歲以上(含25周歲)”和“25周歲以下”分為兩組,在將兩組工人的日平

均生產件數分成5組:[50,60),[60,70),[70,80),[80,90),[90,100)分別加以統計,得到如

圖所示的頻率分布直方圖.

(1)從樣本中日平均生產件數不足60件的工人中隨機抽取2人,求至少抽到一名“25周歲以下組”工人

的概率.

(2)規定日平均生產件數不少于80件者為“生產能手”,請你根據已知條件完成2x2的列聯表,并判斷是

否有90%的把握認為“生產能手與工人所在的年齡組有關”?

P(XLk)0.1000.0500.0100.001

k2.7063.8416.63510.828

n(ad-be)2

(Q+b)(c+d)(〃+c)(b+d)

例11.某市在對學生的綜合素質評價中,將其測評結果分為“優秀、合格、不合格”三個等級,其中不小

于80分為“優秀”,小于60分為“不合格”,其它為“合格”.

(I)某校高二年級有男生500人,女生400人,為了解性別對該綜合素質評價結果的影響,采用分層抽

樣的方法從高二學生中抽取了90名學生的綜合素質評價結果,其各個等級的頻數統計如表:

等級優秀合格不合格

男生(人)30X8

女生(人)306y

根據表中統計的數據填寫下面2x2列聯表,并判斷是否有90%的把握認為“綜合素質評價測評結果為優秀

與性別有關”?

男生女生總計

優秀

非優秀

總計

(II)以(I)中抽取的90名學生的綜合素質評價等級的頻率作為全市各個評價等級發生的概率,且每名

學生是否“優秀”相互獨立,現從該市高二學生中隨機抽取4人.

⑺求所選4人中恰有3人綜合素質評價為“優秀”的概率;

(而)記X表示這4人中綜合素質評價等級為“優秀”的人數,求X的數學期望.

附:參考數據與公式

(1)臨界值表:

0.150.100.050.0250.0100.0050.001

k。2.0722.7063.8415.0246.6357.87910.828

(2)參考公式:K2=----------------------------------,其中〃=a+

(a+b)(c+d)(a+c)(b+d)

例12.電視傳媒公司為了解某地區電視觀眾對某類體育節目的收視情況,隨機抽取了100名觀眾進行調查.下

面是根據調查結果繪制的觀眾日均收看該體育節目時間的頻率分布直方圖:將日均收看該體育節目時間不

低于40分鐘的觀眾稱為“體育迷”

(1)根據已知條件完成下面的2x2列聯表,并據此資料你是否認為“體育迷”與性別有關?(注:0.95以

上把握說明有關)

非體育迷體育迷合計

女1055

合計

(2)將上述調查所得到的頻率視為概率.現在從該地區大量電視觀眾中,采用隨機抽樣方法每次抽取1名

觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數為X.若每次抽取的結果是相互獨立的,求X的

分布列,期望E(X)和方差£>(X)

"”2+4142

P(X'k)0.050.01

k3.8416.635

頻率

例13.隨著節能減排意識深入人心以及共享單車在饒城的大范圍推廣,越來越多的市民在出行時喜歡選擇

騎行共享單車.為了研究廣大市民在共享單車上的使用情況,某公司在我市隨機抽取了100名用戶進行

調查,得到如下數據:

每周使用次數1次2次3次4次5次6次及以上

男4337830

女6544620

合計1087111450

(1)如果認為每周使用超過3次的用戶為“喜歡騎行共享單車”,請完成2x2列表(見答題卡),并判斷能

否在犯錯誤概率不超過0.05的前提下,認為是否“喜歡騎行共享單車”與性別有關?

(2)每周騎行共享單車6次及6次以上的用戶稱為“騎行達人”,視頻率為概率,在我市所有“騎行達人”

中,隨機抽取4名用戶.

①求抽取的4名用戶中,既有男生“騎行達人”又有女“騎行達人”的概率;

②為了鼓勵女性用戶使用共享單車,對抽出的女“騎行達人”每人獎勵500元,記獎勵總金額為X,求X的

分布列及數學期望.

附表及公式:K2=----Mad-be)’-----------

(Q+b)(c+d)(Q+c)(Z?+d)

0.150.100.050.0250.0100.0050.001

2.0722.7063.8415.0246.6357.87910.828

例14.2021年,遼寧省將實施新高考,2018年暑期入學的高一學生是新高考首批考生,新高考不再分文理

科,采用3+3模式,其中語文、數學、外語三科為必考科目,滿分各150分,另外考生還要依據想考取的

高校及專業的要求,結合自己的興趣愛好等因素,在思想政治、歷史、地理、物理、化學、生物6門科目

中自選3門參加考試(6選3),每科目滿分100分.

為了應對新高考,某高中從高一年級1000名學生(其中男生550人,女生450人)中,采用分層抽樣的方

法從中抽取"名學生進行調查.

(1)已知抽取的〃名學生中含女生45人,求"的值及抽取到的男生人數;

(2)學校計劃在高一上學期開設選修中的“物理”和“地理”兩個科目,為了了解學生對這兩個科目的選

課情況,對在(1)的條件下抽取到w名學生進行問卷調查(假定每名學生在這兩個科目中必須選擇一個科

目且只能選擇一個科目),下表是根據調查結果得到的2x2列聯表:

選擇“物理”選擇“地理”總計

男生10

女生25

總計

請將上面的列聯表補充完整,并判斷是否有99%的把握認為選擇科目與性別有關?說明你的理由;

(3)在抽取到的45名女生中按分層抽樣再抽出9名女生,了解女生對“歷史”的選課意向情況,在這9

名女生中再抽取4人,設這4人中含選擇“地理”的人數為X,求X的分布列及期望.

P(KLk)0.050.01

k3.8416.635

K?_一年%])一

%+"+/+2

例15.微信是現代生活進行信息交流的重要工具,據統計,某公司200名員工中90%的人使用微信,其中

每天使用微信時間在一小時以內的有60人,其余每天使用微信在一小時以上.若將員工年齡分成青年(年

齡小于40歲)和中年(年齡不小于40歲)兩個階段,使用微信的人中75%是青年人.若規定:每天使用

微信時間在一小時以上為經常使用微信,經常使用微信的員工中-是青年人.

3

(I)若要調查該公司使用微信的員工經常使用微信與年齡的關系,列出2x2列聯表;

青年人中年人合計

經常使用微信

不經常使用微信

合計

(II)由列聯表中所得數據,是否有99.9%的把握認為“經常使用微信與年齡有關”?

P(K?..k)0.0100.001

k6.63510.828

n(ad-be)2

(Q+b)(c+d)(Q+c)(b+d)

例16.某校高三4班有50名學生進行了一場投籃測試,其中男生30人,女生20人.為了了解其投籃成績,

甲、乙兩人分別都對全班的學生進行編號(1-50號),并以不同的方法進行數據抽樣,其中一人用的是系

統抽樣,另一人用的是分層抽樣.若此次投籃測試的成績大于或等于80分視為優秀,小于80分視為不

優秀,如表是甲、乙兩人分別抽取的樣本數據:

甲抽取的樣本數據

編號271217222732374247

性別男女男男女男女男女女

投籃成90607580838575807060

乙抽取的樣本數據

編號181020232833354348

性別男男男男男男女女女女

投籃成95858570708060657060

(I)在乙抽取的樣本中任取3人,記投籃優秀的學生人數為X,求X的分布列和數學期望.

優秀非優秀合計

男———

女———

合計——10

(II)請你根據乙抽取的樣本數據完成下列2x2列聯表,判斷是否有95%以上的把握認為投籃成績和性別

有關?

(III)判斷甲、乙各用何種抽樣方法,并根據(II)的結論判斷哪種抽樣方法更優?說明理由.

下面的臨界值表供參考:

P(.K2..k)0.150.100.050.0100.0050.001

k2.0722.7063.8416.6357.87910.828

(參考公式:K2=----------——-----------------,其中”=a+0+c+d)

(a+b)(c+d)(a+c)(b+d)

例17.已知某工廠有25周歲以上(含25周歲)工人300名,25周歲以下工人200名.為研究工人的日平

均生產量是否與年齡有關,現采用分層抽樣的方法,從中抽取了100名工人,先統計了他們某月的日平均

生產件數,然后按工人年齡在“25周歲以上(含25周歲)”和“25周歲以下”分為兩組,再將兩組工人的

日平均生產件數分為5組:[50,60),[60,70),[70,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論