81成對數據的相關分析_第1頁
81成對數據的相關分析_第2頁
81成對數據的相關分析_第3頁
81成對數據的相關分析_第4頁
81成對數據的相關分析_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

【解析版】8.1成對數據的相關分析選擇性必修第二冊第8章成對數據的統計分析初中學習的平面幾何,研究的是平面上的一些簡單圖形及其幾何性質;從本章開始,我們將把視野從二維的平面拓展到三維的空間;在三維空間中的圖形統稱為空間圖形或立體圖形;立體幾何所研究的就是一些簡單的空間圖形及其幾何性質;從平面幾何到立體幾何,我們要注意借鑒平面幾何中已有的一些概念、方法和結論,更要特別注意立體幾何和平面幾何之間的區別;以本章學習的空間直線與平面為例,我們不僅要研究平面這類典型的空間圖形,而且要對“直線”有更為深刻的認識;我們生活在一個三維世界中,立體幾何的學習有助于我們從幾何的角度更好地理解現實的世界,并且鍛煉我們的幾何直觀想象能力;因此,在學習中,要著重注意幾何的直觀和內涵,不要僅僅停留在表面上的嚴格推導和論證,還要多畫一些示意圖來幫助理解,這樣才能更好地掌握幾何的實質,逐步培養自己的立體感和空間想象能力;在必修課程第13章“統計”中,我們主要研究了來自單一變量數據的一些統計特征,如集中趨勢、離散程度、分布等.但現實世界中許多事物和現象之間都是有聯系的;在本章中,我們將主要學習來自兩個變量的成對數據的相關分析和回歸分析,掌握它們之間的統計規律;本章將要學習的相關分析、回歸分析及檢驗都屬于推斷性統計方法,它們在構建統計模型、預測結果和因果分析等方面有許多應用;在必修課程中學過的散點圖是進行成對數據統計分析的基礎,通過觀察散點圖可以大致了解數據的整體形態和偏離情況,發現兩組數據之間的變化規律,構建適當的統計模型.統計圖表不僅可以直觀地表示數據及其規律,也是建立統計直覺的重要途徑;【本章教材目錄】第8章成對數據的統計分析8.1成對數據的相關分析8.1.1成對數據間的關系;8.1.2相關系數8.2一元線性回歸分析8.2.1一元線性回歸分析的基本思想;8.2.2一元線性回歸分析的應用舉例8.32x2列聯表8.3.12x2列聯表獨立性檢驗;8.3.2獨立性檢驗的具體應用【本章內容提要】相關分析和一元線性回歸分析是研究兩個變量關系的兩個互為補充的方法;相關分析描述了兩個變量的相關程度,而回歸分析則描述了因變量是怎樣受自變量影響的;1、為了得到兩個變量之間是否具有一定關系的直觀印象,可以用散點圖來描述這些數據;2、相關系數可以度量兩個隨機變量之間的線性關系;相關系數的值滿足,且越接近1,兩個隨機變量的線性關系越密切;3、回歸方程代表了兩個變量間的關系,回歸直線經過散點圖中數據點的中心;回歸直線的斜率越大,解釋變量狓的一個單位變化所引起的反應變量狔的波動就越大;4、回歸方程可以通過最小二乘法得到.回歸直線能較好地反映一個變量對另一個變量的依賴情況,具有解釋因果關系和預測的功能.利用回歸方程可以由解釋變量的值來預測反應變量的值,從而給出反應變量真實值的一個估計;5、2×2列聯表描述兩個分類變量所有值的組合數據是如何分布的.判斷2×2列聯表中出現的兩個分類變量是否獨立可采用檢驗;檢驗的一般步驟是:(1)提出原假設;(2)確定顯著性水平;(3)計算統計量的值;(4)統計決斷:當≥時,拒絕原假設,推斷兩個變量相關,否則,接受原假設,推斷兩個變量不相關(即兩個變量是獨立的);在實際情況下,是否完全拒絕原假設,還需要考慮樣本量的大小;【要點方法解讀】解讀點001變量的相關關系1、相關分析把這樣來自同一對象的兩組數據稱為成對數據;研究成對數據相關性的方法稱為相關分析;2、變量的相關關系(1)相關關系:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系;(2)相關關系的分類:正相關和負相關;①正相關:如果從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,我們就稱這兩個變量正相關;②負相關:如果當一個變量的值增加時,另一個變量的相應值呈現減少的趨勢,則稱這兩個變量負相關;(3)線性相關:一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,我們稱這兩個變量線性相關;例1、下列命題中,兩個變量存在相關關系的序號為=1\*GB3①扇形的半徑與面積之間的關系=2\*GB3②降雪量與交通事故的發生率之間的關系=3\*GB3③人的身高與體重之間的關系=4\*GB3④家庭的支出與收入之間的關系【提示】理解相關關系與函數關系的區別;【答案】=2\*GB3②=3\*GB3③=4\*GB3④【解析】扇形的半徑與面積之間的關系是函數關系,其余均為相關關系;【說明】函數關系是一種確定的關系,而相關關系是非隨機變量與隨機變量的關系;函數關系是一種因果關系,而相關關系不一定是因果關系,也可能是伴隨變化而已;解讀點002用散點圖觀察兩個變量之間的相關性在必修課程第13章中,我們曾經用散點圖觀察兩個變量之間的相關性;將各數據在平面直角坐標系中的對應點畫出來,得到表示兩個變量的一組數據的圖形,這樣的統計圖叫做散點圖;利用散點圖,可以判斷兩個變量是否相關,相關時是正相關還是負相關;例2、某種樹木體積與樹木的樹齡之間有如下的對應關系:樹齡2345678體積30344060556270(1)請作出這些數據的散點圖;(2)你能由散點圖發現樹木體積與樹木的樹齡近似呈什么關系嗎?【提示】主要規范描點與分析;【解析】(1)以x軸表示樹木的樹齡,y軸表示樹木的體積,可得相應的散點圖如圖所示.(2)由散點圖發現樹木體積隨著樹齡的增加呈現增加的趨勢,且散點大致落在一條直線附近,所以樹木的體積與樹齡近似呈線性相關關系;【說明】判斷兩個變量x和y是否具有線性相關關系,常用的簡便方法就是繪制散點圖,如果發現點的分布從整體上看大致在一條直線附近,那么這兩個變量就是線性相關的,注意不要受個別點的位置的影響;解讀點003相關系數(1)設由變量x和y獲得的兩組數據分別為xi和yi(i=1,2,…,n),兩組數據分別為xi和yi的線性相關系數是兩個變量x和y之間線性相關程度的統計量,其計算公式為:;其中,;它們分別是這兩組數據的算術平均數;線性相關系數常常簡稱相關系數;也稱為皮爾遜系數;(2)樣本相關系數r的取值范圍為[-1,1].①若r>0時,成對樣本數據正相關;②若r<0時,成對樣本數據負相關;③當|r|越接近1時,成對樣本數據的線性相關程度越強;④當|r|越接近0時,成對樣本數據的線性相關程度越弱;題型一、相關系數的計算例3、某企業堅持以市場需求為導向,合理配置生產資源,不斷探索、改革銷售模式.下表是該企業每月生產的一種核心產品的產量x(件)與相應的生產總成本y(萬元)的五組對照數據:產量x(件)12345生產總成本y(萬元)3781012試求y與x的樣本相關系數r.(結果保留兩位小數)參考公式:r=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\r(\i\su(i=1,n,)(xi-\x\to(x))2)\r(\i\su(i=1,n,)(yi-\x\to(y))2)).參考數據:eq\r(115)≈10.7.【提示】注意正確使用公式與正確計算公式中的相關數據;【解析】eq\x\to(x)=eq\f(1+2+3+4+5,5)=3,eq\x\to(y)=eq\f(3+7+8+10+12,5)=8,eq\r(\o(∑,\s\up8(5),\s\do10(i=1))(xi-\x\to(x))2)=eq\r(10),eq\r(\o(∑,\s\up8(5),\s\do10(i=1))(yi-\x\to(y))2)=eq\r(46),eq\i\su(i=1,5,)(xi-eq\x\to(x))(yi-eq\x\to(y))=21.故樣本相關系數r=eq\f(21,\r(10)×\r(46))≈0.98;【說明】利用樣本相關系數r判斷線性相關關系,需要應用公式計算出r的值,由于數據較大,有時需要借助計算器.題型二、相關系數的性質例4、甲、乙、丙、丁四位同學各自對a,b兩變量的線性相關性做試驗,并分別求得樣本相關系數r如下表:甲乙丙丁r-0.82-0.78-0.69-0.85則________同學的試驗結果體現a,b兩變量有更強的線性相關性.【提示】注意理解相關系數及其性質;【答案】丁;【解析】因為0.85>0.82>0.78>0.69,已知相關系數的絕對值越接近1,則兩個變量的線性相關性越強,所以能體現出a,b兩變量有更強的線性相關性的是丁同學的試驗結果;【說明】樣本相關系數:樣本相關系數能夠較準確的判斷相關的程度,其絕對值越大,相關性越強;題型三、判斷相關的強弱例5、近年來,隨著互聯網的發展,諸如“滴滴打車”“神州專車”等網約車服務在我國各城市迅猛發展,為人們出行提供了便利,但也給城市交通管理帶來了一些困難.為掌握網約車在M省的發展情況,M省某調查機構從該省抽取了5個城市,分別收集和分析了網約車的A,B兩項指標數xi,yi(i=1,2,3,4,5),數據如下表所示:城市1城市2城市3城市4城市5A指標數x24568B指標數y34445經計算得eq\r(\o(∑,\s\up6(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)=2eq\r(5),eq\r(\o(∑,\s\up6(5),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)=eq\r(2),試求y與x之間的樣本相關系數r,并利用r說明y與x是否具有較強的線性相關關系.附:樣本相關系數公式r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)),參考數據:eq\r(0.3)≈0.55,eq\r(0.9)≈0.95.【解析】eq\o(x,\s\up6(-))=eq\f(2+4+5+6+8,5)=5,eq\o(y,\s\up6(-))=eq\f(3+4+4+4+5,5)=4,eq\o(∑,\s\up6(5),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=6,故r=eq\f(\o(∑,\s\up6(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(5),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2))=eq\f(6,2\r(5)×\r(2))=eq\r(\f(9,10))≈0.95.因為r≈0.95,所以可以推斷y與x線性正相關,且具有較強的線性相關關系;【說明】線性相關強弱的判斷方法;1、散點圖:散點圖只是粗略作出判斷,其圖象越接近直線,相關性越強;2、樣本相關系數:樣本相關系數能夠較準確的判斷相關的程度,其絕對值越大,相關性越強;題型四、相關系數的實際應用例6、以下是收集到的新房屋的銷售價格y(萬元)和房屋的大小x(m2)的數據.房屋大小x/m211511080135105銷售價格y/萬元24.821.618.429.222(1)畫出數據的散點圖;(2)求樣本相關系數r,并作出評價.(精確到0.01,已知eq\i\su(i=1,5,x)eq\o\al(2,i)=60975,eq\i\su(i=1,5,y)eq\o\al(2,i)=2756.8,eq\i\su(i=1,5,x)iyi=12952)【解析】(1)畫出散點圖如圖所示.(2)eq\x\to(x)=eq\f(545,5)=109,eq\x\to(y)=eq\f(116,5)=23.2,r=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\r(\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)\r(\i\su(i=1,5,y)\o\al(2,i)-5\x\to(y)2))=eq\f(12952-5×109×23.2,\r(60975-5×1092)×\r(2756.8-5×23.22))=eq\f(308,\r(1570)×\r(65.6))≈0.96,由此可知,新房屋的銷售價格和房屋的大小這兩個變量正線性相關,且相關程度很強;【說明】求成對樣本數據的樣本相關系數時,可列表計算出樣本相關系數所需數據,代入公式即可求出樣本相關系數r,對于樣本相關系數r,要理解其范圍和意義,當r為正數時,表示成對數據正相關,當r為負數時,表示成對數據負相關;另外注意|r|的大小,|r|越大,線性相關程度越高.題型五、【真題體驗】例7、(2025·天津模擬)學習于才干信仰,猶如運動于健康體魄,持之已久、行之愈遠愈受益.為實現中華民族偉大復興,全國各行各業掀起了“學習強國”的高潮.某老師很喜歡“學習強國”中“挑戰答題”模塊,他記錄了自己連續七天每天一次最多答對的題數如下表(用x表示天數,y表示題數):x1234567y12151618212427參考數據:eq\o(x,\s\up6(-))=4,eq\o(y,\s\up6(-))=19,eq\o(∑,\s\up6(7),\s\do4(i=1))xeq\o\al(2,i)=140,eq\o(∑,\s\up6(7),\s\do4(i=1))yeq\o\al(2,i)=2695,eq\o(∑,\s\up6(7),\s\do4(i=1))xiyi=600,eq\r(6)≈2.45,相關系數r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))yeq\o\al(2,i)-n\o(y,\s\up6(-))2)).由表中數據可知該老師每天一次最多答對題數y與天數x之間是________(填“正”或“負”)相關,其相關系數r≈________(結果保留兩位小數).【答案】正0.99【解析】由表中數據知,y隨x的增大而增大,所以該老師每天一次最多答對題數y與天數x之間是正相關;計算相關系數為r=eq\f(\o(∑,\s\up6(7),\s\do4(i=1))xiyi-7\o(x,\s\up6(-))\o(y,\s\up6(-)),\r(\o(∑,\s\up6(7),\s\do4(i=1))xeq\o\al(2,i)-7\o(x,\s\up6(-))2)\r(\o(∑,\s\up6(7),\s\do4(i=1))yeq\o\al(2,i)-7\o(y,\s\up6(-))2))=eq\f(600-7×4×19,\r(140-7×42)×\r(2695-7×192))=eq\f(68,2\r(7)×2\r(42))≈eq\f(17,7×2.45)≈0.99.例8、(

2024年天津市薊州區高三校考開學考試)對兩個變量,進行線性相關檢驗,得線性相關系數,對兩個變量,進行線性相關檢驗,得線性相關系數,則下列判斷正確的是(

)A.變量與正相關,變量與負相關,變量與的線性相關性較強B.變量與負相關,變量與正相關,變量與的線性相關性較強C.變量與正相關,變量與負相關,變量與的線性相關性較強D.變量與負相關,變量與正相關,變量與的線性相關性較強【提示】根據相關系數的概念與性質分析判斷;【答案】C【解析】因為線性相關系數,所以,正相關,因為線性相關系數,所以,負相關,又因為,所以變量,的線性相關性比,的線性相關性強,故A、B、D錯誤,C正確.故選:C.例9、(2022年高考全國乙卷數學(理))某地經過多年的環境治理,已將荒山改造成了綠水青山.為估計一林區某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數據:樣本號i12345678910總和根部橫截面積0.040.060.040.080.080.050.050.070.070.060.6材積量0.250.400.220.540.510.340.360.460.420.403.9并計算得.(1)估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01);(3)現測量了該林區所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數據給出該林區這種樹木的總材積量的估計值.附:相關系數.【提示】(1)計算出樣本的一棵根部橫截面積的平均值及一棵材積量平均值,即可估計該林區這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)代入題給相關系數公式去計算即可求得樣本的相關系數值;(3)依據樹木的材積量與其根部橫截面積近似成正比,列方程即可求得該林區這種樹木的總材積量的估計值;【答案】(1);;(2);(3)【解析】(1)樣本中10棵這種樹木的根部橫截面積的平均值樣本中10棵這種樹木的材積量的平均值據此可估計該林區這種樹木平均一棵的根部橫截面積為,平均一棵的材積量為(2)則(3)設該林區這種樹木的總材積量的估計值為,又已知樹木的材積量與其根部橫截面積近似成正比,可得,解之得.則該林區這種樹木的總材積量估計為【針對性即時練】1、下列結論:①函數關系是一種確定性關系;②相關關系是一種非確定性關系;③圓的面積和半徑是相關關系.其中正確的是(將所有正確的序號都填上);【答案】①②;【解析】根據函數關系及相關關系的定義,①函數關系是一種確定性關系;②相關關系是一種非確定性關系,是正確的;③圓的面積和半徑是函數關系,故錯誤;2、命題①任何兩個變量都具有相關關系;②圓的周長與該圓的半徑具有相關關系;③某商品的需求量與該商品的價格是一種非確定性關系;④根據散點圖可以大致判斷兩個相關變量是正相關還是負相關.其中正確的命題是【答案】③④;【解析】客觀現象之間存在的相互依存關系叫相關關系,是一種不確定的關系,函數關系是一種確定的關系.①任何兩個變量不一定都具有相關關系,故①錯誤;②圓的周長與該圓的半徑是函數關系,而不是具有相關關系,故②錯誤;③某商品的需求量與該商品的價格是一種非確定性關系,故③正確;④根據散點圖可以大致判斷兩個相關變量是正相關還是負相關.上升趨勢就是正相關,下降趨勢就是負相關.故④正確.3、5名學生的數學和物理成績(單位:分)如下:ABCDE數學成績8075706560物理成績7066686462判斷數學成績與物理成績是否具有線性相關關系;(填:“有”與“無”)【提示】根據散點圖判斷;【答案】有;【解析】以x軸表示數學成績,y軸表示物理成績,得相應的散點圖如圖所示.由散點圖可知,各點分布在一條直線附近,故兩者之間具有線性相關關系;【說明】本題考查利用散點圖判斷兩個變量是否線性相關,同時考查了數據分析與數學抽象的核心素養;4、兩個變量的相關關系有①正相關、②負相關、③不相關,則下列散點圖從左到右分別反映的變量間的相關關系的序號依次是【答案】①③②;【解析】對于(1),圖中的點成帶狀分布,且從左到右上升,是正相關關系;對于(2),圖中的點沒有明顯的帶狀分布,是不相關的;對于(3),圖中的點成帶狀分布,且從左到右是下降的,是負相關關系.5、如圖所示,有5組數據:A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),去掉________組數據后剩下的4組數據的線性相關系數最大.【答案】C【解析】仔細觀察點A(1,3),B(2,4),C(3,8),D(7,10),E(10,12),可知點A,B,D,E在一條直線附近,而C點明顯偏離此直線上,由此可知去掉點C后,使剩下的四點組成的數組相關關系數最大.6、變量、的散點圖如圖所示,那么、之間的樣本相關系數最接近的值為【答案】0;【解析】根據變量、的散點圖,得、之間的樣本相關關系非常不明顯,所以,相關系數最接近的值應為0.7、若已知eq\i\su(i=1,n,)(xi-eq\x\to(x))2是eq\i\su(i=1,n,)(yi-eq\x\to(y))2的兩倍,eq\i\su(i=1,n,)(xi-eq\x\to(x))(yi-eq\x\to(y))是eq\i\su(i=1,n,)(yi-eq\x\to(y))2的1.2倍,則樣本相關系數r的值為()A.eq\f(\r(2),1.2)B.eq\f(1.2,\r(2))C.0.92D.0.65【答案】B【解析】r=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\r(\i\su(i=1,n,)xi-\x\to(x)2)·\r(\i\su(i=1,n,)yi-\x\to(y)2))=eq\f(1.2\i\su(i=1,n,)yi-\x\to(y)2,\r(2)·\i\su(i=1,n,)yi-\x\to(y)2)=eq\f(1.2,\r(2)),故選B.8、為了比較甲、乙、丙三組數據的線性相關性的強弱,小鄭分別計算了甲、乙、丙三組數據的樣本相關系數,其數值分別為0.939,0.937,0.948,則()A.甲組數據的線性相關性最強,乙組數據的線性相關性最弱B.乙組數據的線性相關性最強,丙組數據的線性相關性最弱C.丙組數據的線性相關性最強,甲組數據的線性相關性最弱D.丙組數據的線性相關性最強,乙組數據的線性相關性最弱【答案】D;【解析】因為樣本相關系數的絕對值越大則線性相關性越強,所以丙組數據的線性相關性最強,乙組數據的線性相關性最弱.故選D;9、從某地區12~30歲的居民中隨機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論