




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
人教A版高中數學選擇性必修第三冊第八章成對數據的統計分析8.1.2樣本相關系數知識回顧1.變量間的相關關系是什么?2.散點圖是什么?3.變量相關關系的分類是什么?正相關線性相關兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.成對樣本數據可用直角坐標系中的點表示出來,由這些點組成的統計圖叫做散點圖。非線性相關負相關新課導入散點圖無法量化兩個變量之間的相關程度的大小,更不能精確地說明成對樣本數據之間關系的密切程度,那么我們如何才能尋找到這樣一個合適的量來對樣本數據的相關程度進行定量分析呢?通過散點圖可以推斷兩個變量之間是否存在相關關系、是正相關還是負相關、是線性相關是非線性相關,但這些推斷是定性的推斷.從定量的角度刻畫成對樣本數據的線性相關程度,進而推斷兩個變量的線性相關程度。樣本相關數r問題1:如何引入一個恰當的“數字特征”,對成對樣本數據的相關程度進行定量分析?新課探究
利用上述方法處理表中的數據,得到下圖.我們發現,這時的散點大多數分布在第一象限、第三象限,大多數散點的橫、縱坐標同號.
顯然,這樣的規律是由人體脂肪含量與年齡正相關所決定的.一般地,如果變量x和y正相關,那么關于均值平移后的大多數散點將分布在第一象限、第三象限,對應的成對數據同號的居多,如下圖所示;························如果變量x和y負相關,那么關于均值平移后的大多數散點將分布在第二象限、第四象限,對應的成對數據異號的居多,如下圖所示.新課探究思考:根據上述分析,你能利用正相關變量和負相關變量的成對樣本數據平移后呈現的規律,構造一個度量成對樣本數據是正相關還是負相關的數字特征嗎?新課探究一般情形下,表明成對樣本數據正相關;表明成對樣本數據負相關.利用散點的橫、縱坐標是否同號,可以構造一個量新課探究問題2:你認為
的大小一定能度量出成對樣本數據的相關程度嗎?在研究體重與身高之間的相關程度時,如果體重的單位不變,把身高單位由米改為厘米,單位的改變不會改變體重與身高之間的相關程度。我們發現,
的大小與數據的度量單位有關,所以不能直接用它度量成對樣本數據相關程度的大小。為了消除單位的影響,進一步做“標準化”處理當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關.我們稱r為變量x和變量y的樣本相關系數。樣本相關系數r是一個描述成對樣本數據的數字特征,它的正負和絕對值的大小可以反映成對樣本數據的變化特征:新課探究新課探究問題3:樣本相關系數r的大小與成對樣本數據的相關程度有什么內在聯系呢?標準化處理后的成對樣本數據:設其第一分量為設其第二分量為新課探究問題3:樣本相關系數r的大小與成對樣本數據的相關程度有什么內在聯系呢?追問1:當|r|=1時,成對樣本數據之間具有怎樣的關系?所以
當|r|=1時
,向量
與
共線。即存在實數,使得成對樣本數據(xi,yi)都落在直線
上
。成對樣本數據的兩個分量之間滿足一種線性關系.新課探究樣本相關系數對于變量x,y,利用成對樣本數據(x1,y1),(x2,y2),…,(xn,yn)構造則稱r為變量x和變量y的樣本相關系數.(2)當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關.(1)取值范圍為[-1,1]:當|r|越接近1時,線性相關程度越強,當|r|越接近0時,線性相關程度越弱.當|r|=1時,表明成對樣本數據都落在一條直線上;當r=0時,只表明成對樣本數據間沒有線性相關關系,但不排除它們之間有其他相關關系.(3)若0.75≤|r|≤1,則認為y與x的線性相關程度很強;
若0.3≤|r|<0.75,則認為y與x的線性相關程度一般;
若|r|≤0.25,則認為y與x的線性相關程度較弱)兩個隨機變量的相關性可以通過散點圖對成對樣本數據進行分析,而樣本相關系數r可以反映兩個隨機變量之間的線性相關程度:r的符號反映相關關系的正負性,|r|的大小反映兩個變量線性相關的程度,即散點集中于一條直線的程度.判斷線性相關程度:散點圖+r新課探究圖(1)中成對樣本數據的正線性相關程度很強.圖(2)中成對樣本數據的負線性相關程度比較強.圖(3)中對樣本數據的線性相關程度很弱.圖(4)中成對樣本數據的線性相關程度極弱.新課探究小試牛刀1.(多選)對兩個變量的樣本相關系數r,下列說法正確的是(
)ADA.|r|越大,相關程度越大B.|r|越小,相關程度越大C.|r|趨近于0時,沒有線性相關關系D.|r|越接近1時,線性相關程度越強解析
對于A,|r|越大,相關程度越大,A正確;對于B,|r|越小,相關程度越小,B錯誤;對于C,|r|趨近于0時,線性相關關系越弱,C錯誤;對于D,|r|越接近1時,線性相關程度越強,D正確.小試牛刀2.(多選)下面的散點圖與樣本相關系數r一定不符合的是(
)ACD解析
A中,由散點圖可得,兩相關變量呈負相關,故A錯誤;B中,由散點圖可得,兩相關變量呈正相關,且樣本相關系數可能是r=0.75;C中,若樣本相關系數r=-1,則所有的點應該分布在一條直線上,散點圖顯然不符合,故C錯誤;D中,若樣本相關系數r=1,則所有的點應該分布在一條直線上,散點圖顯然不符合,故D錯誤.小試牛刀3.對四組數據進行統計,獲得以下散點圖,關于其相關系數比較,正確的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3A小試牛刀4.對四對變量y和x進行線性相關檢驗,已知n是觀測值組數,r是樣本相關系數,且已知:①n=7,r=0.9533;②n=15,r=0.3012;③n=17,r=0.4991;④n=3,r=0.9950.則變量y和x線性相關程度最高的兩組是()A.①②B.①④C.②④D.③④解析:樣本相關系數r的絕對值越大,變量x,y的線性相關程度越高B
例1根據表8.1-1中脂肪含量和年齡的樣本數據,推斷兩個變量是否線性相關,計算樣本相關系數,并推斷它們的相關程度.編號1234567891011121314年齡/歲2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6課本例題解:由樣本數據可得由此可以推斷脂肪含量和年齡這兩個變量正線性相關,且相關程度很強.課本例題
例1根據表8.1-1中脂肪含量和年齡的樣本數據,推斷兩個變量是否線性相關,計算樣本相關系數,并推斷它們的相關程度.編號1234567891011121314年齡/歲2327394145495053545657586061脂肪含量/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6解:由樣本數據可得由此可以推斷脂肪含量和年齡這兩個變量正線性相關,且相關程度很強.課本例題
例2有人收集了某城市居民年收入(所有居民在一年內收人的總和)與A商品銷售額的10年數據,如下表所示.第n年12345678910居民年收入/億元32.231.132.935.837.138.039.043.044.646.0A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0解:畫出散點圖,推斷成對樣本數據是否線性相關,并通過樣本相關系數推斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.畫出成對樣本數據的散點圖,如圖所示.從散點圖看,A商品銷售額與居民年收人的樣本數據呈現出線性相關關系.由樣本數據計算得樣本相關系數r≈0.95.由此可以推斷,A商品銷售額與居民年收入正線性相關,即A商品銷售額與居民年收入有相同的變化趨勢,且相關程度很強.課本例題
例3在某校高一年級
中隨機抽取25名男生,測得他們的身高、體重、臂展等數據,如下表所示.體重與身高、臂展與身高分別具有怎樣的相關性?編號身高/cm體重/kg臂展/cm編號身高/cm體重/kg臂展/cm1234567891011121317317917517918217318017016917717717817455715262826355815454596756169170172177174166174169166176170174170141516171819202122232425166176176175169184169182171177173173666149604886585458615851161166165173162189164170164173165169課本例題根據樣本數據畫出體重與身高、臂展與身高的散點圖,分別如圖(1)和(2)所示,兩個散點圖都呈現出線性相關的特征.解:通過計算得到體重與身高、臂展與身高的樣本相關系數分別約為0.34和0.78,都為正線性相關.其中,臂展與身高的相關程度更高.課本練習103頁1.由簡單隨機抽樣得到的成對樣本數據的樣本相關系數是否一定能確切地反映變量之間的相關關系?為什么?解:樣本相關系數可以反映變量之間相關的正負性及線性相關的程度,但由于樣本數據的隨機性,樣本相關系數往往不能確切地反映變量之間的相關關系.一般來說,樣本量越大,根據樣本相關系數推斷變量之間相關的正負性及線性相關的程度越可靠,而樣本量越小則越不可靠.一個極端的情況是,無論兩個變量之間是什么關系,如果樣本量取2,則計算可得樣本相關系數的絕對值都是1(在樣本相關系數存在的情況下),顯然據此推斷兩個變量完全線性相關是不合理的.課本練習103頁2.已知變量x和變量y的3對隨機觀測數據(2,2),(3,-1),(5,-7),計算成對樣本數據的樣本相關系數.能據此推斷這兩個變量線性相關嗎?為什么?解:由樣本數據可得雖然樣本相關系數為-1,三個樣本點在一條直線上,但是由于樣本量太小,據此推斷兩個變量完全線性相關并不可靠.課本練習103頁解:3.畫出下列成對數據的散點圖,并計算樣本相關系數.據此,請你談談樣本相關系數在刻畫成對樣本數據相關關系上的特點.(1)(-2,-3),(-1,-1),(0,1),(1,3),(2,5),(3,7);(2)(0,0),(1,1),(2,4),(3,9),(4,16);(3)(-2,-8),(-1,-1),(0,0),(1,1),(2,8),(3,27);(4)(2,0)(1,),(0,2),(-1,),(-2,0).248x-4-320-213-16y-2??????515x2041310y?????20.51.5x-320-213-11y??????51020x-10-320-21
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45435-2025航空輔助導航北斗機載設備技術要求和測試方法
- GB/T 45401.2-2025人工智能計算設備調度與協同第2部分:分布式計算框架
- 碳酸飲料行業新興市場機會考核試卷
- 棉麻行業生產設備選型與評價考核試卷
- 環境監測無人機技術應用考核試卷
- 液力機械在游樂設施中的應用考核試卷
- 碳超級電容器制造技術發展現狀考核試卷
- 漁業電子商務案例分析考核試卷
- 經濟林樹種育種新技術考核試卷
- 武漢晴川學院《環境土壤學》2023-2024學年第二學期期末試卷
- 安徽恒星新材料科技有限公司年產6萬噸新型高品質電子級及多功能環氧樹脂項目環評報告
- 光伏支架及組件安裝施工方案(最終版)
- 04S520埋地塑料排水管道施工標準圖集OSOS
- 220KV輸電線路組塔施工方案
- 高中班級讀書活動方案
- 國際經濟學教案doc
- 六年級數學下冊《圖形的運動》
- 2022-2023學年北京海淀人大附數學八年級第二學期期末復習檢測試題含解析
- 高中歷史雙向細目表
- 2022-2023學年北京石景山數學七下期中檢測試題含解析
- 蘇教版四年級下冊數學期中復習
評論
0/150
提交評論