成對數據的統計相關性課件-高二下學期數學人教A版選擇性_第1頁
成對數據的統計相關性課件-高二下學期數學人教A版選擇性_第2頁
成對數據的統計相關性課件-高二下學期數學人教A版選擇性_第3頁
成對數據的統計相關性課件-高二下學期數學人教A版選擇性_第4頁
成對數據的統計相關性課件-高二下學期數學人教A版選擇性_第5頁
已閱讀5頁,還剩14頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

8.1.1變量間的相關關系8.1.2樣本相關系數8.1成對數據的統計相關性一、變量的相關關系兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.(在相關關系中,變量y的值不能隨變量x的值的確定而唯一確定。)①子女身高y與父親身高x之間的關系②商品銷售收入y與廣告支出x之間的關系③空氣污染指數y與汽車保有量x之間的關系④糧食畝產量y與施肥量x之間的關系二、變量的相關關系判定散點圖:成對數據都可用直角坐標系中的點表示,有這些點構成的統計圖案例探究:刻畫人體脂肪含量和年齡的相關關系探究:在對人體的脂肪含量和年齡之間關系的研究中,科研人員獲得了一些年齡和脂肪含量的簡單隨機樣本數據,如表所示.

表中每個編號下的年齡和脂肪含量數據都是對同一個體的觀測結果,它們構成了成對數據.編號1234567891011121314年齡2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6思考:根據以上數據,你能直觀刻畫并推斷人體的脂肪含量與年齡之間存在怎樣的關系嗎?散點圖脂肪含量與年齡之間存在相關關系從整體上看,(1)當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,則稱兩個變量正相關;(2)當一個變量的值增加時,另一個變量的相應值呈現減小的趨勢,則稱這兩個變量負相關.(3)如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,則稱這兩個變量線性相關.線性相關三、變量的相關關系的類型(4)如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.非線性相關(曲線相關)(5)散點雜亂無章,無規律可言,無相關性散點雜亂無章,無規律可言,無相關性觀察散點圖中成對樣本數據的分布規律,可大致推斷兩個變量是否存在相關關系、是正相關還是負相關、是線性相關還是非線性相關等.散點圖是描述成對數據之間關系的一種直觀方法.線性相關非線性相關(曲線相關)存在正相關或負相關總結x10151720252832y11.31.822.62.73.3解:(1)散點圖如右圖所示:(2)由圖可知,所有數據點接近直線排列,因此,認為y與x有線性相關關系,且為正相關.例1.某公司的利潤y(單位:千萬元)與銷售總額x(單位位:千萬元)之間有如下表對應數據:(1)畫出散點圖;(2)判斷y與x是否具有線性相關關系X30252015100535Y0.511.522.533.5·······例2以下是某地搜集到的新房屋的銷售價格和房屋的面積的數據:房屋面積(平方米)

617011511080135105銷售價格(萬元)

12.215.324.821.618.429.222畫出數據對應的散點圖,并指出銷售價格與房屋面積這兩個變量是正相關還是負相關,是否為線性相關?由散點圖可見,兩者之間具有正相關關系。是線性相關我們稱r為變量x和變量y的樣本相關系數.樣本相關系數r是一個描述成對樣本數據的數字特征,它的正負和絕對值的大小可以反映成對樣本數據的變化特征。

樣本相關系數r定量度量線性相關強弱的量值。

四、樣本相關系數r(線性相關的判定可利用散點圖定性的直觀判定,也可利用相關系數r定量的判定。)樣本相關系數r的取值范圍樣本相關系數r的取值范圍為[-1,1]當|r|=1時

,向量

共線。

即存在實數,使得

成對樣本數據(xi,yi)都落在直線

即此時兩個變量之間滿足一種線性(函數)關系,即滿足完全線性相關.①r的正負:反映成對樣本數據的變化趨勢樣本(線性)相關系數r的性質②r的范圍:?1≤r≤1③|r|的大?。悍从吵蓪颖緮祿€性相關的程度(即散點集中于某條直線的程度):|r|越接近1:線性相關程度越強;|r|越接近0:線性相關程度越弱.r=0時,只表明成對樣本數據間無線性相關關系,但不排除它們有其他相關關系.④r=1函數關系(樣本容量越大,用樣本相關系數r估計兩個變量的線性相關關系的效果越好。

相關系數r只定量判定線性相關關系)年齡23273941454950脂肪9.517.821.225.927.526.328.2年齡53545657586061脂肪29.630.231.430.833.535.234.6

參考數據:例1根據下表中脂肪含量和年齡的樣本數據,推斷兩個變量是否線性相關,計算樣本相關系數,并推斷它們的相關程度解:先畫出散點圖,如右圖所示觀察散點圖,可以看出樣本點都集中在一條直線附近,由此推斷脂肪含量和年齡線性相關.

由樣本相關系數??≈0.97,可以推斷脂肪含量和年齡這兩個變量正線性相關,且相關程度很強。脂肪含量與年齡變化趨勢相同.參考數據:例1根據下表中脂肪含量和年齡的樣本數據,推斷兩個變量是否線性相關,計算樣本相關系數,并推斷它們的相關程度散點圖可以從直觀上判斷成對樣本數據的相關性,通過樣本相關系數則可以從定量的角度刻畫成對樣本數據相關的正負性和線性相關程度.解:第n年12345678910居民年收入/億元32.231.132.935.837.138394344.646A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0畫出散點圖,判斷成對樣本數據是否線性相關,并通過樣本相關系數推斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.居民年收入/億元504540352030253035404550·······55A商品銷售額/萬元···例2有人收集了某城市居民年收入(所有居民在一年內收入的總和)與A商品銷售額的10年數據,如表所示.從散點圖看,A商品銷售額與居民年收入的樣本數據呈現線性相關關系.例題點撥例3.在某校高一年級中隨機抽取25名男生,測得他們的身高、體重、臂展等數據,如下表所示.體重與身高、臂展與身高分別具有怎樣的相關性?解:先畫出散點圖,如圖所示.從散點圖看,兩個散點圖都呈現出線性相關.通過計算得到體重與身高、臂展與身高的樣本相關系數分別約為0.34和0.78,都為正線性相關.r1≈0.34∵r2>r1,∴臂展與身高的相關程度更高.r2≈0.78【注】在作圖中,由于存在誤差,有時很難判斷這些點是否分布在一條直線的附近,從而就很難判斷兩個變量之間是否具有線性相關關系,此時就必須利用線性相關系數來判斷.實際理解與運用P104-3.根據物理中的胡克定律,彈簧伸長的長度與所受的外力成正比.測得一根彈簧伸長長度x和相應所受外力F的一組數據如下:兩個變量的樣本相關系數是否為1?若不是,請你解釋其中的原因.析:計算可得r≈0.9997由此可得,彈簧伸長長度x和相應所受外力F幾乎完全正線性相關,樣本數據沒有完全正線性相關,跟測量存在誤差、彈簧制造工藝等因素有關.實際理解與運用P104-4.某地區的環境條件適合天鵝棲息繁衍.有人發現了一個有趣的現象:該地區有5個村莊,其中3個村莊附近棲息的天鵝較多,嬰兒出生率也較高;2個村莊附近棲息的天鵝較少,嬰兒的出生率也較低.有人認為嬰兒出生率和天鵝數之間存在相關關系,并得出一個結論:天鵝能夠帶來孩子.

你同意這個結論嗎?為什么?從5對統計數據看,嬰兒出生率和天

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論