




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
8.1成對數據的統計相關性8.1.2樣本的相關系數復習回顧1、變量的相關關系2、散點圖
兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.
成對樣本數據都可用直角坐標系中的點表示出來,由這些點組成了統計圖.我們把這樣的統計圖叫做散點圖.復習回顧3、變量相關關系的分類正相關和負相關線性相關和非線性相關4、兩個變量之間相關關系的確定(1)經驗作出推斷(2)通過樣本數據分析,從數據中提取信息,并構建適當的模型,再利用模型進行估計或推斷探究新知通過觀察散點圖中成對樣本數據的分布規律,我們可以大致推斷兩個變量是否存在相關關系、是正相關還是負相關、是線性相關還是非線性相關等.但無法確切地反映成對樣本數據的相關程度,也就無法量化兩個變量之間相關程度的大小.問題:能否引入一個適當的“數字特征”,對成對樣本數據的相關程度進行定量分析呢?
對于變量x和變量y,設經過隨機抽樣獲得的成對樣本數據為(x1,y1),(x2,y2),…,(xn,yn),其中將數據以
為零點進行平移,得到平移后的成對數據為…,
并繪制散點圖.探究新知問題:能否引入一個適當的“數字特征”,對成對樣本數據的相關程度進行定量分析呢?將數據以
為零點進行平移,得到平移后的成對數據為…,
并繪制散點圖.探究新知線性負相關線性正相關無相關關系非線性相關線性負相關線性正相關無相關關系非線性相關數據預處理的常用方法:中心化(零均值化)中心化探究新知如果變量x和變量y負相關,那么關于均值平移后的大多數點將分布在第二、四象限,對應的成對數據異號居多.一般地,如果變量x和變量y正相關,那么均值平移后的大多數點將分布在第一、三象限,對應的成對數據同號居多;························探究新知思考1:
根據上述分析,你能利用正相關變量和負相關變量的成對樣本數據平移后呈現的規律,構造一個度量成對樣本數據是正相關還是負相關的數字特征嗎?根據散點圖特征,初步構造統計量.利用散點
的橫、縱坐標是否同號,可以構造一個量
一般情形下,Lxy>0表明成對樣本數據正相關;Lxy<0表明成對樣本數據負相關.探究新知思考2:
你認為Lxy的大小一定能度量出成對樣本數據的相關程度嗎?
在研究體重與身高之間的相關程度時,如果體重的單位不變,把身高單位由米改為厘米,單位的改變不會改變體重與身高之間的相關程度.=100Lxy>0我們發現,Lxy的大小與數據的度量單位有關,所以不能直接用它度量成對樣本數據相關程度的大小.探究新知為了消除度量單位的影響,需要對數據作進一步的“標準化”處理.我們用分別除為簡單起見,把上述“標準化”處理后的成對數據分別記為(x′1,y′1),(x′2,y′2),…,(x′n,y′n),仿照Lxy的構造,可以得到探究新知為簡單起見,把上述“標準化”處理后的成對數據分別記為(x′1,y′1),(x′2,y′2),…,(x′n,y′n),仿照Lxy的構造,可以得到概念講解樣本相關系數當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關.我們稱r為變量x和變量y的樣本相關系數.
樣本相關系數r是一個描述成對樣本數據的數字特征,它的正負和絕對值的大小可以反映成對樣本數據的變化特征:探究新知思考3:樣本相關系數r的大小與成對樣本數據的相關程度有什么內在聯系呢?相關系數r的取值范圍是多少呢?
觀察r的結構,聯想到二維(平面)向量、三維(空間)向量數量積的坐標表示,我們將向量的維數推廣到n維,n維向量
的數量積仍然定義為
,其中θ為向量
的夾角.
類似于平面或空間向量的坐標表示,對于向量
=(a1,a2,…,an)和
=(b1,b2,…,bn),我們有=a1b1+a2b2+…+anbn.“標準化”處理后的成對數據:(x′1,y′1),(x′2,y′2),…,(x′n,y′n)探究新知設其第一分量構成n維向量設其第二分量構成n維向量
同理可得探究新知思考3:樣本相關系數r的大小與成對樣本數據的相關程度有什么內在聯系呢?相關系數r的取值范圍是多少呢?樣本相關系數r的取值范圍為[-1,1]=cosθ∵-1≤cosθ≤1∵∴-1≤r≤1由向量的知識可知,存在實數λ,使得
,探究新知思考4:
相關系數|r|=1時,成對樣本數據之間具有怎樣的關系呢?r=cosθ這時,成對樣本數據的兩個分量之間滿足一種線性關系.這表明成對樣本數據(xi,yi)都落在直線
上.當|r|=1時,r=cosθ中的θ=0或π,向量
共線.概念講解相關系數的性質:
由此可見,樣本相關系數r的取值范圍為[-1,1],樣本相關系數r的絕對值大小可以反映成對樣本數據之間線性相關的程度:①當r>0時,稱成對樣本數據正相關;當r<0時,稱成對樣本數據負相關.②
|r|≤1;③當|r|越接近1時,成對數據的線性相關程度越強;
當|r|越接近0時,成對數據的線性相關程度越弱;特別地,當|r|=0時,成對數據的沒有線性相關關系(但不排除它們間有其他相關關系);
當|r|=1時,成對數據都落在一條直線上.探究新知圖(1)中成對樣本數據的正線性相關程度很強.圖(2)中成對樣本數據的負線性相關程度比較強.圖(3)中成對樣本數據的線性相關程度很弱.圖(4)中成對樣本數據的線性相關程度極弱.問題:觀察以下散點圖,判斷成對數據間的相關關系判斷線性相關程度:散點圖+r
兩個隨機變量的相關性可以通過散點圖對成對樣本數據進行分析,而樣本相關系數r可以反映兩個隨機變量之間的線性相關程度:①r的符號反映相關關系的正負性;②|r|的大小反映兩個變量線性相關的程度,即散點集中于一條直線的程度.1、為了比較甲、乙、丙三組數據的線性相關性的強弱,小鄭分別計算了甲、乙、丙三組數據的樣本線性相關系數,其數值分別為0.939,0.937,0.948,則().隨堂練習A、甲組數據的線性相關性最強,乙組數據的線性相關性最弱B、乙組數據的線性相關性最強,丙組數據的線性相關性最弱C、丙組數據的線性相關性最強,甲組數據的線性相關性最弱D、丙組數據的線性相關性最強,乙組數據的線性相關性最弱解:因為樣本線性相關系數的絕對值越大,則線性相關性越強,所以丙組數據的線性相關性最強,乙組數據的線性相關性最弱.D1、根據下表中脂肪含量和年齡的樣本數據,推斷兩個變量是否線性相關,計算樣本相關系數,并推斷它們的相關程度.例題解析年齡2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6參考數據:解:先畫出散點圖,如圖所示.觀察散點圖,可以看出樣本點都集中在一條直線附近,由此推斷脂肪含量和年齡線性相關.例題解析參考數據:根據樣本相關系數的定義,由樣本相關系數r≈0.97,可以推斷脂肪含量和年齡這兩個變量正線性相關,且相關程度很強。脂肪含量與年齡變化趨勢相同.小結
散點圖可以從直觀上判斷成對樣本數據的相關性,通過樣本相關系數則可以從定量的角度刻畫成對樣本數據相關的正負性和線性相關程度.2、有人收集了某城市居民收入(所有居民在一年內收入的總和)與A商品銷售額的10年數據,如下表所示.例題解析第n年12345678910居民年收入/億元32.231.132.935.837.138.039.043.044.646.0A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0畫出散點圖,判斷成對樣本數據是否線性相關,并通過樣本相關系數推斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.解:從散點圖看,A商品銷售額與居民年收入的樣本數據呈現線性相關關系.居民年收入/億元504540352030253035404550·······55A商品銷售額/萬元···2、有人收集了某城市居民收入(所有居民在一年內收入的總和)與A商品銷售額的10年數據,如下表所示.例題解析第n年12345678910居民年收入/億元32.231.132.935.837.138.039.043.044.646.0A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0畫出散點圖,判斷成對樣本數據是否線性相關,并通過樣本相關系數推斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.解:r≈0.95由此可以推斷,A商品銷售額與居民年收入正線性相關,即A商品銷售額與居民年收入有相同的變化趨勢,且相關程度很強.3、在某校高一年級中隨機抽取25名男生,測得他們的身高、體重、臂展等數據,如下表所示.例題解析體重與身高、臂展與身高分別具有怎樣的相關性?解:根據樣本數據畫出體重與身高、臂展與身高的散點圖,分別如圖(1)和(2)所示,兩個散點圖都呈現出線性相關的特征.3、在某校高一年級中隨機抽取25名男生,測得他們的身高、體重、臂展等數據,如下表所示.例題解析體重與身高、臂展與身高分別具有怎樣的相關性?解:根據樣本數據畫出體重與身高、臂展與身高的散點圖,分別如圖(1)和(2)所示,兩個散點圖都呈現出線性相關的特征.通過計算得到體重與身高、臂展與身高的樣本相關系數分別約為0.34和0.78,都為正相關.其中,臂展與身高的相關程度更高.2、對四組數據進行統計,獲得以下散點圖,關于其相關系數比較,正確的是()隨堂練習AA、r2<r4<0<r3<r1B、r4<r2<0<r1<r3C、r4<r2<0<r3<r1D、r2<r4<0<r1<r33、根據統計,某蔬菜基地西紅柿畝產量的增加量y(百千克)與某種液體肥料每畝使用量x(千克)之間的對應數據的散點圖,如圖所示.隨堂練習02468345x(千克)y(百千克)5·····依據數據的散點圖可以看出,y與x之間有較強的線性相關關系.請計算樣本相關系數r并加以說明(若|r|>0.75,則
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 清洗酒店臺布協議書
- 姐弟撫養后續協議書
- 項目合作籌備協議書
- 簡單參股協議書范本
- 學生碰撞調解協議書
- 企業外出旅游協議書
- 轉崗降薪協議書范本
- 人臉簽約服務協議書
- 簡約私人糾紛協議書
- 勞務服務推廣協議書
- GB/T 23445-2009聚合物水泥防水涂料
- 中醫基礎理論(中英文對照)
- 生理學(全套課件)
- 香港公司條例
- 污水處理系統工程合同范本
- 德能勤績廉個人總結的
- 二年級美術上冊課件 《3.我的手印畫》 贛美版 (共18張PPT)
- Q∕SY 126-2014 油田水處理用緩蝕阻垢劑技術規范
- GB∕T 3216-2016 回轉動力泵 水力性能驗收試驗 1級、2級和3級
- 電子電氣評估規范-最新
- 黑布林繪本 Dad-for-Sale 出售爸爸課件
評論
0/150
提交評論