新教材高中數學人教A版(2019)選擇性必修第三冊:第八章知識點_第1頁
新教材高中數學人教A版(2019)選擇性必修第三冊:第八章知識點_第2頁
新教材高中數學人教A版(2019)選擇性必修第三冊:第八章知識點_第3頁
新教材高中數學人教A版(2019)選擇性必修第三冊:第八章知識點_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

新教材高中數學人教A版(2019)選擇性必修第三冊第八章成對數據的統計分析知識點8.1成對數據的統計相關性8.1.1變量的相關關系1.相關關系兩個變量間的關系有函數關系,相關關系和不相關關系兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.2.正相關、負相關從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現增加的趨勢,我們就稱這兩個變量正相關;如果一個變量值增加時,另一個變量的相應值呈現減少的趨勢,則稱這個兩個變量負相關.3.線性相關一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條線附近,我們就稱這兩個變量線性相關.一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或曲線相關.8.1.2樣本相關系數1.相關系數r的計算注意:相關系數是研究變量之間線性相關程度的量變量x和變量y的樣本相關系數r的計算公式如下:r=eq\f(1,n)(x1′y1′+x2′y2′+…+xn′yn′)=eq\f(\o(∑,\s\up10(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up10(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up10(n),\s\do10(i=1))(yi-\o(y,\s\up6(-)))2)).2.相關系數r的性質(1)當r>0時,稱成對樣本數據正相關;當r<0時,成對樣本數據負相關;當r=0時,成對樣本數據間沒有線性相關關系.(2)樣本相關系數r的取值范圍為[-1,1].當|r|越接近1時,成對樣本數據的線性相關程度越強;當|r|越接近0時,成對樣本數據的線性相關程度越弱.3.樣本相關系數與標準化數據向量夾角的關系r=eq\f(1,n)x′·y′=eq\f(1,n)|x′||y′|cosθ=cosθ(其中x′=(x1′,x2′,…,xn′),y′=(y1′,y2′,…,yn′),|x′|=|y′|=eq\r(n),θ為向量x′和向量y′的夾角).8.2一元線性回歸模型及其應用8.2.1一元線性回歸模型1.一元線性回歸模型我們稱eq\b\lc\{(\a\vs4\al\co1(Y=bx+a+e,,E(e)=0,D(e)=σ2))為Y關于x的一元線性回歸模型,其中Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差.2.線性回歸方程與最小二乘法回歸直線方程過樣本點的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))),是回歸直線方程最常用的一個特征我們將eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))稱為Y關于x的線性回歸方程,也稱經驗回歸函數或經驗回歸公式,其圖形稱為經驗回歸直線.這種求經驗回歸方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估計(leastsquaresestimate),其中8.2.2非線性回歸模型及其應用1.殘差的概念對于響應變量Y,通過觀測得到的數據稱為觀測值,通過經驗回歸方程得到的eq\o(y,\s\up6(^))稱為預測值,觀測值減去預測值稱為殘差.殘差是隨機誤差的估計結果,通過殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等,這方面工作稱為殘差分析.2.刻畫回歸效果的方式(1)殘差圖法作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數據,或體重估計值等,這樣作出的圖形稱為殘差圖.若殘差點比較均勻地落在水平的帶狀區域內,帶狀區域越窄,則說明擬合效果越好.(2)殘差平方和法殘差平方和eq\o(∑,\s\up10(n),\s\do6(i=1))(yi-eq\o(y,\s\up6(^))i)2,殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.(3)利用R2刻畫回歸效果決定系數R2是度量模型擬合效果的一種指標,在線性模型中,它代表解釋變量客戶預報變量的能力.R2=1-eq\f(\o(∑,\s\up10(n),\s\do10(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up10(n),\s\do10(i=1))(yi-\o(y,\s\up6(-)))2),R2越大,即擬合效果越好,R2越小,模型擬合效果越差.8.3列聯表與獨立性檢驗8.3.1分類變量與列聯表1.分類變量這里所說的變量和值不一定是具體的數值,例如:性別變量,其取值為男和女兩種我們經常會使用一種特殊的隨機變量,以區別不同的現象或性質,這類隨機變量稱為分類變量,分類變量的取值可以用實數表示.2.2×2列聯表在實踐中,由于保存原始數據的成本較高,人們經常按研究問題的需要,將數據分類統計,并做成表格加以保存,我們將這類數據統計表稱為2×2列聯表,2×2列聯表給出了成對分類變量數據的交叉分類頻數.一般地,假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其2×2列聯表為y1y2合計x1aba+bx2cdc+d合計a+cb+da+b+c+d3.等高堆積條形圖等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯表數據的頻率特征,依據頻率穩定于概率的原理,我們可以推斷結果.8.3.2獨立性檢驗1.臨界值χ2統計量也可以用來作相關性的度量.χ2越小說明變量之間越獨立,χ2越大說明變量之間越相關χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).忽略χ2的實際分布與該近似分布的誤差后,對于任何小概率值α,可以找到相應的正實數xα,使得P(χ2≥xα)=α成立.我們稱xα為α的臨界值,這個臨界值就可作為判斷χ2大小的標準.2.獨立性檢驗基于小概率值α的檢驗規則是:當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.這種利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”,簡稱獨立性檢驗(testofindependence).下表給出了χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論