




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
8.1.2樣本相關系數教學設計課時教學內容本節的主要內容是一元線性回歸模型,它是線性回歸分析的核心內容,也是后續研究兩變量間的相關性有關問題的基礎.通過散點圖直觀探究分析得出的直線擬合方式不同,擬合的效果就不同,它們與實際觀測值均有一定的偏差.在經歷用不同估算方法描述兩個變量線性相關關系的過程中,解決用數學方法刻畫從整體上看各觀測點到擬合直線的距離最小的問題,讓學生在此基礎上了解更為科學的數據處理方式——最小二乘法,有助于他們更好地理解核心概念“經驗回歸直線”,并最終體現回歸方法的應用價值.就統計學科而言,對不同的數據處理方法進行“優劣評價”是“假設檢驗”的萌芽.了解最小二乘法思想,將其與各種估算方法進行比較,體會它的相對科學性,既是統計學教學發展的需要,又是在體會此思想的過程中促進學生對核心概念進一步理解的需要.最小二乘法思想作為本節課的核心思想,由此得以體現,而回歸思想和貫穿統計學科的隨機思想,也是本節課需要滲透的.課時教學目標1.結合實例,會通過相關系數比較多組成對數據的相關性.2.了解樣本相關系數與標準化數據向量夾角的關系.教學重點、難點1.重點:一元線性回歸模型的基本思想,經驗回歸方程,最小二乘法.2.難點:求最小二乘估計,殘差分析.教學過程設計環節一創設情境,引入課題通過觀察散點圖中成對樣本數據的分布規律,我們可以大致推斷兩個變量是否存在相關關系、是正相關還是負相關、是線性相關還是非線性相關等.散點圖雖然直觀,但無法確切地反映成對樣本數據的相關程度,也就無法量化兩個變量之間相關程度的大小.能否像引入平均值、方差等數字特征對單個變量數據進行分析那樣,引入一個適當的“數字特征”,對成對樣本數據的相關程度進行定量分析呢?對于變量x和變量y,設經過隨機抽樣獲得的成對樣本數據為,,…,,其中,,…,和,,…,的均值分別為和.將數據以為零點進行平移,得到平移后的成對數據為,,…,.并繪制散點圖.【師生活動】觀察撒點圖代表的數據的正負大小等特征,并根據特征嘗試進行構造統計量。預設結果:沒有明顯的特征【師生活動】對數據進行中心化處理再觀察數值特征利用上述方法處理表8.11中的數據,得到圖8.13.我們發現,這時的散點大多數分布在第一象限、第三象限,大多數散點的橫、縱坐標同號.顯然,這樣的規律是由人體脂肪含量與年齡正相關所決定的.環節二觀察分析,感知概念一般地,如果變量x和y正相關,那么關于均值平移后的大多數散點將分布在第一象限、第三象限,對應的成對數據同號的居多,如圖8.14(1)所示;如果變量x和y負相關,那么關于均值平移后的大多數散點將分布在第二象限、第四象限,對應的成對數據異號的居多,如圖8.14(2)所示.預設結果:線性負相關:基本異號;線性正相關:基本同號思考:根據上述分析.你能利用正相關變量和負相關變量的成對樣本數據平移后呈現的規律,構造一個度量成對樣本數據是正相關還是負相關的數字特征嗎?從上述討論得到啟發,利用散點的橫、縱坐標是否同號,可以構造一個量.一般情形下,表明成對樣本數據正相關;表明成對樣本數據負相關.環節三抽象概括,形成概念思考:你認為的大小一定能度量出成對樣本數據的相關程度嗎?因為的大小與數據的度量單位有關,所以不宜直接用它度量成對樣本數據相關程度的大小.例如,在研究體重與身高之間的相關程度時,如果體重的單位不變,把身高的單位由米改為厘米,則相應的將變為原來的100倍,但單位的改變并不會導致體重與身高之間相關程度的改變.追問3如果數據的單位發生變化,上面的統計量是否仍適用?為了消除度量單位的影響,需要對數據作進一步的“標準化”處理.我們用,.分別除和,得,,…,,為簡單起見,把上述“標準化”處理后的成對數據分別記為,,…,.仿照的構造,可以得到.(1)【師生活動】用具體的實例進行驗證。在研究體重與身高之間的相關程度時,如果體重的單位不變,把身高單位由米改為厘米,單位的改變不會改變體重與身高之間的相關程度。考查的變化。我們稱r為變量x和變量y的樣本相關系數(samplecorrelationcoefficient).這樣,我們利用成對樣本數據構造了樣本相關系數r.樣本相關系數r是一個描述成對樣本數據的數字特征,它的正負性和絕對值的大小可以反映成對樣本數據的變化特征:問題4樣本相關系數r的正負能反映出成對變量的什么關系?當時,稱成對樣本數據正相關.這時,當其中一個數據的值變小時,另一個數據的值通常也變小;當其中一個數據的值變大時,另一個數據的值通常也變大.當時,稱成對樣本數據負相關.這時,當其中一個數據的值變小時,另一個數據的值通常會變大;當其中一個數據的值變大時,另一個數據的值通常會變小.問題5樣本相關系數r的取值與成對樣本數據的相關程度有什么內在聯系?那么,樣本相關系數r的大小與成對樣本數據的相關程度有什么內在聯系呢?為此,我們先考察一下r的取值范圍.【設計意圖】從創設認知需求,從學生的已有經驗出發,層層引導,讓學生經歷構造一個新的統計量的過程,體會用數據描述客觀事實的精確性,以及數學的合理性和嚴謹性。【師生活動】類比向量的數量積進行研究。觀察r的結構,聯想到二維(平面)向量、三維(空間)向量數量積的坐標表示,我們將向量的維數推廣到n維,n維向量,的數量積仍然定義為,其中為向量,的夾角.類似于平面或空間向量的坐標表示,對于向量和,我們有.設“標準化”處理后的成對數據,,…,的第一分量構成n維向量,第二分量構成n維向量,則有.因為,所以樣本相關系數,其中為向量和向量的夾角.由,可知.環節四辨析理解深化概念思考:當時,成對樣本數據之間具有怎樣的關系呢?當時,中的或,向量和向量共線.由向量的知識可知,存在實數,使得,即.這表明成對樣本數據都落在直線,.上.這時,成對樣本數據的兩個分量之間滿足一種線性關系.由此可見,樣本相關系數的取值范圍為.樣本相關系數的絕對值大小可以反映成對樣本數據之間線性相關的程度:當越接近1時,成對樣本數據的線性相關程度越強;當越接近0時,成對樣本數據的線性相關程度越弱.樣本相關系數有時也稱樣本線性相關系數,刻畫了樣本點集中于某條直線的程度.當時,只表明成對樣本數據間沒有線性相關關系,但不排除它們之間有其他相關關系.圖8.15是不同成對樣本數據的散點圖和相應的樣本相關系數.圖(1)中的散點有明顯的從左下角到右上角沿直線分布的趨勢,說明成對樣本數據呈現出線性相關關系;樣本相關系數,表明成對樣本數據的正線性相關程度很強.圖(2)中的散點有明顯的從左上角到右下角沿直線分布的趨勢,說明成對樣本數據也呈現出線性相關關系;樣本相關系數,表明成對樣本數據的負線性相關程度比較強.從樣本相關系數來看,圖(1)中成對樣本數據的線性相關程度要比圖(2)中強一些;圖(3)和圖(4)中的成對樣本數據的線性相關程度很弱,其中圖(4)中成對樣本數據的線性相關程度極弱.綜上可知,兩個隨機變量的相關性可以通過成對樣本數據進行分析,而樣本相關系數r可以反映兩個隨機變量之間的線性相關程度:r的符號反映了相關關系的正負性;的大小反映了兩個變量線性相關的程度,即散點集中于一條直線的程度.在有限總體中,若要確切地了解兩個變量之間相關關系的正負性及線性相關的程度,我們可以利用這兩個變量取值的所有成對數據,通過公式(1)就可以計算出兩個變量的相關系數.例如,要確切了解脂肪含量y與年齡x的線性相關程度,需要調查所有人的年齡及其脂肪含量,再將得到的成對數據代入公式(1),計算出相關系數.這個相關系數就能確切地反映變量之間的相關程度.不過,在實際中,獲得總體中所有的成對數據往往是不容易的.因此,我們還是要用樣本估計總體的思想來解決問題.也就是說,我們先要通過抽樣獲取兩個變量的一些成對樣本數據,再計算出樣本相關系數,通過樣本相關系數去估計總體相關系數,從而了解兩個變量之間的相關程度.對于簡單隨機樣本而言,樣本具有隨機性,因此樣本相關系數r也具有隨機性.一般地,樣本容量越大,用樣本相關系數估計兩個變量的相關系數的效果越好.【師生活動】根據式子特征進行分析。【設計意圖】讓學生經歷概念的自主建構過程,并讓學生體會r的完備性與純粹性。環節五概念應用,鞏固內化例1根據表8.11中脂肪含量和年齡的樣本數據,推斷兩個變量是否線性相關,計算樣本相關系數,并推斷它們的相關程度.解:先畫出散點圖,如圖8.11所示.觀察散點圖,可以看出樣本點都集中在一條直線附近,由此推斷脂肪含量和年齡線性相關.根據樣本相關系數的定義,①利用計算工具計算可得,,,,.代入①式,得.由樣本相關系數,可以推斷脂肪含量和年齡這兩個變量正線性相關,且相關程度很強.利用統計軟件計算樣本相關系數,Excel軟件用函數CORREL;R軟件用函數cor.【師生活動】教師帶領學生一起計算,提醒學生答題的規范性和得分點。例2有人收集了某城市居民年收入(所有居民在一年內收入的總和)與A商品銷售額的10年數據,如表8.12所示.表8.12第n年12345678910居民年收入/億元32.231.132.935.837.138.039.043.044.646.0A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0畫出散點圖,推斷成對樣本數據是否線性相關,并通過樣本相關系數推斷居民年收入與A商品銷售額的相關程度和變化趨勢的異同.解:畫出成對樣本數據的散點圖,如圖8.16所示.從散點圖看,A商品銷售額與居民年收入的樣本數據呈現出線性相關關系.由樣本數據計算得樣本相關系數.由此可以推斷,A商品銷售額與居民年收入正線性相關,即A商品銷售額與居民年收入有相同的變化趨勢,且相關程度很強.【師生活動】一名學生上臺板演,其余學生寫在作業本上。師生共同批改和糾錯。例3在某校高一年級中隨機抽取25名男生,測得他們的身高、體重、臂展等數據,如表8.13所示.表8.13編號身高/cm體重/kg臂展/cm編號身高/cm體重/kg臂展/cm1173551691416666161217971170151766116631755217216176491654179621771717560173518282174181694816261736316619184861897180551742016958164817081169211825417091695416622171581641017754176231776117311177591702417358165121786717425173511691317456170體重與身高、臂展與身高分別具有怎樣的相關性?解:根據樣本數據畫出體重與身高、臂展與身高的散點圖,分別如圖8.17(1)和(2)所示,兩個散點圖都呈現出線性相關的特征.通過計算得到體重與身高、臂展與身高的樣本相關系數分別約為0.34和0.78,都為正線性相關.其中,臂展與身高的相關程度更高.環節六歸納總結,反思提升本節課學習的概念有哪些?(1)一元線性回歸模型;(2)最小二乘法.(3)殘差.在解決問題時,用到了哪些數學思想?思想方法數形結合.【設計意圖】梳理本節課的研究問題和研究思路,讓學生不僅掌握知識和技能,還學會一種新的統計量的研究路徑。環節七 目標檢測,作業布置完成教材:第120?121頁習題8.2第2題.練習(第103頁)1.由簡單隨機抽樣得到的成對樣本數據的樣本相關系數是否一定能確切地反映變量之間的相關關系?為什么?1.【解析】樣本相關系數可以反映變量之間相關的正負性及線性相關的程度,但由于樣本數據的隨機性,樣本相關系數往往不能確切地反映變量之間的相關關系.一般來說,樣本量越大,根據樣本相關系數推斷變量之間相關的正負性及線性相關的程度越可靠,而樣本量越小則越不可靠.一個極端的情況是,無論兩個變量之間是什么關系,如果樣本量取2,則計算可得樣本相關系數的絕對值都是1(在樣本相關系數存在的情況下),顯然據此推斷兩個變量完全線性相關是不合理的.2.已知變量x和變量y的3對隨機觀測數據,,,計算兩個變量的樣本相關系數.能據此推出這兩個變量線性相關嗎?為什么?2.【解析】,,則相關系數,即,雖然樣本相關系數為,三個樣本點在一條直線上,但是由于樣本量太小,據此推斷兩個變量完全線性相關并不可靠.解法二:i123求和xi23510yi2xiyi4xi2492538yi2414954,..雖然樣本相關系數為,三個樣本點在一條直線上,但是由于樣本量太小,據此推斷兩個變量完全線性相關并不可靠.3.畫出下列成對數據的散點圖,并計算樣本相關系數.據此,請你談談樣本相關系數在刻畫兩個變量間相關關系上的特點.(1),,,,,;(2),,,,;(3),,,,,;(4),,,,.3.【解析】(1)散點圖如下:由點數據知:,;;;;則;i123456求和xi2101233yi31135712xiyi6103102141xi241014919yi29119254994,,(2)散點圖如下:由點數據知:,;;;;則;i12345求和xi0123410yi01491630xiyi0182764100xi201491630yi2011681256354,;(3)散點圖如下:由點數據知:,;;;;則;i123456求和xi2101233yi810182727xiyi161011681115xi241014919yi26410164729859,;(4)散點圖如下:由點數據知:,,,,綜上,由相關系數的值可知,越接近1,樣本的線性相關性越強,越接近0,線性相關性越弱.4.隨機抽取7家超市,得到其廣告支出與銷售額數據如下:超市ABCDEFG廣告支出/萬元1246101420銷售額/萬元19324440525354請判斷超市的銷售額與廣告支出之間的相關關系的類型、相關程度和變化趨勢的特征.4.【解析】成對數據的散點圖如圖所示:從散點圖上可得,超市的銷售額與廣告支出之間呈現出線性相關關系,由數據可得;,,,,i1234567求和xi124610142057yi19324440525354294xiyi196417624052074210802841xi2141636100196400753yi236110241936160027042809291613350,由此可推斷,銷售額與廣告支出之間正線性相關,且相關程度較強,銷售額與廣告支出的變化趨勢相同,但隨著廣告支出超過10萬元后,銷售額增加幅度變緩.習題8.1(第103頁)1.在以下4幅散點圖中,判斷哪些圖中的y和x之間存在相關關系?其中哪些正相關,哪些負相關?哪些圖所對應的成對樣本數據呈現出線性相關關系?哪些圖所對應的成對樣本數據呈現出非線性相關關系.1.【解析】(1)由(1)的散點圖可以看到,兩個變量確定的散點沒有落在了一條直線或者曲線附近,是雜亂無章的,所以可以判定兩個變量之間不存在相關關系;(2)由(2)的散點圖可以看到,兩個變量確定的散點幾乎落在了一條直線附近,所以可以判定兩個變量之間存在相關關系,圖像呈現左下右上趨勢,說明兩個變量呈正線性相關關系;(3)由(3)的散點圖可以看到,兩個變量確定的散點幾乎落在了一條直線附近,所以可以判定兩個變量之間存在線性相關關系,圖像呈現左上右下趨勢,說明兩個變量呈負線性相關關系;(4)由(4)的散點圖可以看到,兩個變量確定的散點幾乎落在了一條曲線附近,所以可以判定兩個變量之間存在相關關系,而且是非線性相關關系;綜上,圖(2)(3)(4)中的y和x之間存在相關關系;其中圖(2)(4)中的y和x之間呈現正相關關系;圖(2)(3)中的y和x之間呈現線性相關關系;其中圖(4)中的y和x之間呈現非線性相關關系.2.隨機抽取10家航空公司,對其最近一年的航班正點率和顧客投訴次數進行調查,所得數據如下:航空公司編號12345678910航班正點率/%81.876.876.675.773.872.271.270.891.468.5顧客投訴/次2158856874937212218125顧客投訴次數和航班正點率之間是否呈現出線性相關關系?它們之間的相關程度如何?變化趨勢有何特征?2.【解析】散點圖如下:設顧客投訴次數為,正點率為,i12345678910求和xi81.876.876.675.773.872.271.270.891.468.5758.8yi2158856874937212218125736xiyi1717.84454.465115147.65461.26714.65126.48637.61645.28562.553978.3xi26691.245898.245867.565730.495446.445212.845069.445012.648353.964692.2557975.1yi2441336472254624547686495184148843241562565796,,,,,相關系數,可以推斷顧客投訴次數與航班正點率負線性相關,且相關程度較強,顧客投訴次數和航班正點率的變化趨勢相反.3.根據物理中的胡克定律,彈簧伸長的長度與所受的外力成正比.測得一根彈簧伸長長度x和相應所受外力F的一組數據如下:編號12345678910x/cm11.21.41.61.82.02.22.42.83.0F/N3.083.764.315.025.516.256.747.408.549.24兩個變量的樣本相關系數是否為1?請你解釋其中的原因.3.【解析】先畫出彈簧長度和所受外力的散點圖,如圖所示,i123
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年抗重癥肌無力藥項目投資申請報告代可行性研究報告
- 網絡劇拍攝基地全天候保潔及設備維護合同
- 煤炭生產安全責任與經營管理委托協議
- 智能化出租車全權委托運營管理合同
- 文化創意產業文創產品銷售有限合伙協議
- 民族工藝品展品運輸保險及賠償合同
- 生物制藥技術秘密保護與知識產權保護合同
- 抖音短視頻內容創作者火花保險保障合作協議
- 抖音平臺網紅直播帶貨服務及供應鏈管理合同
- 海外精英人才搜索與引進合作協議
- 課題申報參考:西藏地方與祖國關系史融入當地高校“中華民族共同體概論”課教學研究
- 【MOOC】《C++程序設計基礎》(華中科技大學)章節作業中國大學慕課答案
- 《南方航空公司匯率風險管理策略案例分析》
- 防范化解矛盾糾紛安全
- GB/T 45072-2024自然保護地名詞術語
- 漁船輪機管理考試復習題及答案
- 品管圈PDCA改善案例-降低住院患者跌倒發生率
- 汽車美容服務質量管理制度
- 2024年廣東潮州中考物理一模試題 (含答案)
- 2024年中職高考數學計算訓練 專題13 數列的相關計算
- ISO22716-執行標準化妝品良好操作規范GMPC標準及內審員培訓教材
評論
0/150
提交評論