




已閱讀5頁,還剩4頁未讀, 繼續免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四節變量間的相關關系與統計案例考綱傳真(教師用書獨具)1.會做兩個有關聯變量的數據的散點圖,并利用散點圖認識變量間的相關關系.2.了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程(線性回歸系數公式不要求記憶).3.了解回歸分析的基本思想、方法及其簡單應用.4.了解獨立性檢驗(只要求22列聯表)的思想、方法及其初步應用(對應學生用書第165頁)基礎知識填充1兩個變量的線性相關(1)正相關在散點圖中,點散布在從左下角到右上角的區域,對于兩個變量的這種相關關系,我們將它稱為正相關(2)負相關在散點圖中,點散布在從左上角到右下角的區域,兩個變量的這種相關關系稱為負相關(3)線性相關關系、回歸直線如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫作回歸直線2回歸方程(1)最小二乘法求回歸直線,使得樣本數據的點到它的距離的平方和最小的方法叫作最小二乘法(2)回歸方程方程ybxa是兩個具有線性相關關系的變量的一組數據(x1,y1),(x2,y2),(xn,yn)的回歸方程,其中a,b是待定參數3回歸分析(1)定義:對具有相關關系的兩個變量進行統計分析的一種常用方法(2)樣本點的中心對于一組具有線性相關關系的數據(x1,y1),(x2,y2),(xn,yn),其中(,)稱為樣本點的中心(3)相關系數當r0時,表明兩個變量正相關;當r0時,表明兩個變量負相關r的絕對值越接近于1,表明兩個變量的線性相關性越強r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系通常|r|大于0.75時,認為兩個變量有很強的線性相關性4獨立性檢驗(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這類變量稱為分類變量(2)列聯表:列出兩個分類變量的頻數表,稱為列聯表假設有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數列聯表(稱為22列聯表)為22列聯表y1y2總計x1ababx2cdcd總計acbdabcd構造一個隨機變量2,其中nabcd為樣本容量(3)獨立性檢驗利用隨機變量2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗知識拓展1.b的幾何意義:體現平均增加或平均減少2由回歸直線求出的數據是估算值,不是精確值基本能力自測1(思考辨析)判斷下列結論的正誤(正確的打“”,錯誤的打“”)(1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關關系()(2)通過回歸直線方程ybxa可以估計預報變量的取值和變化趨勢()(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關性檢驗()(4)事件X,Y關系越密切,則由觀測數據計算得到的2的觀測值越大()答案(1)(2)(3)(4)2(教材改編)已知變量x與y正相關,且由觀測數據算得樣本平均數3,3.5,則由該觀測數據算得的線性回歸方程可能是()Ay0.4x2.3By2x2.4Cy2x9.5Dy0.3x4.4A因為變量x和y正相關,排除選項C,D又樣本中心(3,3.5)在回歸直線上,排除B,選項A滿足3下面是一個22列聯表y1y2總計x1a2173x222527總計b46則表中a,b處的值分別為_52,54因為a2173,所以a52.又因為a2b,所以b54.4調查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調查顯示年收入x與年飲食支出y具有線性相關關系,并由調查數據得到回歸直線方程:y0.254x0.321,由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均約增加_萬元0.254由題意知回歸直線的斜率為0.254,故家庭年收入每增加1萬元,年飲食支出平均約增加0.254萬元5為了判斷高中三年級學生是否選修文科與性別的關系,現隨機抽取50名學生,得到如下22列聯表:理科文科男1310女720已知P(23.841)0.05,P(25.024)0.025.根據表中數據,得到2的觀測值k4.844.則認為選修文科與性別有關系出錯的可能性為_5%2的觀測值k4.844,這表明小概率事件發生根據假設檢驗的基本原理,應該斷定“是否選修文科與性別之間有關系”成立,并且這種判斷出錯的可能性約為5%.(對應學生用書第166頁)相關關系的判斷(1)已知變量x和y滿足關系y0.1x1,變量y與z正相關下列結論中正確的是()Ax與y正相關,x與z負相關Bx與y正相關,x與z正相關Cx與y負相關,x與z負相關Dx與y負相關,x與z正相關(2)x和y的散點圖如圖941所示,則下列說法中所有正確命題的序號為_. 【導學號:79140333】圖941x,y是負相關關系;在該相關關系中,若用yc1ec2x擬合時的相關指數為R,用ybxa擬合時的相關指數為R,則RR;x,y之間不能建立線性回歸方程(1)C(2)(1)因為y0.1x1的斜率小于0,故x與y負相關因為y與z正相關,可設zbya,b0,則zbya0.1bxba,故x與z負相關(2)在散點圖中,點散布在從左上角到右下角的區域,因此x,y是負相關關系,故正確;由散點圖知用yc1ec2x擬合比用ybxa擬合效果要好,則RR,故正確;x,y之間可以建立線性回歸方程,但擬合效果不好,故錯誤規律方法判定兩個變量正、負相關性的方法(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關;點的分布從左上角到右下角,兩個變量負相關.(2)相關系數:r0時,正相關;r0時,負相關.(3)線性回歸直線方程中:b0時,正相關;b0時,負相關.跟蹤訓練某公司在2017年上半年的月收入x(單位:萬元)與月支出y(單位:萬元)的統計資料如表所示:月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18根據統計資料,則()A月收入的中位數是15,x與y有正線性相關關系B月收入的中位數是17,x與y有負線性相關關系C月收入的中位數是16,x與y有正線性相關關系D月收入的中位數是16,x與y有負線性相關關系C月收入的中位數是16,收入增加,支出增加,故x與y有正線性相關關系回歸分析(2017全國卷)為了監控某種零件的一條生產線的生產過程,檢驗員每隔30 min從該生產線上隨機抽取一個零件,并測量其尺寸(單位:cm)下面是檢驗員在一天內依次抽取的16個零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95經計算得xi9.97,s0.212,18.439,(xi)(i8.5)2.78,其中xi為抽取的第i個零件的尺寸,i1,2,16.(1)求(xi,i)(i1,2,16)的相關系數r,并回答是否可以認為這一天生產的零件尺寸不隨生產過程的進行而系統地變大或變小(若|r|0.25,則可以認為零件的尺寸不隨生產過程的進行而系統地變大或變小);(2)一天內抽檢零件中,如果出現了尺寸在(3s,3s)之外的零件,就認為這條生產線在這一天的生產過程可能出現了異常情況,需對當天的生產過程進行檢查()從這一天抽檢的結果看,是否需對當天的生產過程進行檢查?()在(3s,3s)之外的數據稱為離群值,試剔除離群值,估計這條生產線當天生產的零件尺寸的均值與標準差(精確到0.01)附:樣本(xi,yi)(i1,2,n)的相關系數r,0.09.解(1)由樣本數據得(xi,i)(i1,2,16)的相關系數r0.18.由于|r|0.25,因此可以認為這一天生產的零件尺寸不隨生產過程的進行而系統地變大或變小(2)()由于9.97,s0.212,因此由樣本數據可以看出抽取的第13個零件的尺寸在(3s,3s)以外,因此需對當天的生產過程進行檢查()剔除離群值,即第13個數據,剩下數據的平均數為(169.979.22)10.02,這條生產線當天生產的零件尺寸的均值的估計值為10.02.x160.2122169.9721 591.134,剔除第13個數據,剩下數據的樣本方差為(1 591.1349.2221510.022)0.008,這條生產線當天生產的零件尺寸的標準差的估計值為0.09.規律方法1.回歸直線方程中系數的兩種求法(1)利用公式,求出回歸系數b,a.(2)待定系數法:利用回歸直線過樣本點中心求系數.2.回歸分析的兩種策略(1)利用回歸方程進行預測:把回歸直線方程看作一次函數,求函數值.(2)利用回歸直線判斷正、負相關:決定正相關還是負相關的是回歸系數B3.選擇填空中選一組數據的線性回歸直線方程的方法(1)過定點(),驗證.(2)正、負相關看b的符號.(3)代入數據看誤差大小.跟蹤訓練為了解某地區某種農產品的年產量x(單位:噸)對價格y(單位:千元/噸)和年利潤z的影響,對近五年該農產品的年產量和價格統計如下表:x12345y7.06.55.53.82.2(1)求y關于x的線性回歸方程ybxa;(2)若每噸該農產品的成本為2千元,假設該農產品可全部賣出,預測當年產量為多少時,年利潤z取到最大值?(保留兩位小數)參考公式:b,ab.解(1)由題知3,5,xiyi62.7,x55,b1.23,ab5(1.23)38.69,所以y關于x的線性回歸方程為y1.23x8.69.(2)年利潤zx(1.23x8.69)2x1.23x26.691.2321.23,即當x2.72時,年利潤z最大獨立性檢驗(2017皖北名校聯考)某醫院對治療支氣管肺炎的兩種方案A,B進行比較研究,將志愿者分為兩組,分別采用方案A和方案B進行治療,統計結果如下:有效無效總計使用方案A組96120使用方案B組72總計32(1)完成上述列聯表,并比較兩種治療方案有效的頻率;(2)能否在犯錯誤的概率不超過0.05的前提下認為治療是否有效與方案選擇有關?附:2,其中nabcDP(2k0)0.050.0100.001k03.8416.63510.828解(1)列聯表如下:有效無效總計使用方案A組9624120使用方案B組72880總計16832200使用方案A組有效的頻率為0.8;使用方案B組有效的頻率為0.9.(2)23.5173.841,所以不能在犯錯誤的概率不超過0.05的前提下認為治療是否有郊與方案選擇有關規律方法解決獨立性檢驗問題的一般步驟(1)根據樣本數據制成22列聯表(2)根據公式2,計算2的值(3)查表比較2與臨界值的大小關系,作統計判斷易錯警示:應用獨立性檢驗方法解決問題,易出現不能準確計算2值的錯誤跟蹤訓練(2018江西九校聯考)隨著國家二孩政策的全面放開,為了調查一線城市和非一線城市的二孩生育意愿,某機構用簡單隨機抽樣方法從不同地區調查了100位育齡婦女,結果如圖非一線一線總計愿生452065不愿生132235總計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025合作協議委托合同樣本
- 2025至2031年中國有機玻璃化妝品座行業投資前景及策略咨詢研究報告
- 天津工藝美術職業學院《數據采集與清洗課程設計》2023-2024學年第二學期期末試卷
- 遼寧商貿職業學院《代碼安全機制與實現技術》2023-2024學年第二學期期末試卷
- 深圳北理莫斯科大學《城市規劃原理B》2023-2024學年第一學期期末試卷
- 《人力資源經理工作成果展示》課件
- 社區家長學校家庭教育
- 2025智能家居安防系統安裝合同書
- 2025至2030年中國車載式LED電子顯示屏數據監測研究報告
- 2025至2030年中國美式沾塑鋼絲鉗數據監測研究報告
- 2025年春季中小學升旗儀式安排表(附:1-20周講話稿)
- 專項突破03四則運算實際問題(應用題)(8大考點)(學生版)-四年級數學下冊(人教版)
- 加油站的法規法律合規管理
- 醫療器械質量管理、專業技術及售后服務培訓試題及答案
- 2024年中國男式印花T-恤衫市場調查研究報告
- 2025年孝感道路運輸從業資格證考試模擬試題
- 2025年中考道德與法治專題復習-專題三 堅定文化自信 弘揚中國精神
- 《光明乳業公司企業應收賬款管理現狀及優化建議(10000字論文)》
- 剪映專業版教學課件
- 邀請招標文件模板
- 加工模具保密協議(2024版)
評論
0/150
提交評論