




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統計模型一元線性回歸模型基礎預習初探主題1相關關系觀察下列變量,思考有關問題.(1)正方體的體積與棱長之間的關系;(2)人的身高與視力之間的關系;(3)汽車的質量和汽車每消耗1升汽油所行駛的平均路程之間的關系;(4)數學成績與語文成績之間的關系.上述每個問題中的兩個變量之間具有怎樣的關系?提示:(1)正方體的體積與棱長之間是確定的關系;(2)人的身高與視力之間不具有相關關系;(3)汽車的質量和汽車每消耗1升汽油所行駛的平均路程成負相關關系;(4)數學成績與語文成績之間不具有相關關系.結論:1.確定關系、相關關系(1)確定關系:當一個變量確定后,另一個變量就確定了.(2)相關關系:變量之間確實有一定的關系,但沒有達到可以互相決定的程度,它們之間的關系帶有一定的隨機性,統計學上稱為相關關系.2.散點圖一般地,如果收集了變量x和變量y的n對數據(簡稱為成對數據),如下表所示,序號i123…n變量xx1x2x3…xn變量yy1y2y3…yn3.正相關、負相關(1)正相關:如果一個變量增大,另一個變量大體上也增大,則稱這兩個變量正相關;(2)負相關:如果一個變量增大,另一個變量大體上減少,則稱這兩個變量負相關.【對點練】1.觀察下列關于兩個變量x和y的三個散點圖,它們從左到右的對應關系依次為()A.正相關、負相關、不相關 B.負相關、不相關、正相關C.負相關、正相關、不相關 D.正相關、不相關、負相關【解析】選D.由相關性可知從左到右的第一個圖是正相關,第二個圖相關性不明確,所以不相關,第三個圖是負相關.2.下列關系屬于負相關的是 ()A.父母的身高與子女身高的關系B.農作物產量與施肥的關系C.吸煙與健康的關系D.數學成績與物理成績的關系【解析】選C.若以吸煙量為橫軸,健康為縱軸畫出散點圖,則由生活常識知,這些點散布在從左上角到右下角的區域內.因此吸煙與健康的關系屬于負相關.主題2回歸直線方程如何利用回歸分析研究變量?提示:對兩個具有線性相關關系的變量,利用回歸分析的方法進行研究,其步驟為畫散點圖,求回歸直線方程,并利用回歸直線方程進行預測.結論:1.回歸直線方程一般地,已知變量x與y的n對成對數據(xi,yi),i=1,2,3,…,n,任意給定一個一次函數y=bx+a,對每一個已知的xi,由直線方程可得到一個估計值
i=bxi+a,如果一次函數=x+能使(-y1)2+(-y2)2+…+(-yn)2=(yi-)2取得最小值,則=x+稱為y關于x的回歸直線方程(對應的直線稱為回歸直線).因為是使得平方和最小,所以其中涉及的方法稱為最小二乘法.其中稱為回歸系數,即回歸直線方程的斜率.2.回歸直線方程的性質(1)回歸直線過點();(2)一次函數=x+的單調性由的符號決定,函數遞增的充要條件是與x正相關的充要條件是>0;y與x負相關的充要條件是<0.【對點練】根據如下樣本數據得到的回歸直線方程為=x+.若,則x每增加1個單位,y就 ()x34567y4.02.50.50.52.0A.增加個單位 B.減少個單位C.增加個單位 D.減少個單位【解析】選D.由題意可得=×(3+4+5+6+7)=5,,代入回歸直線方程得,所以,所以回歸直線方程為,當x每增加1個單位時,,所以y就減少個單位.主題3相關系數1.相關系數是度量什么的一個量?提示:相關系數是度量兩個變量相關性關系強弱的一個量.2.相關系數是如何影響兩變量之間關系的?提示:相關系數r的絕對值越接近于1,相關性越強;反之,相關性越弱.結論:1.相關系數統計學里一般用來衡量y與x的線性相關性強弱,這里的r稱為線性相關系數(簡稱為相關系數).2.相關系數的性質(1)|r|≤1且y與x正相關的充要條件是r>0,y與x負相關的充要條件是r<0;(2)|r|越小,說明兩個變量之間的線性相關性越弱;|r|越大,說明兩個變量之間的線性相關性越強.(3)|r|=1的充要條件是成對數據構成的點都在回歸直線上.【對點練】下列對樣本相關系數的說法不正確的是 ()A.相關系數r可用來衡量變量x與y之間的線性相關程度B.|r|≤1,且|r|越接近1,相關程度越高C.|r|≤1,且|r|越接近0,相關程度越低D.|r|≥1,且|r|越接近1,相關程度越高【解析】選D.相關系數r的取值范圍為[-1,1],|r|≤1,且|r|越接近1,相關程度越高,|r|越接近0,相關程度越低.核心互動探究探究點一變量間的相關關系及判斷【典例1】(1)對變量x,y有觀測數據(xi,yi)(i=1,2,…,10),得散點圖①,對變量u,v有觀測數據(ui,vi)(i=1,2,…,10),得散點圖②.由這兩個散點圖可以判斷 ()A.變量x與y正相關,u與v正相關B.變量x與y正相關,u與v負相關C.變量x與y負相關,u與v正相關D.變量x與y負相關,u與v負相關(2)兩個變量x,y與其線性相關系數r有下列說法:①若r>0,則x增大時,y也隨之相應增大;②若r<0,則x增大時,y也相應增大;③若r=1或r=-1,則x與y的關系完全對應(有函數關系),在散點圖上各個散點均在一條直線上,其中正確的有 ()A.①② B.②③C.①③ D.①②③【思維導引】(1)根據散點圖中點的分布判斷.(2)根據相關系數的性質逐一判斷.【解析】(1)選C.由這兩個散點圖可以判斷,變量x與y負相關,u與v正相關.(2)選C.根據兩個變量的相關性與其相關系數r之間的關系知,①③正確,②錯誤.【類題通法】線性相關系數的理解線性相關系數是從數值上來判斷變量間的線性相關程度,是定量的方法.與散點圖相比較,線性相關系數要精細得多,需要注意的是線性相關系數r的絕對值小,只是說明線性相關程度低,但不一定不相關,可能是非線性相關.【定向訓練】下列兩變量中具有相關關系的是 ()A.正方形的面積與邊長B.人的身高與體重C.勻速行駛的汽車的行駛距離與時間D.球的半徑與體積【解析】選B.選項A中正方形的面積為邊長的平方,有固定的函數關系;選項C中勻速行駛的汽車的行駛距離與時間成正比,也是函數關系;選項D中球的體積是π與半徑的立方相乘,有固定的函數關系.只有選項B中人的身高與體重具有相關關系.【跟蹤訓練】在下列各圖中,相關關系最強的是 ()【解析】選A.對于A,圖中各點成條狀分布,這組變量具有較強的線性相關關系;對于B,C,D所示的散點圖中,樣本點成片狀分布,兩個變量的線性相關關系相對較弱,或不具有相關關系.探究點二求回歸直線方程【典例2】一臺還可以用的機器由于使用的時間較長,它按不同的轉速生產出來的某機械零件有一些會有缺陷,每小時生產有缺陷零件的多少隨機器運轉的速度而變化,下表為抽樣試驗結果:轉速x(轉/秒)1614128每小時生產有缺陷的零件數y(件)11985(1)畫出散點圖;(2)如果y與x有線性相關的關系,求回歸直線方程.【思維導引】(1)由表中數據作圖.(2)根據回歸直線方程公式求,即可寫出方程.【解析】(1)畫出散點圖,如圖所示:,,=438,=660,所以==8.25-0.7286×12.5=-0.8575.故回歸直線方程為=0.7286x-0.8575.【延伸探究】本題條件不變,求:若實際生產中,允許每小時生產的產品中有缺陷的零件最多為10個,那么機器的運轉速度應控制在什么范圍內?【解析】要使y≤10,則0.7286x-0.8575≤10,x≤14.9019.故機器的轉速應控制在轉/秒以下.【類題通法】求回歸直線方程的步驟(1)畫散點圖:由樣本點是否呈條狀分布來判斷兩個量是否具有線性相關關系.(2)求回歸系數:若存在線性相關關系,則求回歸系數.(3)寫方程:寫出回歸直線方程,并利用回歸直線方程進行預測.【定向訓練】某市環保部門為了讓全市居民認識到冬天燒煤取暖對空氣AQI數值的影響,進而喚醒全市人民的環保節能意識,對該市取暖燒煤天數x與空氣AQI數值不合格的天數y進行統計分析,得出表中數據:x(天)98754y(天)76532(1)以統計數據為依據,求出y關于x的回歸直線方程=x+;(2)根據(1)求出的回歸直線方程,預測該市燒煤取暖的天數為20時空氣AQI數值不合格的天數.參考公式:【解析】(1)由表中數據可求得=4×2+5×3+7×5+8×6+9×7=169,=42+52+72+82+92=235,=4.6-6.6=-2,所以回歸直線方程為=x-2.(2)根據(1)求出的回歸直線方程,當x=20時,代入可得=20-2=18,預測該市燒煤取暖的天數為20時空氣AQI數值不合格的天數為18.【跟蹤訓練】某研究機構對高三學生的記憶力x和判斷力y進行統計分析,得到下表數據:x681012y2356(1)請畫出上表數據的散點圖(要求:點要描粗);(2)請根據上表提供的數據,用最小二乘法求出y關于x的回歸直線方程=x+;(3)試根據求出的回歸直線方程,預測記憶力為9的同學的判斷力.【解析】(1)如圖:(2)=6×2+8×3+10×5+12×6=158,
=62+82+102+122=344,
,故回歸直線方程為=0.7x-2.3.(3)由(2)中回歸直線方程知當x=9時,=0.7×9-2.3=4,預測記憶力為9的同學的判斷力為4.探究點三非線性回歸模型【典例3】某公司為了確定下一年度投入某種產品的宣傳費用,需了解年宣傳費x(單位:萬元)對年銷量y(單位:噸)和年利潤(單位:萬元)的影響.對近6年宣傳費xi和年銷量yi(i=1,2,3,4,5,6)的數據做了初步統計,得到如下數據:年份201320142015201620172018年宣傳費x(萬元)384858687888年銷售量y(噸)16.818.820.722.424.025.5經電腦模擬,發現年宣傳費x(萬元)與年銷售量y(噸)之間近似滿足關系式y=a·xb(a>0,b>0)即lny=blnx+lna,對上述數據作了初步處理,得到相關的值如下表:(1)從表中所給出的6年年銷售量數據中任選2年做年銷售量的調研,求所選數據中至多有一年年銷售量低于20噸的概率.(2)根據所給數據,求y關于x的回歸方程.(3)若生產該產品的固定成本為200萬元,且每生產1噸產品的生產成本為20萬元(總成本=固定成本+生產成本+年宣傳費),銷售收入為+500(萬元),假定該產品產銷平衡(即生產的產品都能賣掉),2019年該公司計劃投入108萬元宣傳費,你認為該決策合理嗎?請說明理由.(其中e為自然對數的底數,e=2.71828…)附:對于一組數其回歸直線=·u+中的斜率和截距的最小二乘估計分別為【思維導引】(1)利用組合知識,根據古典概型概率公式可得結果;(2)對y=axb兩邊取對數得lny=lna+blnx,令ui=lnxi,vi=lnyi得v=lna+bu,根據所給的數據,求出變量u,v的平均數,求出最小二乘法所需要的數據,可得回歸直線方程的系數b,再根據樣本中心點一定在回歸直線方程上,求出a的值,寫出回歸方程;(3)設該公司的年利潤為,由利潤=銷售收入-總成本,求得的解析式,由二次函數的性質求得x=100時,取最大值,從而可得結果.【解析】(1)記事件A表示“至多有一年年銷售量低于20噸”,由表中數據可知6年中有2年的年銷售量低于20噸,故(2)對y=axb(a>0,b>0)兩邊取對數得lny=lna+blnx,令ui=lnxi,vi=lnyi得v=lna+bu,由題中數據得:
得=e,故所求回歸方程為=e.
(3)設該公司的年利潤為f(x),因為利潤=銷售收入-總成本,所以由題意可知當=10即x=100時,利潤f(x)取得最大值500萬元,故2019年該公司計劃投入108萬元宣傳費的決策不合理.【類題通法】非線性回歸的模型(1)當兩個變量已明顯呈線性相關關系時,則無需作散點圖,就可直接求回歸直線方程,否則要先判定相關性再求回歸方程.(2)非線性回歸方程的求法.①根據原始數據(x,y)畫出散點圖;②根據散點圖,選擇恰當的擬合函數;③作恰當變換,將其轉化成線性函數,④求線性回歸方程;⑤在④的基礎上通過相應的變換,即可得非線性回歸方程.【定向訓練】某企業生產一種產品,從流水線上隨機抽取100件產品,統計其質量指標值并繪制頻率分布直方圖(如圖1):規定產品的質量指標值在[65,85)的為劣質品,在[85,105)的為優等品,在[105,115]的為特優品,銷售時劣質品每件虧損元,優等品每件盈利4元,特優品每件盈利6元,以這100件產品的質量指標值位于各區間的頻率代替產品的質量指標值位于該區間的概率.(1)求每件產品的平均銷售利潤;(2)該企業主管部門為了解企業年營銷費用x(單位:萬元)對年銷售量y(單位:萬件)的影響,對該企業近5年的年營銷費用xi和年銷售量yi(i=1,2,3,4,5)數據做了初步處理,得到的散點圖(如圖2)及一些統計量的值.表中ui=lnxi,vi=lnyi,根據散點圖判斷,y=axb可以作為年銷售量y(萬件)關于年營銷費用x(萬元)的回歸方程.①求y關于x的回歸方程;②用所求的回歸方程估計該企業每年投入216萬元的營銷費時,年收益的預報值.(收益=銷售利潤-營銷費用,取e≈36)附:對于一組數據(u1,v1),(u2,v2),…,(un,vn),其回歸直線=+u的斜率和截距的最小二乘估計分別為=【解析】(1)設每件產品的銷售利潤為X,則X的可能取值為,4,6.由頻率分布直方圖可得產品為劣質品、優等品、特優品的概率分別為,,0.1.所以;;P(X=6)=0.1.所以X的分布列為X-0.846P0.250.650.1所以E(X)=(-0.8)×0.25+4×0.65+6×0.1=3(元).即每件產品的平均銷售利潤為3元.(2)①由y=a·xb得lny=ln(a·xb)=lna+blnx,令u=lnx,v=lny,c=lna,則v=c+bu,由所給數據可得
則,所以=3.59+u,即ln=3.59+lnx=ln因為取e≈36,所以故所求的回歸方程為②設年收益為z萬元,則當x=216時,z=432.即該企業每年投入216萬元營銷費,年收益的預報值為432萬元.【跟蹤訓練】在一次抽樣調查中測得樣本的5個樣本點,數據如表:試建立y與x之間的回歸方程.x0.250.5124y1612521【解析】作出變量y與x之間的散點圖如圖所示.由圖可知變量y與x近似地呈反比例函數關系.設y=,令t=,由y與x的數據表可得y與t的數據表:t4210.50.25y1612521作出y與t的散點圖如圖所示.由圖可知y與t呈近似的線性相關關系.設回歸直線方程為=t+,又,,,=21.3125,
,所以=4.1344t+0.8.所以y與x的回歸方程是=+0.8.【課堂小結】課堂素養達標1.若變量x,y之間是線性相關關系,則由數據表得到的回歸直線必過定點()
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 25年公司三級安全培訓考試試題及完整答案(全優)
- 25年公司安全管理人員安全培訓考試試題及參考答案【黃金題型】
- 25年公司項目部管理人員安全培訓考試試題匯編
- 2025年中國SB菊花數據監測報告
- 2025年中國OA智能化全鋼活動地板市場調查研究報告
- 健康教育的新路徑金鑰匙引領大數據應用
- 企業辦公中的高效精準服務模式探索
- 2025年金屬制日用雜品項目合作計劃書
- 幼兒園玩具購銷合同
- 個人合伙協議書十
- 《商業銀行個人理財業務發展研究國外文獻綜述》2500字
- 2023年赤峰龍韻城市建設有限公司招聘筆試題庫及答案解析
- 專利申請培訓課件
- DPtechIPS2000系列入侵防御系統培訓膠片課件
- “四不傷害”安全生產專題培訓課件
- 阿特拉斯空壓機保養課件
- (房屋建筑部分)工程建設標準強制性條文2023年版
- 幼兒園中班語言《小兔子開鋪子》課件
- 公司面談表模板
- 蘇教版科學一年級下冊第10課形形色色的動物課件25張
- 超聲診斷學:局灶性肝病(肝臟占位性病變)
評論
0/150
提交評論