




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
PAGE1第02講成對數據的統計分析【必備知識】1、變量的相關關系(1)相關關系:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.(2)相關關系的分類:正相關和負相關.(3)線性相關:一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,稱這兩個變量線性相關.2、樣本相關系數(1)樣本相關系數(2)當,成對樣本數據正相關;當時,成對樣本數據負相關.(3)當越接近1時,成對樣本數據的線性相關程度越強;當越接近0時,成對樣本數據的線性相關程度越弱.3、一元線性回歸模型(1)經驗回歸方程為,其中.(2)殘差分析①觀測值:通過觀測得到的數據.②預測值:通過經驗回歸方程得到的.③殘差:觀測值減去預測值的差.④殘差分析:通過對殘差的分析可以判斷模型刻畫數據的效果,以及判斷原始數據中是否存在可疑數據等.這方面的工作稱為殘差分析.XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d4.獨立性檢驗(1)假定通過簡單隨機抽樣得到了X和Y的抽樣數據列聯表,如表所示.則.(2)獨立性檢驗當時,推斷不成立,即認為和不獨立,該推斷犯錯誤的概率不超過α;當時,沒有充分證據推斷不成立,可以認為和獨立.利用χ2的取值推斷分類變量和是否獨立的方法稱為獨立性檢驗,簡稱獨立性檢驗.考點04相關關系的判斷【常見方法】判斷相關關系的方法:(1)回歸方程法:利用回歸方程中的系數的正負判斷.(2)散點圖法:如果所有的樣本點都落在某一曲線附近,那么變量之間就有相關關系;如果所有的樣本點都落在某一直線附近,那么變量之間就有線性相關關系.(3)相關系數法:利用相關系數判斷,|r|越趨近于1,相關性越強.【典例分析04】1、為了對變量x與y的線性相關進行檢驗,由樣本點(x1,y1)、(x2,y2)、…、(x10,y10)求得兩個變量的樣本相關系數為r,那么下面說法中正確的是()A.若所有樣本點都在直線y=-2x+1上,則r=1B.若所有樣本點都在直線y=-2x+1上,則r=-2C.若越大,則變量x與y的線性相關性越強D.若越小,則變量x與y的線性相關性越強2、下列命題中正確的為()A.線性相關系數r越大,兩個變量的線性相關性越強B.線性相關系數r越小,兩個變量的線性相關性越弱C.殘差平方和越小的模型,模型擬合的效果越好D.用相關指數R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好3、某校一個課外學習小組為研究某作物種子的發芽率y和溫度x(單位:℃)的關系,在20個不同的溫度條件下進行種子發芽實驗,由實驗數據(xi,yi)(i=1,2,…,20)得到下面的散點圖:由此散點圖,在10℃至40℃之間,下面四個回歸方程類型中最適宜作為發芽率y和溫度x的回歸方程類型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx考點05線性回歸方程角度01線性回歸方程及其應用【常見方法】求線性回歸方程的基本步驟(1)先把數據制成表,從表中計算出x、y,xeq\o\al(\s\up1(2),\s\do1(1))+xeq\o\al(\s\up1(2),\s\do1(2))+…+xeq\o\al(\s\up1(2),\s\do1(n))、x1y1+x2y2+…+xnyn的值;(2)計算回歸系數;(3)寫出線性回歸方程.注意:回歸方程一定過點(x,y).【典例分析05】1、某食品廠2020年2月至6月的某款飲料生產產量(單位:萬件)的數據如下表:月份x23456生產產量y/萬件356.5810.5(1)根據以上數據,求y關于x的線性回歸方程;(2)調查顯示該年7月份的實際市場需求量為13.5萬件,求該年7月份所得回歸方程預測的生產產量與實際市場需求量的誤差.參考公式:,.角度02相關系數及其應用【常見方法】1.模型擬合效果的判斷(1)殘差平方和越小,模型的擬合效果越好;(2)決定系數R2越大,模型的擬合效果越好;(3)回歸方程的擬合效果,可以利用相關系數判斷.當|r|越趨近于1時,兩變量的線性相關程度越強.2.確定殘差系數.其中是殘差平方和,其值越小,則越大(接近1),模型的擬合效果越好.2、某沙漠地區經過治理,生態系統得到很大改善,野生動物數量有所增加.為調查該地區某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區,調查得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.(1)求該地區這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區這種野生動物數量的平均數乘以地塊數);(2)求樣本(xi,yi)(i=1,2,…,20)的相關系數(精確到0.01);(3)根據現有統計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區這種野生動物數量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:相關系數,eq\r(2)≈1.414.角度03非線性回歸分析【常見方法】非線性回歸方程的求法(1)根據原始數據(x,y)作出散點圖.(2)根據散點圖選擇恰當的擬合函數.(3)作恰當的變換,將其轉化成線性函數,求線性回歸方程.(4)在(3)的基礎上通過相應變換,即可得到非線性回歸方程.3、某公司為確定下一年度投入某種產品的宣傳費,需了解年宣傳費(單位:千元)對年銷售量(單位:)和年利潤(單位:千元)的影響,對近8年的年宣傳費和年銷售量i(i=1,2,…,8)數據作了初步處理,得到如圖所示的散點圖及一些統計量的值.46.65636.8289.81.61.469108.8表中,.(1)根據散點圖判斷,與哪一個適宜作為年銷售量y關于年宣傳費x的回歸方程類型(給出判斷即可,不必說明理由)?(2)根據(1)的判斷結果及表中數據,建立y關于x的回歸方程.考點06獨立性檢驗【常見方法】獨立性檢驗的一般步驟(1)根據樣本數據制成2×2列聯表;(2)根據公式計算.(3)如果,則“X與Y有關系”這種推斷犯錯誤的概率不超過a;否則,就認為在犯錯誤的概率不超過α的前提下不能推斷“X與Y有關系”,或者在樣本數據中沒有發現足夠的證據支持結論“X與Y有關系”.【典例分析06】1、甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國膠水金屬鋁管灌裝封尾機市場調查研究報告
- 2025年中國耐油耐高溫硅橡膠電纜數據監測報告
- 2025年中國硫化紅棕市場調查研究報告
- 2025年中國相簿淋膜機市場調查研究報告
- 2025年中國男士西褲數據監測研究報告
- 2025年中國電池紙套市場現狀分析及前景預測報告
- 2025年中國電動噴霧機市場調查研究報告
- 2025年中國玻璃紡絲盤數據監測研究報告
- 2025年中國特種塑料管道項目投資可行性研究報告
- 2025年中國熱軋卷帶項目投資可行性研究報告
- 第十七章-東歐封建社會的發展-(《世界古代史下冊》課件)
- 中國鋁業遵義氧化鋁有限公司氧化鋁工程分解分級槽基礎工程 施工組織設計
- 高級會計師評審個人業績報告(精選9篇)
- 一級病原微生物實驗室危害評估報告
- 茶葉加工機械與設備(全套524張課件)
- 五年級下冊數學課件-4.分數連加、連減和加減混合運算及應用練習 蘇教版 (共11張PPT)
- 設備機房出入登記表
- 電腦節能環保證書
- 工程質保金付款申請表格
- 建房界址四鄰無爭議確認表
- 肝膽外科住院醫師規范化培訓理論考試(題庫)
評論
0/150
提交評論