




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
(會作兩個相關變量的數據的散點圖,會利用散點圖認識變量的相關關系/了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程/了解獨立檢驗(只要求2×2列聯表)的基本思想、方法簡單應用/了解假設檢驗的基本思想、方法簡單應用/了解聚類分析的基本思想、方法簡單應用)9.3
變量間的相關關系、回歸分析及獨立性檢驗1.相關關系的量:當自變量一定時,因變量的取值帶有一定的隨機性的兩個變量之間的關系稱為相關關系.2.回歸分析:對具有相關關系的兩個變量進行統計分析的方法叫做回歸分析.3.散點圖:表示具有相關關系的兩個變量的一組數據的圖形叫做散點圖.4.正相關與負相關概念:如果散點圖中的點散布在從左下角到右上角的區域內,稱為正相關.如果散點圖中的點散布在從左上角到右下角的區域內,稱為負相關.5.
回歸直線:設所求的直線方程為,其中求回歸直線,使得樣本數據的點到它的距離的平方和最小的方法叫做最小二乘法.6.相關系數:r=叫做變量y與x之間的樣本相關系數,簡稱相關系數,用 它來衡量兩個變量之間的線性相關程度.7.相關系數的性質:|r|≤1,且|r|越接近1,相關程度越大;且|r|越接近0,相關程度越小.8.獨立性檢驗:一般地,假設有兩個分類變量X和Y,它們的可能取值分別為
{x1,x2}和{y1,y2},其樣本頻數列聯表(稱為2×2列聯表)為:2×2列聯表
若要推斷的論述為H1:X與Y有關系,可以按如下步驟判斷結論H1成立的可能性:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d(1)通過三維柱形圖和二維條形圖,可以粗略地判斷兩個分類變量是否有關系,但是這種判斷無法精確地給出所得結論的可靠程度.①在三維柱形圖中,主對角線上兩個柱形高度的乘積ad與副對角線上的兩個柱形高度的乘積bc相差越大,H1成立的可能性就越大.②在二維條形圖中,可以估計滿足條件X=x1的個體中具有Y=y1的個體所占的比例,也可以估計滿足條件X=x2的個體中具有Y=y2的個體所占的比例.“兩個比例的值相差越大,H1成立的可能性就越大.”(2)可以利用獨立性檢驗來考察兩個分類變量是否有關系,并且能較精確地給出這種判斷的可靠程度.具體做法是:①根據實際問題需要的可信程度確定臨界值k0;②利用公式K2=,由觀測數據計算得到隨機變量K2的觀測值k;③如果k>k0,就以(1-P(K2≥k0))×100%的把握認為“X與Y有關系”;否則就說樣本觀測數據沒有提供“X與Y有關系”的充分證據.1.在對兩個變量x,y進行線性回歸分析時有下列步驟: ①對所求出的回歸方程作出解釋;②收集數據(xi,yi),i=1,2,…,n;③求線性回歸方程;④求相關系數;⑤根據所搜集的數據繪制散點圖. 如果根據可靠性要求能夠作出變量x,y具有線性相關結論,則在下列操作順序中正確的是() A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③① 答案:D2.對兩個變量y和x進行回歸分析,得到一組樣本數據:(x1,y1),(x2,y2),…,(xn,yn),則下列說法中不正確的是() A.由樣本數據得到的回歸方程=bx+a必過樣本中心() B.殘差平方和越小的模型,擬合的效果越好 C.用相關指數R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好 D.若變量y和x之間的相關系數為r=-0.9362,則變量y和x之間具有線性相 關關系 答案:C3.(2009·寧夏、海南)對變量x,y有觀測數據(xi,yi)(i=1,2,…,10),得散點圖(1);對變量u、v有觀測數據(ui,vi)(i=1,2,…,10),得散點圖(2).由這兩個散點圖可以判斷()A.變量x與y正相關,u與v正相關B.變量x與y正相關,u與v負相關C.變量x與y負相關,u與v正相關D.變量x與y負相關,u與v負相關解析:由圖(1)可知,各點整體呈遞減趨勢,x與y負相關,由圖(2)可知,各點整體呈遞增趨勢,u與v正相關.答案:C4.下面是一個2×2列聯表
則表中a、b處的值分別為() A.94,96B.52,50C.52,54D.54,52 答案:C
y1y2總計x1a2173x222527總計b46判斷兩個變量正相關還是負相關,有三種方法:1.利用散點圖;2.利用相關系數r的符號;當r>0時,正相關;r<0時,負相關;3.在已知兩變量線性相關時,也可以利用回歸方程=a+bx.當b>0時,=a+bx是增函數,兩變量是正相關,當b<0時,=a+bx是減函數, 兩變量是負相關.【例1】山東魯潔棉業公司的科研人員在7塊并排、形狀大小相同的試驗田上對某棉花新品種進行施化肥量x對產量y影響的試驗,得到如下表所示的一組數據(單位:kg). (1)畫出散點圖; (2)判斷是否具有相關關系.施化肥量x15202530354045棉花產量y330345365405445450455思維點撥:用施化肥量x作為橫軸,產量y為縱軸可作出散點圖,由散點圖即可分析是否具有線性相關關系.解答:(1)散點圖如右圖所示, (2)由散點圖知,各組數據對應點大致都在一條直線附近,所以施化肥量x與產量y具有線性相關關系.對具有相關關系的兩個變量進行統計分析時,首先要作出散點圖,然后進行相關性檢驗,在確認具有線性相關關系后,再求其回歸直線.
【例2】一臺機器使用時間較長,但還可以使用.它按不同的轉速生產出來的某機械零件有一些會有缺點,每小時生產有缺點零件的多少,隨機器運轉的速度而變化,下表為抽樣試驗結果:轉速x(轉/秒)1614128每小時生產有缺點的零件數y(件)11985(1)對變量y與x進行相關性檢驗;(2)如果y與x有線性相關關系,求回歸直線方程;(3)若實際生產中,允許每小時的產品中有缺點的零件最多為10個,那么,機器的運轉速度應控制在什么范圍內?思維點撥:利用相關系數r進行線性相關檢驗(也可利用散點圖).如果線性相關,再求回歸直線方程并加以判斷.(2)=0.7286x-0.8571.(3)要使≤10?0.7286x-0.8571≤10,所以x≤14.9013.所以機器的轉速應控制在14.9013轉/秒以下.解答:變式2.假設關于某設備的使用年限x和所支出的維修費用y(萬元),有如下的統計資料:
(1)y與x間是否有線性相關關系?若有,求出線性回歸方程; (2)估計使用年限為10年時的維修費用.使用年限(x)/年23456維修費用(y)/萬元2.23.85.56.57.0所謂獨立性檢驗,就是根據采集樣本的數據,先利用三維柱形圖和二維條形圖粗略判斷兩個分類變量是否有關系,再利用公式計算K2的值,比較它與臨界值的大小關系,來判斷事件X與Y是否有關的問題.【例3】(2009·遼寧)某企業有兩個分廠生產某種零件,按規定內徑尺寸(單位:mm)的值落在[29.94,30.06)的零件為優質品.從兩個分廠生產的零件中各抽出了500件,量其內徑尺寸,得結果如下表: 甲廠:分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)頻數12638618292614乙廠:(1)試分別估計兩個分廠生產的零件的優質品率;(2)由以上統計數據填下面2×2列聯表,并問是否有99%的把握認為“兩個分廠生產的零件的質量有差異”.分組[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)頻數297185159766218甲廠乙廠合計優質品非優質品合計解答:(1)甲廠抽查的產品中有360件優質品,從而甲廠生產的零件的優質品率估計為=72%;乙廠抽查的產品中有320件優質品,從而乙廠生產的零件的優質品率估計為=64%. 所以有99%的把握認為“兩個分廠生產的零件的質量有差異”
甲廠乙廠合計優質品360320680非優質品140180320合計5005001000(2)變式3.在對人們休閑方式的一次調查中,共調查了124人,其中女性70人,男性54人.女性中有43人主要的休閑方式是看電視,另外27人的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動. (1)根據以上數據建立一個2×2列聯表; (2)畫出二維條形圖; (3)檢驗休閑方式是否與性別有關,可靠性有多大.解答:(1)2×2列聯表如圖:休閑方式性別看電視運動合計女432770男213354合計6460124(2)二維條形圖如圖:(3)假設休閑方式與性別無關,則K2=≈6.201>5.024,所以有理由認為休閑方式與性別無關是不合理的,即我們有97.5%的把握認為休閑方式與性別有關.【方法規律】1.求回歸方程,關鍵在于正確求出系數a,b,由于a,b的計算量大,計算時應仔細謹慎,分層進行,避免因計算而產生錯誤.(注意回歸直線方程中一次項系數為b,常數項為a,這與一次函數的習慣表示不同).2.回歸分析是處理變量相關關系的一種數學方法.主要解決:①確定特定量之間是否有相關關系,如果有就找出它們之間貼近的數學表達式;②根據一組觀察值,預測變量的取值及判斷變量取值的變化趨勢;③求出回歸直線方程.3.獨立性檢驗是一種假設檢驗,在對總體的估計中,通過抽取樣本,構造合適的隨機變量,對假設的正確性進行判斷.
為了分析某個高三學生的學習狀態,對其下一階段的學習提供指導性建議.現對他前7次考試的數學成績x、物理成績y進行分析.下面是該生7次考試的成績.數學888311792108100112物理949110896104101106(1)他的數學成績與物理成績哪個更穩定?請給出你的證明;(2)已知該生的物理成績y與數學成績x是線性相關的,若該生的物理成績達到115分,請你估計他的數學成績大約是多少?并請你根據物理成績與數學成績的相關性,給出該生在學習數學、物理上的合理建議.【答題模板】(2)由于x與y之間具有線性相關關系,根據回歸系數公式得到b==0.5,a=100-0.5×100=50,∴線性回歸方程為=0.5x+50.當y=115時,x=130.建議:進一步加強對數學的學習,提高數學成績的穩定性,將有助于物理成績的進一步提高.
【分析點評】1.成績的穩定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年牡丹江穆棱市鄉村醫生招聘筆試真題
- 2024年福建福州榕發物業發展有限公司招聘真題
- 2025年計算機二級VB重要試題及答案
- 2024年貴州警察學院人才引進筆試真題
- 未來科技對企業業務戰略的影響試題及答案
- 軟件質量保證中的合理評估與控制策略試題及答案
- 2025年網絡技術實踐試題與答案
- 戰略思路的多元化探討試題及答案
- VB考試中常見問題試題及答案
- 軟考網絡管理員考試的學習路徑設計試題及答案
- 2024年江西省高考政治試卷真題(含答案)
- 服裝店員工考勤管理制度
- 國人毛孔粗大表征研究及護理指南 2024
- 質量信得過班組培訓課件
- 水利工程施工監理規范SL288-2014(CB、JL用表全套)
- 鐵路信號技師技術總結
- 洗瓶機推瓶機構設計計算說明書+運動簡圖+運動循環圖
- DL∕T 707-2014 HS系列環錘式破碎機
- 費用組成-特殊施工增加費課件講解
- 2024年湖南省長沙市雅禮實驗中學中考二模考試英語試題
- 國民經濟行業分類代碼表
評論
0/150
提交評論