《統計學-基于R》(第4版)課件:假設檢驗_第1頁
《統計學-基于R》(第4版)課件:假設檢驗_第2頁
《統計學-基于R》(第4版)課件:假設檢驗_第3頁
《統計學-基于R》(第4版)課件:假設檢驗_第4頁
《統計學-基于R》(第4版)課件:假設檢驗_第5頁
已閱讀5頁,還剩26頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

賈俊平2024/1/30StatisticswithR統計學R語言

賈俊平2024/1/306.1假設檢驗的原理6.2總體均值的檢驗6.3總體比例的檢驗6.4總體方差的檢驗6.5非參數檢驗

假設檢驗思維導圖

6.1

假設檢驗的原理假設與假設檢驗假設—在參數檢驗中,是對總體參數的具體數值所作的陳述就一個總體而言,總體參數包括總體均值、比例、方差等分析之前必需陳述假設檢驗—先對總體的參數(或分布形式)提出某種假設,然后利用樣本信息判斷假設是否成立的統計方法有參數檢驗和非參數檢驗邏輯上運用反證法,統計上依據小概率原理小概率是在一次試驗中,一個幾乎不可能發生的事件發生的概率在一次試驗中小概率事件一旦發生,我們就有理由拒絕原假設

6.1

假設檢驗的原理原假設與備擇假設

6.1

假設檢驗的原理雙側檢驗與單側檢驗雙側檢驗—備擇假設沒有特定的方向性,并含有符號“

”的假設檢驗,稱為雙側檢驗或雙尾檢驗(two-tailedtest)單側檢驗—備擇假設具有特定的方向性,并含有符號“>”或“<”的假設檢驗,稱為單側檢驗或單尾檢驗(one-tailedtest)備擇假設的方向為“<”,稱為左側檢驗

備擇假設的方向為“>”,稱為右側檢驗

假設雙側檢驗單側檢驗左側檢驗右側檢驗原假設H0:m

=m0H0:m

m0H0:m

m0備擇假設H1:m

≠m0H1:m

<m0H1:m

>m0

6.1

假設檢驗的原理雙側檢驗與單側檢驗——提出假設的一個例子【例6-2】農夫山泉飲用水瓶子上的標簽鈣≥400鎂≥50鉀≥35鈉≥80偏硅酸≥180PH值(250C)7.3

0.5

6.1

假設檢驗的原理兩類錯誤與顯著性水平

6.1

假設檢驗的原理做出決策——用統計量決策

6.1

假設檢驗的原理做出決策——用P值決策

P

6.1

假設檢驗的原理做出決策——用P值決策P值原假設的對或錯的概率無關它反映的是在某個總體的許多樣本中某一類數據出現的經常程度,它是當原假設正確時,得到目前這個樣本數據的概率值越小,你拒絕原假設的理由就越充分有了P值,我們并不需要用5%或1%這類傳統的顯著性水平。P值提供了更多的信息,它讓我們可以選擇任意水平來評估結果是否具有統計上的顯著性,從而可根據我們的需要來決定是否要拒絕原假設傳統的顯著性水平,如1%、5%、10%等等,已經被人們普遍接受為“拒絕原假設足夠證據”的標準,我們大概可以說:10%代表有“一些證據”不利于原假設;5%代表有“適度證據”不利于原假設;1%代表有“很強證據”不利于原假設用P值進行檢驗比根據統計量檢驗提供更多的信息統計量檢驗是我們事先給出的一個顯著性水平,以此為標準進行決策,無法知道實際的顯著性水平究竟是多少

6.1

假設檢驗的原理結果表述——不拒絕而不是“接受”假設檢驗的目的主要是收集證據拒絕原假設,而支持你所傾向的備擇假設假設檢驗只提供不利于原假設的證據。因此,當拒絕原假設時,表明樣本提供的證據證明它是錯誤的,當沒有拒絕原假設時,我們也沒法證明它是正確的,因為假設檢驗的程序沒有提供它正確的證據當不拒絕原假設時,我們也從來不說“接受原假設”,因為沒有證明原假設是真的沒有足夠的證據拒絕原假設并不等于你已經“證明”了原假設是真的,它僅僅意為著目前還沒有足夠的證據拒絕原假設,只表示手頭上這個樣本提供的證據還不足以拒絕原假設“不拒絕”的表述方式實際上意味著沒有得出明確的結論

6.1

假設檢驗的原理結果表述——“顯著”或“不顯著”拒絕原假設時,我樣本結果是統計上顯著的(statisticallySignificant);不拒絕原假設時,我們稱樣本結果是統計上不顯著的在“顯著”和“不顯著”之間沒有清除的界限,只是在P值越來越小時,我們就有越來越強的證據,檢驗的結果也就越來越顯著但P值很小而拒絕原假設時,并不一定意味著檢驗的結果就有實際意義因為假設檢驗中所說的“顯著”僅僅是“統計意義上的顯著”一個在統計上顯著的結論在實際中卻不見得就很重要,也不意味著就有實際意義因為值與樣本的大小密切相關,樣本量越大,檢驗統計量的P值也就越大,P值就越小,就越有可能拒絕原假設

6.1

假設檢驗的原理效應量分析——找出差異程度假設檢驗拒絕原假設后,表示參數與假設值之間差異顯著,但這一結果并未有告訴我們差異的大?。ǔ潭龋6攘窟@種差異的統計量就是效應量,它描述了結果的差異程度是小、中還是大效應量的提出者是JacobCohen(1988),他提供了不同檢驗效應量小、中、大的度量標準

6.2

總體均值的檢驗一個總體均值的檢驗——大樣本——例題分析例題分析【例6-3】檢驗空氣中PM2.5的含量(

=0.05)load("C:/example/ch6/example6_3.RData")library(BSDA)z.test(example6_3$PM2.5值,mu=81,sigma.x=sd(example6_3$PM2.5值),alternative="less",conf.level=0.95)

總體方差已知總體方差未知82.674.779.987.573.879.887.068.368.578.086.276.975.789.980.285.185.189.277.757.565.380.274.768.897.675.080.176.685.176.181.672.593.577.880.784.577.383.382.285.5

6.2

總體均值的檢驗一個總體均值的檢驗——小樣本——效應量

總體方差已知總體方差未知

一個總體均值的檢驗——小樣本——例題分析例題分析【例6-4】檢驗磚的厚度xample6_4<-read.csv("C:/example/ch6/example6_4.csv")t.test(example6_5$厚度,mu=55)#計算效應量example6_4<-read.csv("C:/example/ch6/example6_4.csv")library(lsr)cohensD(example6_4$厚度,mu=5)

6.2

總體均值的檢驗兩個總體均值差的檢驗——獨立大樣本——例題分析

6.2

總體均值的檢驗

總體方差已知總體方差未知

例題分析【例6-5】檢驗男女學生上網的平均時間

load("C:/example/ch6/example6_5.RData")library(BSDA)z.test(example6_5$男生上網時間,example6_5$女生上網時間,sigma.x=sd(example6_5$男生上網時間),sigma.y=sd(example6_5$女生上網時間),alternative="two.sided")值),alternative="less",conf.level=0.95)兩個總體均值差的檢驗——獨立小樣本——例題分析

6.2

總體均值的檢驗假定條件兩個獨立的小樣本;兩個總體都是正態分布兩個總體方差已知,或方差未知但相等,或方差未知且不相等檢驗統計量

總體方差已知總體方差未知但相等

總體方差未且不相等

兩個總體均值差的檢驗——獨立小樣本——效應量

6.2

總體均值的檢驗

兩個總體均值的檢驗——獨立小樣本——例題分析

example6_6<-read.csv("C:/example/ch6/example6_6.csv")t.test(example6_6$甲企業,example6_6$乙企業,var.equal=TRUE)t.test(example6_6$甲企業,example6_6$乙企業,var.equal=FALSE)#計算效應量library(lsr)cohensD(example6_6$甲企業,example6_6$乙企業)

6.2

總體均值的檢驗兩個總體均值差的檢驗——配對樣本——例題分析

6.2

總體均值的檢驗假定條件兩個總體配對差值構成的總體服從正態分布配對差是由差值總體中隨機抽取的數據配對或匹配(重復測量(前/后))檢驗統計量效應量

例題分析【例6-7】檢驗消費者對兩款飲料的評分example6_7<-read.csv("C:/example/ch6/example6_7.csv")t.test(example6_7$舊款飲料,example6_7$新款飲料,paired=TRUE)#計算效應量library(lsr)cohensD(example6_7$舊款飲料,example6_7$新款飲料,method="paired")一個總體比例的檢驗——例題分析

6.3

總體比例的檢驗假定條件總體服從二項分布可用正態分布來近似(大樣本)檢驗的z統計量例題分析【例6-8】檢驗收視率是否達到制作人的預期n<-2000p<-450/2000pi0<-0.25z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)p_value<-1-pnorm(z)data.frame(z,p_value)

兩個總體比例差的檢驗——例題分析

6.3

總體比例的檢驗

例題分析【例6-9】檢驗上網收費

n1<-200;n2<-200p1<-0.27;p2<-0.35p<-(p1*n1+p2*n2)/(n1+n2)z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))

p_value<-pnorm(z)data.frame(z,p_value)

例題分析【例6-10】檢驗兩種生產方法n1<-300;n2<-300p1<-33/300;p2<-84/300d0<-0.08z<-((p1-p2)-0.08)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)p_value<-pnorm(z)data.frame(z,p_value)一個總體方差的檢驗——例題分析

6.4

總體方差的檢驗檢驗一個總體的方差或標準差假設總體近似服從正態分布使用卡方分布檢驗統計量例題分析【例6-11】檢驗填裝量的方差example6_11<-read.csv("C:/example/ch6/example6_11.csv")library(TeachingDemos)sigma.test(example6_11$填裝量,sigmasq=16,alternative="greater")

兩個總體方差比的檢驗——例題分析

6.4

總體方差的檢驗假定條件兩個總體都服從正態分布,且方差相等兩個獨立的隨機樣本檢驗統計量例題分析【例6-12】檢驗兩企業燈泡使用壽命的方差比example6_6<-read.csv("C:/example/ch6/example6_6.csv")var.test(example6_6[,1],example6_6[,2],alternative="two.sided")

正態性檢驗——Q-Q圖

6.5

正態性的檢驗參數檢驗(如t檢驗,F檢驗等)通常都是在假定總體服從正態分布或總體分布形式已知的條件下進行的,而且要求所分析的數據是數值型的當總體的概率分布形式未知,或者無法對總體的概率分布做出假定時,參數檢驗方法往往會失效非參數檢驗(nonparametrictest)方法不僅對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論