統計學 課件 第7章 假設檢驗_第1頁
統計學 課件 第7章 假設檢驗_第2頁
統計學 課件 第7章 假設檢驗_第3頁
統計學 課件 第7章 假設檢驗_第4頁
統計學 課件 第7章 假設檢驗_第5頁
已閱讀5頁,還剩126頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第7講假設檢驗1假設檢驗基礎定義2定義1:假設檢驗是指對總體的某種規律(如總體參數、總體分布等)提出一個假設,通過樣本數據來開展推斷,從而決定是否拒絕這一假設的統計活動。假設檢驗的核心思想是反證法。假設檢驗的原理是小概率原理。步驟1——提出假設3

步驟1——提出假設4

假設雙側檢驗左單側檢驗右單側檢驗步驟1——提出假設5

步驟1——提出假設6例某機構認為A地區居民在過去一周用于外賣的平均支出超過200元,為了驗證該觀點,機構開展隨機調查,并準備開展假設檢驗,請問該問題中的原假設與備擇假設應該如何給出?

步驟2——選擇檢驗統計量7檢驗統計量是假設檢驗中的一種統計量。在原假設下,檢驗統計量服從一個給定的概率分布。步驟2——選擇檢驗統計量8

步驟3——顯著性水平與拒絕區域9

不拒絕區域0

拒絕區域拒絕區域標準正態分布步驟3——顯著性水平與拒絕區域10正確決策正確決策

步驟3——顯著性水平與拒絕區域11

步驟3——顯著性水平與拒絕區域12考慮單側問題

0

拒絕區域

標準正態分布

0

拒絕區域

標準正態分布步驟4——計算檢驗統計量的值13在這個步驟里,我們就需要依據假設檢驗問題中包括樣本信息在內的所有已知信息,計算檢驗統計量的值,這個步驟并不復雜,可以借助EXCEL等軟件來協助計算。步驟5——統計決策14如果檢驗統計量的值落在拒絕區域內,那么就意味著一次實驗中小概率事件發生了,我們就有足夠的理由做出“拒絕原假設”的決策。反之,如果檢驗統計量的值沒有落在拒絕區域內,那么就意味著一次實驗中小概率事件沒有發生了,我們就沒有足夠的理由“拒絕原假設”,此時的決策應該是“無法拒絕原假設”。第7講假設檢驗157.2.1一個總體均值的假設檢驗1方法講解——提出假設16方法講解——確定檢驗統計量17總體方差已知總體方差未知正態總體非正態總體(大樣本)方法講解——顯著性水平與拒絕區域18顯著性水平α是我們在開展假設檢驗過程中進行給定的,表示在假設檢驗中犯第一類錯誤概率的上限。(1)雙側檢驗0

拒絕區域拒絕區域

標準正態分布方法講解——顯著性水平與拒絕區域19顯著性水平α是我們在開展假設檢驗過程中進行給定的,表示在假設檢驗中犯第一類錯誤概率的上限。(1)雙側檢驗0

拒絕區域拒絕區域

標準正態分布0

拒絕區域拒絕區域

T分布方法講解——顯著性水平與拒絕區域20(2)單側檢驗0

拒絕區域

標準正態分布0

拒絕區域

標準正態分布方法講解21計算檢驗統計量的值做出統計決策

P值決策22P值是原假設為真時,得到樣本觀察結果或者更極端結果的概率。

P值決策23

例題24例

某機構認為A電商平臺用戶的平均支出不足400元,為了檢驗其觀點,對60位用戶開展了隨機調查,用戶支出的調查結果如下:418408368387413370414409387348373376391395407410418408387435415398408389408405402357408402433358413388405385397386430385379406374393377423394386414423379378397397390387416394436362

例題25

例題26(3)確定顯著性水平與拒絕區域。0

拒絕區域

標準正態分布例題27(4)計算檢驗統計量的值。

例題28

例題29

0

標準正態分布

大于顯著性水平0.05,所以我們沒有足夠的理由拒絕原件設,也就不能認為平臺用戶的平均支出顯著小于400元。第7講假設檢驗307.2.1一個總體均值的假設檢驗2引例:購物中心的決策難題運營部門認為顧客在購物中心內的平均時間超過2小時,建議應在中心內新增休息區域.決策層認為,如果情況確實如此,就考慮采納這個建議.你覺得運營部門應該如何驗證自己的判斷呢?31引例:購物中心的決策難題樣本量樣本均值(h)樣本標準差(h)4102.050.4顧客購物時間的調查結果決策層:調查結果只是比2小時多0.05小時,可能是隨機抽樣造成的,不能認為超過了2小時.運營部門:調查結果顯示顧客購物時間超過了2小時,可以考慮新增休息區域.一個總體均值的假設檢驗32一個總體均值的假設檢驗(正態總體且方差未知)

問題能用方差已知情形的均值檢驗(已學習)來做嗎?

33一個總體均值的假設檢驗(正態總體且方差未知)

樣本均值自由度

0

拒絕區域

0

拒絕區域拒絕區域

假設檢驗的流程34例題

樣本量樣本均值(h)樣本標準差(h)4102.050.435

13

2確定檢驗統計量:

0

拒絕區域0.05例題36

在0.05顯著性水平上,顧客在購物中心內的平均購物時間顯著超過2小時,可以考慮新增休息區域.作出統計決策:45計算檢驗統計量的值:假設的總體均值樣本均值樣本標準差樣本量

0

拒絕區域0.05例題37例題(利用P值進行決策)123

計算檢驗統計量的值:決策:P值:原假設為真時,得到樣本觀察結果或者更極端結果的概率0

拒絕區域0.051.652.53

結論:

38例題的思考“顧客在購物中心內的平均購物時間超過2小時”,該結論一定是正確的.如果檢驗統計量為0.8,這意味著平均購物時間一定小于等于2小時.0

拒絕區域0.0539小結假定條件:檢驗統計量:檢驗步驟:正態總體、方差未知

5個步驟40思考與練習

41第7講假設檢驗一個總體比例的假設檢驗42引例:共享巴士計劃某創業團隊發現,部分上班族每天在A地區和B地區之間通勤時間超過1.5小時.團隊計劃開通共享巴士,預判超過30%的上班族支持該方案.如果預判正確,團隊就開始籌劃,那么應該如何驗證該預判呢?/news/detail?id=17646143引例:共享巴士計劃樣本量支持數量樣本比例100033033%共享巴士方案的調查結果觀點2:只是比30%多了3%,是不是我們運氣好才得到了超過30%的結果?觀點1:超過30%的上班族支持這一方案,可以開始籌劃.一個總體比例的假設檢驗44一個總體比例的假設檢驗

/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/DeMoivreLaplaceCLT/demoivrelaplaceclt.xmlAbrahamdeMoivre1667-1754Pierre-SimonLaplace1749-1827

45一個總體比例的假設檢驗假設檢驗的流程

0為假設的總體比例

樣本比例0

拒絕區域拒絕區域0

拒絕區域提出假設確定檢驗統計量確定顯著性水平

計算檢驗統計量的值作出統計決策46例題

樣本量支持數量樣本比例100033033%47

132確定檢驗統計量:

01.65

拒絕區域例題48

作出統計決策:45計算檢驗統計量的值:

01.65

拒絕區域例題49例題(利用P值進行決策)312計算檢驗統計量的值:決策:

P值:原假設為真時,得到樣本觀察結果或者更極端結果的概率.01.65

拒絕區域

結論:1.652.07

50例題的思考例題的結論“支持的比例大于30%”,一定是成立的.

51小結假定條件:檢驗統計量:檢驗步驟:總體服從兩點分布、大樣本

5個步驟52第7講假設檢驗53一個總體方差的假設檢驗引例:工業機器人的調試某制造商近期懷疑流水線機器人可能存在故障,需要進行各項性能評價.其中一項是豎直方向的焊接位置標準差小于2毫米,否則需要停工調試.在該性能上是否達標呢?/robotic-welding-technology-improve-speed-consistency/54引例觀點1:測量得到標準差大于2毫米,應該停工檢查.觀點2:測量得到的是樣本標準差,具有隨機性,差得并不多,也許只是運氣不好,沒必要停工檢查.樣本量樣本標準差(毫米)6002.16一個總體方差的假設檢驗55一個總體方差的假設檢驗假定條件:假設檢驗的流程:總體服從正態分布提出假設56一個總體方差的假設檢驗假設檢驗的流程

假設的總體方差57例題

樣本量樣本標準差(毫米)6002.1658例題

13

2

59

結論:在0.05顯著性水平下,焊接位置標準差顯著大于2毫米,建議停工檢查.作出統計決策:45

例題60例題(利用P值進行決策)123計算檢驗統計量的值:決策:

P值:原假設為真時,得到樣本觀察結果或者更極端結果的概率

結論:

698.67

61例題的思考

62小結假定條件:檢驗統計量:檢驗步驟:總體服從正態分布

5個步驟63思考與練習

64第14講兩個總體方差比的檢驗65兩個總體方差比的檢驗引例66判斷兩個總體方差是否相等,通常是兩個總體均值差檢驗的前期工作。一份報告認為A地區與B地區學生,在過去一個月的課外學習時間方差是相等的,某調查機構為了檢驗這一結果,應該如何做呢?全面調查?抽樣調查?引例67A地區B地區29.330.528.433.933.922.628.127.028.227.628.530.528.130.929.831.422.728.324.123.129.629.827.326.830.527.927.426.531.829.231.630.633.333.128.826.823.731.129.820.429.626.429.929.831.923.426.627.031.828.529.130.431.128.129.821.927.230.126.029.031.931.830.527.825.823.625.329.829.2調查機構對A和B兩個地區的學生開展了抽樣調查,結果如下

是由抽樣的隨機性造成的?A地區與B地區學生課外學習時間方差不相等造成的?兩個總體方差比的檢驗68假定條件兩個總體都服從正態分布.兩個獨立的隨機樣本.樣本方差比的分布

原假設與備擇假設兩個總體方差比的檢驗69

例題70

A地區B地區29.330.528.433.933.922.628.127.028.227.628.530.528.130.929.831.422.728.324.123.129.629.827.326.830.527.927.426.531.829.231.630.633.333.128.826.823.731.129.820.429.626.429.929.831.923.426.627.031.828.529.130.431.128.129.821.927.230.126.029.031.931.830.527.825.823.625.329.829.2單側?雙側?例題71

21

3

例題72計算檢驗統計量的值:4

作出統計決策:5意義:A、B地區學生課外學習時間方差存在顯著差異.調查結果并不支持報告的觀點.例題(利用P值進行決策)計算檢驗統計量的值:決策:73450.503

P值:原假設為真時,得到樣本觀察結果或者更極端結果的概率

小概率事件發生

小結74假定條件兩個總體都服從正態分布.兩個獨立的隨機樣本.樣本方差比的分布

第7講假設檢驗75兩個總體均值之差的假設檢驗概述原假設和備擇假設76

獨立樣本、正態總體、總體方差已知77

獨立樣本、非正態總體、大樣本78

獨立樣本、非正態總體、大樣本79

第7講假設檢驗80兩個總體均值之差的檢驗正態總體、總體方差未知且相等學生群體與圖書館利用程度81問題不同學生群體對圖書館利用程度存在差異嗎?學生群體與圖書館利用程度82研究問題:不同性別學生的“與課程學習相關的文獻利用”情況是否存在差異?高校圖書館利用與學生學習結果關系的實證研究——基于“2017年首都大學生就讀經驗調查”[J].圖書情報工作,2019,63(21):56-65.開展了不同性別、是否擔任學生干部、是否有深造意愿、不同年級、不同生源地、不同院校類型的學生對圖書館利用情況的分析.兩個總體均值之差的檢驗83是由抽樣的隨機性造成的?女生的“與課程學習相關的文獻利用”情況好于男生造成的?與課程學習相關的文獻利用性別男生女生樣本量42075061估計量均值標準差均值標準差文獻利用2.300.9392.380.928女生樣本均值:2.38大于男生樣本均值:2.30注:數值越大,與課程學習相關的文獻利用情況越好正態總體、總體方差未知且相等兩個總體均值之差的檢驗84兩個總體均值之差的檢驗(正態總體、總體方差未知)

需要首先判斷是哪種情形

0F拒絕區域a/2

a/2拒絕區域

復習一下下節內容本節內容正態總體、總體方差未知且相等兩個總體均值之差的檢驗85

0F拒絕區域0.025

0.025拒絕區域EXCEL函數F.INVF.INV.RT與課程學習相關的文獻利用性別男生女生樣本量42075061估計量均值標準差均值標準差文獻利用2.300.9392.380.928正態總體、總體方差未知且相等兩個總體均值之差的檢驗86

合并統計量

原假設與備擇假設正態總體、總體方差未知且相等證明見第六章例題87根據2017年首都大學生就讀經驗調查,在“與課程學習相關的文獻利用”變量上,具體數據如下,在正態總體的假設下,請問不同性別學生的“與課程學習相關的文獻利用”的均值是否存在差異?

21總體方差是否相等兩個總體方差不存在顯著差異(考慮方差相等情形).與課程學習相關的文獻利用性別男生女生樣本量42075061估計量均值標準差均值標準差文獻利用2.300.9392.380.928例題884

3確定檢驗統計量(總體方差未知且相等)

0拒絕區域

拒絕區域

例題計算檢驗統計量的值:

檢驗結果顯示:不同性別學生的“與課程學習相關的文獻利用”的均值存在顯著差異.作出統計決策:意義:8956

0拒絕區域

拒絕區域

例題(利用P值進行決策)計算檢驗統計量的值:決策:9056-1.96

P值:原假設為真時,得到樣本觀察結果或者更極端結果的概率

小概率事件發生0拒絕區域

拒絕區域

小結91兩個總體均值之差的檢驗(正態總體、總體方差未知)

第一步先做兩個總體方差的F檢驗(已學習)

下節內容本節內容

第二步思考與練習92思考:根據文獻信息,建立“創業”與“非創業”群體數學能力均值差的置信區間.(注:不考慮正態總體假設)李濤,朱俊兵,伏霖.聰明人更愿意創業嗎?——來自中國的經驗發現[J].經濟研究,2017,52(03):91-105.第7講假設檢驗93兩個總體均值之差的假設檢驗正態總體、總體方差未知且不等引例:健身中心的選址某健身連鎖企業計劃在B地區開設分店,但運營部門認為A地區居民的過去一周平均運動時間更長,建議在A地區開店.總部認為同等條件下,如果運營部門的判斷是正確的,則優先考慮A地區.運營部門應該如何收集數據來檢驗自己的判斷呢?94引例:健身中心的選址地區AB樣本量300400估計量均值標準差均值標準差周平均運動時長(h)9.361.569.081.97

兩個總體均值之差的假設檢驗95兩個總體均值之差的假設檢驗上節課學習的兩個總體均值之差的檢驗方法能用嗎?

兩個總體方差相等嗎?96兩個總體均值之差的假設檢驗地區AB樣本量300400估計量均值標準差均值標準差周平均運動時長(h)9.361.569.081.97

0F拒絕區域0.025

0.025拒絕區域97兩個總體均值之差的假設檢驗

檢驗統計量

自由度(接近的整數)原假設與備擇假設

98例題

21總體方差存在顯著差異地區AB樣本量300400估計量均值標準差均值標準差周平均運動時長(h)9.361.569.081.97994

30拒絕區域

確定檢驗統計量(總體方差未知且不相等)

100例題

作出統計決策:56計算檢驗統計量的值:

0拒絕區域

101例題例題(利用P值進行決策)12計算檢驗統計量的值:

0拒絕區域

決策:P值:原假設為真時,得到樣本觀察結果或者更極端結果的概率

2.1

102例題思考

A地區居民的上一周平均運動時間大于B地區的決策結果一定正確.103小結前提條件:檢驗統計量:檢驗步驟:獨立正態總體、方差未知且不等

6個步驟104思考與練習思考題:中國4G網絡覆蓋全國95%的行政村和99%的人口[1],有觀點認為“互聯網的建設增加了農民的非農收入”,你能結合文獻數據[2],談談你對這一觀點的看法嗎?練習:見課程網絡平臺.[1]/politics/2018-06/11/c_1122965120.htm[2]楊檸澤,周靜.互聯網使用能否促進農民非農收入增加?——基于中國社會綜合調查(CGSS)2015年數據的實證分析[J].經濟經緯,2019,36(05):41-48.105第7講假設檢驗匹配樣本總體均值差的假設檢驗106引例:玩視頻游戲能減肥嗎?有機構認為在傳統運動器械上增加運動視頻游戲有助于減肥.應該如何檢驗該判斷呢?HaddockBL,SiegelSR,WikinLD.Theadditionofavideogametostationarycycling:Theimpactonenergyexpenditureinoverweightchildren[J].Theopensportssciencesjournal,2009,2:42.107引例:玩視頻游戲能減肥嗎?共20名青少年參加運動視頻游戲試驗,所有人騎行兩次,并評估能量消耗.一次有運動視頻游戲設備.一次無運動視頻游戲設備.游戲

A1A2A3A4A5A6A7A8A9A10有5.046.975.524.775.575.675.134.884.558.89無7.273.463.206.722.793.374.724.957.143.11

游戲A11A12A13A14A15A16A17A18A19A20有5.144.627.904.297.986.925.516.417.045.25無6.104.014.495.005.334.323.546.536.666.02Kcal/min108匹配樣本樣本特點同一對象先后測量兩次.

匹配樣本總體均值差的假設檢驗游戲

A1A2A3A4A5A6A7A8A9A10有5.046.975.524.775.575.675.134.884.558.89無7.273.463.206.722.793.374.724.957.143.11

游戲A11A12A13A14A15A16A17A18A19A20有5.144.627.904.297.986.925.516.417.045.25無6.104.014.495.005.334.323.546.536.666.02兩個樣本的樣本量相同.兩個樣本的順序是一一對應的.109匹配樣本總體均值差的假設檢驗假定條件:兩個總體都服從正態分布.作用:檢驗兩個總體的均值差.假設檢驗的流程1假設研究的問題H0H1提出假設110匹配樣本總體均值差的假設檢驗假設檢驗的流程觀察序號樣本1樣本2差值MMMM

假設的差值

樣本差值均值樣本差值標準差檢驗統計量2345

111例題

Kcal/min游戲

A1A2A3A4A5A6A7A8A9A10有5.046.975.524.775.575.675.134.884.558.89無7.273.463.206.722.793.374.724.957.143.11

游戲A11A12A13A14A15A16A17A18A19A20有5.144.627.904.297.986.925.516.417.045.25無6.104.014.495.005.334.323.546.536.666.02112

13

2確定檢驗統計量:0拒絕區域

113例題計算檢驗統計量的值:4

0拒絕區域

游戲A1A2A3A4A5A6A7A8A9A10有無

游戲A11A12A13A14A15A16A17A18A19A20有無

114例題

作出統計決策:5115例題例題(利用P值進行決策)計算檢驗統計量的值:12

0拒絕區域

統計決策:P值:原假設為真時,得到樣本觀察結果或者更極端結果的概率.

1.72

116問題拓展:兩種t檢驗是一樣的?[1]Xu,M.,Fralick,D.,Zheng,J.Z.,Wang,B.,Tu,X.M.,&Feng,C.(2017).Thedifferencesandsimilaritiesbetweentwo-samplet-testandpairedt-test.Shanghaiarchivesofpsychiatry

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論