




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第七章 抽樣分配 1.普通統計推論分成估計與檢定兩大領域,估計又分成點估計與信任區間兩種,2.7.1 估計與誤差 生態學家以為南極海域的藍鯨存量濱臨絕種邊緣,因此想知道如今的藍鯨存量有多少?在這個問題中,藍鯨存量就是我們感興趣的參數3.參數(藍鯨存量)是多少?能夠方法之一是將南極海域的水抽光后,數一數就可數出有多少尾藍鯨較可行的方式是透過統計的手法獲得資料再做推估 4.例7.1、南極海域藍鯨存量的估計 南極海域藍鯨捕獲量愈來愈少捕鯨協會想研討南極的藍鯨存量有多少? 5.方法1 捕獲量比較法 如第一次捕捉到270尾, 第二次捕捉到243尾,少了10%。那么估計為原有270/0.1 = 2700尾
2、, 但如今那么有2187尾。 6. 7.方法2記號法設第一次捕捉到鯨魚150尾,做記號后放回。 第二次再捕100尾,其中有6尾有記號。那么估計鯨魚存量為:8.9.估計與誤差 10.例 男生比率某大學共有學生6672人,某教授想了解此大學中男生所占的比例。便在某角落察看經過的學生,看到100位中有40位女生、60位男生,因此他估計全校男生比率是0.6。11.現實上,全校學生中有 男生3091人、女生3581人,因此母體參數男生比例是 = 3091/6672 0.46,而此教授估計男生的比例是0.6。12.抽樣誤差其差距0.14有二種來源:一是由于抽樣誤差呵斥,如在同一角落多看幾次(每次都是100
3、人) ,所得男女生比例也會有不同。這種由于樣本抽樣所呵斥的誤差,稱之為“抽樣誤差,是“隨機性,也是先天存在的。要獲得抽樣誤差的數據,這要重覆做很多次(如幾千次、幾萬次才干得到) 。13.假設此教授后來又察看了10天,每天都在同一角落察看100位學生,假設看到10次的男生人數分別如下:58 50 62 61 46 50 55 52 53 51由此10次算出平均數是54人,所以估計男生比例是0.54它與我們原先估計的男生比例是0.60 ,兩者相差, 0.60 - 0.54 = 0.06即為抽樣誤差。14.方法偏向 此教授在這個角落察看過往的學生,這種抽查方式也有能夠呵斥偏向,也許這個角落離男生宿舍
4、較近,男生經過的比例偏高,此為偏向的來源。假設每位學生(不論男女生)經過此角落時機均等,那么看到男生的比例應是母體的比率0.46 。現實上,因男生經過此角落的時機較大故呵斥看到男生的比例為0.54 。此兩者的差別0.54-0.46=0.08, 即為方法偏向。15.0.60(估計值) =0.46(參數) + 0.08(方法偏向) + 0.06(抽樣誤差) 16.7.2 樣本平均數的分配 隨機抽樣得到一組資料x1, ., xn后,我們最常計算的兩個統計量是 樣本平均數 樣本規范差S雖然資料是從同一母體抽樣, 但每次抽出的n個樣本會不同,因此算出的樣本平均數、規范差S也會不一樣,所以我們稱 、S是“
5、隨機變量17.既然每次抽樣算出的 、S不同,我們有必要了解 、S的抽樣分布長象是如何?18.抽樣分配 19.全國成年男人(約600萬人)的平均身高是多少公分? 20.21.600萬人身高直方圖22.第一組抽樣100位的身高資料 23.樣本平均數 = 168.8, 規范差s = 6.3。假設以這樣的結果做母體平均數 的估計,那么估計誤差是 - = 169.5 - 168.8 = 0.7(公分)24.第二組抽樣100位的身高資料 25.樣本平均數 = 171.3,規范差s = 6.8。假設以第二組抽樣的平均數=171.3, 當做一切全國成年人平均身高的估計,那么估計誤差為 - = 169.5 -
6、171.3 = - 1.826.隨機變量由上面兩次抽樣結果,我們知道每次 抽樣的資料會變動(故稱xi為“隨機變量)而得到的樣本平均數 也隨之變動 (故也是隨機變量)因此估計誤差也是不確定的27.抽樣分布 28.圖7.3 全國成年男人抽樣100位平均身高X的分布 010020030040050060070080090010001100120013001400166.4166.8167.2167.6168.0168.4168.8169.2169.6170.0170.4170.8171.2171.6172.0172.4 次數 29.(1)此直方圖應像對稱的鐘形(即常態分配)。(2)此直方圖的中心點(
7、也就是直方圖最高 的部份)依然是在169.5附近。(3)此直方圖比原先600萬位身高所畫直方圖更集中在中心點附近,即這些的規范差較原先母體Xi的規范差小。(4)這10,000個平均數的規范差是0.653比原先的母體(600萬人的身高)的規范差6.5小很,大約是原來的1/10 。30.1. 誤差在1公分之內的時機 ?抽樣誤差31.2. 估計誤差在1.3公分之內的機率? 抽樣誤差32.3. 控制估計誤差在1公分之內而對的時機有 95%時,那應取多少樣本呢? 信任度33.全國成年女生610萬人其身高分布 010020030040050060070080090010001100140144148152
8、156160164168172176180184188192196200 次數(單位:千人次) 34.圖7.5 全國成年人身高分布 01002003004005006007008009001000110012001300140144148152156160164168172176180184188192196200 一切成年人的平均身高是 m=164.21,規范差 s= 7.8831。 次數(單位:千人次) 35.36.7.3 大數法那么37.中央極限定理常態分配在實際上有很多好的結果,統計學上常假設資料是常態分配,例如常聽到常態分班、常模、常態曲線等等這些假設的根據是什么呢? 就是中央極限定
9、理的功績 38.中央極限定理 39.中央極限定理40.(1) 不論原母體是什么分配,不論母體資料是延續型或離散型、 對稱或不對稱、右偏或左偏, 甚至是單峰或多峰都無所謂,只需樣本數n“足夠大, 分配 就會變成像鐘形的常態分配。41.(2)抽樣樣本數不論是多少個, 代表資料“中心點的樣本平均數的 期望值與原母體分配的期望值都一樣 42.43.(i) 常態母體 44.(ii) 右偏母體 45. (iii) 均勻母體 46. (iv) 二項分配母體 47. 7.4 樣本數的決議 48.誤差界限所需抽樣樣本數n 49.例 95%自信心程度 e 150.例 95%自信心程度 e 0.551.(1)誤差要
10、求愈小,那么所需樣本數就要愈大。如上例中誤差e = 1,當要求誤差降低到e = 0.5,那么樣本數需求添加到 4 162.3 = 650位。(2)信任度愈大(即愈小),那么樣本數也要愈多。(3)規范差 愈大,那么要求的樣本數也愈多。 52.(4)實務上,通常是不知道的。因此需求用其他方式對做大約的估計。例如以客觀估計 = 7.2,或是由客觀以為全國最高為200公分,最低150公分,全距是50公分,但全距大約是8,因此由8 = 50,得 = 6.25 。另外也可先抽幾個樣本(例如10個),算出樣本規范差S,以此做的估計,然后再由(7.9)式, 求出樣本數n 。53.7.5 樣本變異數的分布與卡方
11、分配 54.55.卡方分配 56.卡方分配密度函數 57.圖7.11 卡方分配密度函數圖 58.假設不是規范常態而是普通的常態平方和所組成能否也是卡方配呢?59.答案 不是 60.不是規范常態而是普通的常態平方和所組成 61.樣本變異數的分布 62.答案 :是 其自在度變成n - 1, 這是由于參數 被估計值取代, 因此犧牲了一個自在度 63.64.樣本變異數的分布不是常態而是右偏的卡方分布 65.66.例7.2、假設從規范常態母體中每次抽4個, 得x1, x2, x3, x4,再計算 這樣重覆做10000次,得到10000筆數據試畫其直方圖 67.68.69.卡方分配查表 70.圖7.13
12、之幾何意義 71.查附表 72.卡方分配的運用 卡方分配主要用在檢定 (檢定定義在第八章)它可用來檢定資料能否適宜某種分配 (適宜度檢定)或是檢定一組常態分配資料其變異數 能否等于某數。73.另外當母體規范差未知時, 如要對母體平均數m做統計推論, 更需求用到樣本變異數的分配由卡方分配才導出7.6與7.7節 所要討論的 t分配與 F分配。74.7.6 t分配 75.“自在度k的t分配定義 76.自在度n - 1的t分配 77.自在度k的t分配的密度函數 78.圖7.14 t分配密度函數圖 79.80.81.注 (i) t分配是對稱圖形, 它的外形與常態分配類似, 不過往兩邊下降速度較常態分配緩
13、慢。(ii)當自在度k愈大時, t分配就愈接近規范常態分配。 82.t 分配查表 83.84.查 t 附表 85.注 86.7.7 F分配 87.F分配的密度函數 88.圖7.17 F分配圖 89.90.91.F分配查表 92.93.查 F分配表 94.第七章 摘要 95.1.欲估計母體的參數 需求抽樣(普通不做普查,緣由費時費力),抽樣的估計值與母體參數不會一樣 會有誤差,其關系式為 估計值 = 參數+方法偏向+抽樣誤差 96.2.方法偏向 方法偏向是人為的忽略應防止,例如方便的資料等所呵斥的偏向。抽樣誤差是自然的要素雖非人為的, 但也可由對資料的認知降低誤差,例如以分層隨機抽樣取代 簡單隨機抽樣就能降低抽樣誤差 97.抽樣樣本數的決議 98.4.了解中央極限定理的意義、 運用及其重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 飲品生產銷售合同
- 2025水果銷售居間合同
- 2025私人借款合同范本下載
- 2025新鮮魚類批發合同
- 2025地下車庫租賃合同范本
- 2025未簽訂勞動合同補償雙倍工資
- 《普通話兒化音訓練》課件
- DB13-2169-2018-鋼鐵工業大氣污染物超低排放標準-河北省
- DB12-T1296-2023-芍藥鮮切花栽培管理技術規范-天津市
- 2025電子產品消費借款合同書
- 絕緣搖表培訓
- 保險合規知識培訓課件
- 2025年廣東省深圳市高考語文一模試卷
- 酒店客房保潔服務人員配置方案
- 第八課 學習借鑒外來文化的有益成果教學設計-2024-2025高中政治統編版必修四哲學與文化
- 虛擬電廠接入配電網電力系統調度優化
- 機場安檢人員培訓
- 2023敏感肌美白產品的市場需求數據分析報告-魔鏡洞察
- 公積金中心禮儀培訓
- 民兵集訓通知函
- 反恐維穩培訓課件
評論
0/150
提交評論