抽樣分配培訓課件(-)_第1頁
抽樣分配培訓課件(-)_第2頁
抽樣分配培訓課件(-)_第3頁
抽樣分配培訓課件(-)_第4頁
抽樣分配培訓課件(-)_第5頁
已閱讀5頁,還剩101頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章抽樣分配

1一般統計推論分成估計與檢定兩大領域,估計又分成點估計與信賴區間兩種,27.1

估計與誤差

生態學家認為南極海域的藍鯨存量濱臨絕種邊緣,因此想知道現在的藍鯨存量有多少?在這個問題中,藍鯨存量就是我們感興趣的『參數』3參數(藍鯨存量)是多少?可能方法之一是將南極海域的水抽光后,數一數就可數出有多少尾藍鯨較可行的方式是透過統計的手法獲得資料再做推估

4例7.1、南極海域藍鯨存量的估計

南極海域藍鯨捕獲量愈來愈少捕鯨協會想研究南極的藍鯨存量有多少?

5方法1

捕獲量比較法如第一次捕捉到270尾,第二次捕捉到243尾,少了10%。則估計為原有270/0.1=2700尾,但現在則有2187尾。

6

7方法2記號法設第一次捕捉到鯨魚150尾,做記號后放回。第二次再捕100尾,其中有6尾有記號。則估計鯨魚存量為:89估計與誤差

10例男生比率某大學共有學生6672人,某教授想了解此大學中男生所占的比例。便在某角落觀察經過的學生,看到100位中有40位女生、60位男生,因此他估計全校男生比率是0.6。11事實上,全校學生中有男生3091人、女生3581人,因此母體參數男生比例是

=3091/6672

0.46,而此教授估計男生的比例是0.6。12抽樣誤差其差距0.14有二種來源:一是由于抽樣誤差造成,如在同一角落多看幾次(每次都是100人),所得男女生比例也會有不同。這種由于樣本抽樣所造成的誤差,稱之為“抽樣誤差”,是“隨機性”,也是先天存在的。要獲得抽樣誤差的數據,這要重覆做很多次(如幾千次、幾萬次才能得到)。13假設此教授后來又觀察了10天,每天都在同一角落觀察100位學生,如果看到10次的男生人數分別如下:58506261465055525351由此10次算出平均數是54人,所以估計男生比例是0.54它與我們原先估計的男生比例是0.60,兩者相差,

0.60-0.54=0.06即為抽樣誤差。14方法偏差

此教授在這個角落觀察過往的學生,這種抽查方式也有可能造成偏差,也許這個角落離男生宿舍較近,男生經過的比例偏高,此為偏差的來源。如果每位學生(不論男女生)經過此角落機會均等,則看到男生的比例應是母體的比率0.46。事實上,因男生經過此角落的機會較大故造成看到男生的比例為0.54。此兩者的差異0.54-0.46=0.08,即為方法偏差。150.60(估計值)=0.46(參數)+0.08(方法偏差)+0.06(抽樣誤差)

167.2樣本平均數的分配

隨機抽樣得到一組資料x1,...,xn后,我們最常計算的兩個統計量是樣本平均數樣本標準差S雖然資料是從同一母體抽樣,但每次抽出的n個樣本會不同,因此算出的樣本平均數、標準差S也會不一樣,所以我們稱、S是“隨機變量”17既然每次抽樣算出的、S不同,我們有必要了解、S的抽樣分布長象是如何?18抽樣分配

19全國成年男人(約600萬人)的

平均身高是多少公分?

2021600萬人身高直方圖22第一組抽樣100位的身高資料

23樣本平均數=168.8,標準差s=6.3。如果以這樣的結果做母體平均數的估計,則估計誤差是

-=169.5-168.8=0.7(公分)24第二組抽樣100位的身高資料

25樣本平均數=171.3,標準差s=6.8。如果以第二組抽樣的平均數=171.3,當做所有全國成年人平均身高的估計,則估計誤差為

-=169.5-171.3=-1.826隨機變量由上面兩次抽樣結果,我們知道每次抽樣的資料會變動(故稱xi為“隨機變量”)而得到的樣本平均數也隨之變動

(故也是隨機變量)因此估計誤差也是不確定的27抽樣分布

28圖7.3

全國成年男人抽樣100位平均身高X的分布

010020030040050060070080090010001100120013001400166.4166.8167.2167.6168.0168.4168.8169.2169.6170.0170.4170.8171.2171.6172.0172.4

次數

29(1)此直方圖應像對稱的鐘形(即常態分配)。(2)此直方圖的中心點(也就是直方圖最高的部份)仍然是在169.5附近。(3)此直方圖比原先600萬位身高所畫直方圖更集中在中心點附近,即這些的標準差較原先母體Xi的標準差小。(4)這10,000個平均數的標準差是0.653比原先的母體(600萬人的身高)的標準差6.5小很,大約是原來的1/10。301.誤差在1公分之內的機會

?抽樣誤差312.估計誤差在1.3公分之內的機率?

抽樣誤差323.控制估計誤差在1公分之內而對的機會有95%時,那應取多少樣本呢?

信賴度33全國成年女生610萬人其身高分布

010020030040050060070080090010001100136140144148152156160164168172176180184188192196200

次數(單位:千人次)

34圖7.5

全國成年人身高分布

01002003004005006007008009001000110012001300136140144148152156160164168172176180184188192196200

所有成年人的平均身高是

m=164.21,標準差

s=7.8831。

次數(單位:千人次)

35367.3

大數法則37中央極限定理常態分配在理論上有很多好的結果,統計學上常假設資料是常態分配,例如常聽到常態分班、常模、常態曲線等等這些假設的依據是什么呢?就是中央極限定理的功勞

38中央極限定理

39中央極限定理40(1)「不論原母體是什么分配」,不管母體資料是連續型或離散型、對稱或不對稱、右偏或左偏,甚至是單峰或多峰都無所謂,只要樣本數n“足夠大”,分配就會變成像鐘形的常態分配。41(2)抽樣樣本數不論是多少個,代表資料“中心點”的樣本平均數的期望值與原母體分配的期望值都相同

4243(i)常態母體

44(ii)右偏母體

45(iii)均勻母體

46(iv)二項分配母體

47

7.4樣本數的決定

48誤差界限

所需抽樣樣本數n

49例95%信心水平e≤1

50例95%信心水平e≤0.5

51(1)誤差要求愈小,則所需樣本數就要愈大。如上例中誤差e=1,當要求誤差降低到e=0.5,則樣本數需要增加到4162.3=650位。(2)信賴度愈大(即愈小),則樣本數也要愈多。(3)標準差

愈大,則要求的樣本數也愈多。52(4)實務上,通常是不知道的。因此需要用其他方式對做大約的估計。例如以主觀估計=7.2,或是由主觀認為全國最高為200公分,最低150公分,全距是50公分,但全距大約是8,因此由8=50,得

=6.25。另外也可先抽幾個樣本(例如10個),算出樣本標準差S,以此做的估計,然后再由(7.9)式,求出樣本數n

。537.5樣本變異數的分布與卡方分配

5455卡方分配

56卡方分配密度函數

57圖7.11

卡方分配密度函數圖

58如果不是標準常態

而是一般的常態平方和所組成是否也是卡方配呢?59答案

不是

60不是標準常態而是一般的常態平方和所組成

61樣本變異數的分布

62答案

:是

其自由度變成n

-1,這是因為參數被估計值取代,因此犧牲了一個自由度

6364樣本變異數的分布不是常態

而是右偏的卡方分布

6566例7.2、如果從標準常態母體中每次抽4個,得x1,x2,x3,x4,再計算這樣重覆做10000次,得到10000筆數據試畫其直方圖

676869卡方分配查表

70圖7.13

之幾何意義

71查附表

72卡方分配的應用

卡方分配主要用在檢定

(檢定定義在第八章)它可用來檢定資料是否適合某種分配

(適合度檢定)或是檢定一組常態分配資料其變異數是否等于某數。73另外當母體標準差未知時,如要對母體平均數m做統計推論,更需要用到樣本變異數的分配由卡方分配才導出7.6與7.7節所要討論的t分配與F分配。747.6t分配

75“自由度k的t分配定義

76自由度n

-1的t分配

77自由度k的t分配的密度函數

78圖7.14t分配密度函數圖

798081注

(i)t分配是對稱圖形,它的形狀與常態分配相似,不過往兩邊下降速度較常態分配緩慢。(ii)當自由度k愈大時,

t分配就愈接近標準常態分配。

82t分配查表

8384查t

附表

85注

867.7F分配

87F分配的密度函數

88圖7.17F分配圖

899091F分配查表

9293查F分配表

94第七章摘要951.欲估計母體的參數

需要抽樣(一般不做普查,原因費時費力),抽樣的估計值與母體參數不會相同會有誤差,其關系式為估計值=參數+方法偏差+抽樣誤差

962.方法偏差

方法偏差是人為的疏忽應避免,例如方便的資料等所造成的偏差。抽樣誤差是自然的因素雖非人為的,但也可由對資料的認知降低誤差,例如以分層隨機抽樣取代簡單隨機抽樣就能降低抽樣誤差

97抽樣樣本數的決定

984.了解中央極限定理的意義、應用及其重要性

995.以身高資料說明的抽樣分布會接近常態

100標準誤與標準差的關系

1017.與常態分配相關之分配,包括卡方分配、分配、分配。了解各種分配定義及分配圖長像與用途,但初學者不用強記密度函數

1028.卡方卡方是標準常態分配的平方,其自由度為平方和的個數,但每個標準常態間必須獨立

1039.分配與分配間的關系:

10410.t分配

是用在母體標準差未知時,的分布(7.20式)

105(第14講)考場作文開拓文路能力?分解層次(網友來稿)江蘇省鎮江中學陳乃香說明:本系列稿共24講,20XX年1月6日開始在資源上連載【要義解說】文章主旨確立以后,就應該恰當地分解層次,使幾個層次構成一個有機的整體,形成一篇完整的文章。如何分解層次主要取決于表現主旨的需要。【策略解讀】一般說來,記人敘事的文章常按時間順序分解層次,寫景狀物的文章常按時間順序、空間順序分解層次;說明文根據說明對象的特點,可按時間順序、空間順序或邏輯順序分解層次;議論文主要根據“提出問題-—分析問題——解決問題”順序來分解層次。當然,分解層次不是一層不變的固定模式,而應該富于變化。文章的層次,也常常有些外在的形式:1.小標題式。即圍繞話題把一篇文章劃分為幾個相對獨立的部分,再給它們加上一個簡潔、恰當的小標題。如《世界改變了模樣》四個小標題:壽命變“長”了、世界變“小”了、勞動變“輕”了、文明變“綠”了。2.序號式。序號式作文與小標題作文有相同的特點。序號可以是“一、二、三”,可以是“A、B、C”,也可以是“甲、乙、丙”……從全文看,序號式干凈、明快;但從題目上看,卻看不出文章內容,只是標明了層次與部分。有時序號式作文,也適用于敘述性文章,為故事情節的展開,提供了明晰的層次。3.總分式。如高考佳作《人生也是一張答卷》。開頭:“人生就是一張答卷。它上面有選擇題、填空題、判斷題和問答題,但它又不同于一般的答卷。一般的答卷用手來書寫,人生的答卷卻要用行動來書寫。”主體部分每段首句分別為:選擇題是對人生進行正確的取舍,填空題是充實自己的人生,判斷題是表明自己的人生態度,問答題是考驗自己解決問題的能力。這份“試卷”設計得合理而且實在,每個人的人生都是不同的,這就意味著這份人生試卷的“答案是豐富多彩的”。分解層次,應追求作文美學的三個價值取向:一要勻稱美。什么材料在前,什么材料在后,要合理安排;什么材料詳寫,什么材料略寫,要通盤考慮。自然段是構成文章的基本單位,恰當劃分自然段,自然就成為分解層次的基本要求。該分段處就分段,不要老是開頭、正文、結尾“三段式”,這種老套的層次顯得呆板。二要波瀾美。文章內容應該有張有弛,有起有伏,如波如瀾。只有這樣才能使文章起伏錯落,一波三折,吸引讀者。三要圓合美。文章的開頭與結尾要遙相照應,把開頭描寫的事物或提出的問題,在結尾處用各種方式加以深化或回答,給人首尾圓合的感覺。【例文解剖】話題:忙忙,不亦樂乎忙,是人生中一個個步驟,每個人所忙的事務不同,但是不能是碌碌無為地白忙,要忙就忙得精彩,忙得不亦樂乎。忙是問號。忙看似簡單,但其中卻大有學問。忙是人生中不可缺少的一部分,但是怎么才能忙出精彩,忙得不亦樂乎,卻并不簡單。人生如同一張地圖,我們一直在自己的地圖上行走,時不時我們眼前就出現一個十字路口,我們該向哪兒,面對那縱軸橫軸相交的十字路口,我們該怎樣選擇?不急,靜下心來分析一下,選擇適合自己的坐標軸才是最重要的。忙就是如此,選擇自己該忙的才能忙得有意義。忙是問號,這個問號一直提醒我們要忙得有意義,忙得不亦樂乎。忙是省略號。四季在有規律地進行著冷暖交替,大自然就一直按照這樣的規律不停地忙,人們亦如此。為自己找一個目標,為目標而不停地忙,讓這種忙一直忙下去。當目標已達成,那么再找一個目標,繼續這樣忙,就像省略號一樣,毫無休止地忙下去,翻開歷史的長卷,我們看到牛頓在忙著他的實驗;愛迪生在忙著思考;徐霞客在忙著記載游玩;李時珍在忙著編寫《本草綱目》。再看那位以筆為刀槍的充滿著朝氣與力量的文學泰斗魯迅,他正忙著用他獨有的刀和槍在不停地奮斗。忙是省略號,確定了一個目標那么就一直忙下去吧!這樣的忙一定會忙出生命靈動的色彩。忙是驚嘆號。世界上的人都在忙著自己的事,大自然亦如此,小蜜蜂在忙,以蜂蜜為回報。那么人呢?居里夫人的忙,以放射性元素的發現而得到了圓滿的休止符;愛因斯坦在忙,以相對論的問世而畫上了驚嘆號;李白的忙,以那豪放的詩歌而有了很大的成功;張衡的忙,因為那地動儀的問世而讓世人仰慕。每個人都應該有效率的忙,而不是整天碌碌無為地白忙。人生是有限的、短暫的,因此,每個人都應該在有限的生命里忙出屬于他的驚嘆號;都應在有限的生命里忙出他的人生精彩篇章。忙是萬物、世界、人生中都不可缺少的一部分。作為這世上最高級動物的我們,我們在忙什么呢?我們要忙得有意義,有價值,我們要忙出屬于我們的精彩。我們的忙不能永遠是問號,而應是省略號和感嘆號。忙就要忙得精彩,忙得不亦樂乎。解剖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論