




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大學應用統計學經典課件06——抽樣和參數估計第一頁,共118頁。第二頁,共118頁。第三頁,共118頁。P102(107):例5.1;例5.2例5.3第四頁,共118頁。第五頁,共118頁。第六頁,共118頁。第七頁,共118頁。樣本,個體哪個大?第八頁,共118頁。定義5.1抽樣推斷:從所研究的總體全部元素(單位)中抽取一部分元素(單位)進行調查,并根據樣本數據所提供的信息來推斷總體的數量特征。定義5.2定義5.3定義5.4從含有N個元素的總體中,抽取n個元素作為樣本,使得每一個容量為n的樣本都有相同的機會(概率)被抽中,這樣的抽樣方式稱為簡單隨機抽樣,也稱純隨機抽樣。從總體中抽取一個元素后,把這個元素放回總體中再抽取第二個元素,直至抽取n個元素為止。這樣的抽樣方法稱為重復抽樣。一個元素后被抽中后不再放回總體,然后再從剩下的元素中抽取第二個元素,直至抽取n個元素為止。這樣的抽樣方法稱為不重復抽樣。第九頁,共118頁。參考定義5.5,5.6,5.7(P103-104)。見P109,分層抽樣就是類型抽樣分層抽樣與整群抽樣的區別在那里?第十頁,共118頁。分層抽樣與整群抽樣的區別在那里?(1)非隨機分層,層內隨機抽樣;隨機分群,群內全面調查(非隨機)。(2)層間差異大于層內差異;群內差異大于群間差異。所以,事先對總體結構又一定認識時,可以用分層抽樣;在總體沒有原始資料可利用時,可以用整群抽樣。例:分層抽樣與整群抽樣的區別:分專業抽樣(分層抽樣/分類型抽樣)分班抽樣(整群抽樣)見P109第十一頁,共118頁。例:各種概率抽樣的區別非隨機分層,層內隨機抽樣(測量地層)第十二頁,共118頁。例:各種概率抽樣的區別40m隨機隨機分群,群內全面調查(非隨機)(計算植物樣方)240m10m第十三頁,共118頁。例:各種概率抽樣的區別第十四頁,共118頁。第十五頁,共118頁。什么是樣本指標的分布?什么是容量相同的所有可能的樣本?為何樣本統計量是隨機變量?第十六頁,共118頁。這是一個均勻分布,即每個元素出現的機會(概率)是一樣的。Y軸和x軸分別代表什么?見P105(110)均值在那里?1.25為何概率為0.25?第十七頁,共118頁。第十八頁,共118頁。第十九頁,共118頁。例5.4(P105;p109)M是什么?
n是什么?n變大的結果如何?第二十頁,共118頁。從這兩張圖中要明白:(1)為什么樣本統計量是隨機變量。(2)什么是樣本均值的均值。n變大,抽樣分布方差越小。第二十一頁,共118頁。
樣本均值的數學期望就是樣本均值的均值。圖中那條曲線的均值更接近總體的均值?第二十二頁,共118頁。在這張圖中總體均值在那里?第二十三頁,共118頁。第二十四頁,共118頁。第二十五頁,共118頁。用什么估計總體均值?總體分布,樣本分布,(總體的)抽樣分布的關系…….μxxxxxxxμxf總體分布樣本分布抽樣分布μμxx第二十六頁,共118頁。總體元素個數、樣本容量、樣本(組)所有可能取值總體元素個數N(總體的所有個體)樣本容量n(每一次取樣的數量)容量為n的樣本的所有可能取值(所有的Nn種可能都出現為止)重復抽樣…….μxxxxxxxμxfx第二十七頁,共118頁。修正系數(當N很大時修正系數趨于1)P109第二十八頁,共118頁。注意標準差與標準誤差的區別。第二十九頁,共118頁。表5.1(P106),例5.4(P105;P109)第三十頁,共118頁。第三十一頁,共118頁。樣本均值的抽樣分布、樣本方差的抽樣分布總體的均值、方差方差的樣本分布均值的樣本分布方差抽樣分布(均值、方差)均值抽樣分布(均值、方差)…….μxxxxxxxμxfσσμDDDDDDDDμDσDDX第三十二頁,共118頁。注意:服從正態分布和服從卡方帆布分布的區別第三十三頁,共118頁。n
是什么?此處紅色曲線分布形成的均值是什么?是總體的μ還是σ?第三十四頁,共118頁。樣本均值的抽樣分布、樣本方差的抽樣分布、…樣本均值的抽樣分布均值方差……樣本方差的抽樣分布均值方差……樣本其他參數的抽樣分布均值方差……第三十五頁,共118頁。第三十六頁,共118頁。第三十七頁,共118頁。第三十八頁,共118頁。=N0/N第三十九頁,共118頁。第四十頁,共118頁。第四十一頁,共118頁。第四十二頁,共118頁。第四十三頁,共118頁。第四十四頁,共118頁。定義5.9用來估計總體參數的統計量的具體數值,稱為估計量,用符號θ表示。定義5.10定義5.11定義5.12用來估計總體參數時計算出來的估計量的具體數值,稱為估計值。在點估計的基礎上,給出總體參數估計的一個范圍,稱為參數的區間估計值。用樣本估計量θ的值直接作為總體參數θ的估計值,稱為參數的點估計。第四十五頁,共118頁。第四十六頁,共118頁。第2點是什么意思?第四十七頁,共118頁。這是什么意思?第四十八頁,共118頁。第四十九頁,共118頁。第五十頁,共118頁。第五十一頁,共118頁。第五十二頁,共118頁。第五十三頁,共118頁。第五十四頁,共118頁。點估計與抽樣分布的關系…….μxxxxxxxμxxf總體分布樣本分布抽樣分布誤差=|μx-x|nn>根據中心極限定理當n越大,樣本(參數)的抽樣分布越接近總體(參數)的真值。為何只用一個樣本估計,而不是用抽樣分布估計?x第五十五頁,共118頁。定義5.13估計量抽樣分布的數學期望等于被估計的總體參數。設總體參數為θ,所選擇的估計量為θ,如果E(θ)=θ,稱θ為θ的無偏估計。定義5.15定義5.14對同一總體參數的兩個無偏估計量θ1和θ2,若D(θ1)<D(θ2),稱θ1是比θ2更有效的估計量。隨著樣本容量的增大,點估計量的值越來越接近總體的參數。第五十六頁,共118頁。A=總體參數第五十七頁,共118頁。第五十八頁,共118頁。定義5.16由樣本統計量所構造的總體參數的估計區間,稱為置信區間,其中區間的最小值稱為置信下限,最大值稱為置信上限。定義5.17如果將構造置信區間的步驟重復多次,置信區間中包含總體參數真值的次數所占的比率,稱為置信水平或置信系數。第五十九頁,共118頁。置信水平=1-αα/2α/2置信區間是統計量的取值范圍;置信水平是概率。第六十頁,共118頁。Za/2是什么?第六十一頁,共118頁。什么是將構造置信區間的步驟重復多次?第六十二頁,共118頁。如果將構造置信區間的步驟重復多次,置信區間中包含總體參數真值的次數所占的比率,稱為置信水平或置信系數。x1x2第六十三頁,共118頁。第六十四頁,共118頁。置信水平是概率,是曲線下包含的面積。95%的置信水平就是有95%的區間包含了總體參數的真值。第六十五頁,共118頁。點估計與抽樣分布的關系…….μxxxxxxxμxxf總體分布樣本分布抽樣分布nn>以一定的概率出現根據中心極限定理當n越大,樣本(參數)的抽樣分布越接近總體(參數)的真值。|μx–x|≤△x誤差?μxμ=x第六十六頁,共118頁。區間估計與抽樣分布的關系以一定的概率(1-α)出現P(x-△x≤μx≤x+△x)=1-α△x△x抽樣分布μxxf…….μ總體分布樣本分布xx-△xx+△xP(μx-△x≤x≤μx+△x)=1-α|μx-x|≤△x誤差x-△x
≤
X
≤
x+△x
μxx區間▲x▲x第六十七頁,共118頁。此處σ是總體的標準差,還是樣本的標準差?Zα/2是什么?P117(125)Zα/2
N(0,1)Z=可靠性系數(臨界值)μx
Zα/2(σ/n)估計誤差=△x=置信上(下)限Z=σ/nx-μN(0,1)~第六十八頁,共118頁。置信下(上)限風險值置信水平邊際誤差誤差范圍可靠性系數臨界值這是什么?P125第六十九頁,共118頁。第七十頁,共118頁。第七十一頁,共118頁。第七十二頁,共118頁。此處σ為總體標準差,σ未知時以樣本標準差s代替。第七十三頁,共118頁。1.求產品平均重量的范圍,而不是平均重量.2.需要多大的范圍.才能以概率為95%(0.95)的準確率包含真正的平均重量。第七十四頁,共118頁。α/2=0.025,查(1-0.025),(0.975-0.5)第七十五頁,共118頁。α/2=0.025,查(1-0.025),(0.975-0.5)反查正態概率分布表第七十六頁,共118頁。和上題的差別:沒有總體標準差.第七十七頁,共118頁。總體標準差未知,以樣本標準差代替。查0.95第七十八頁,共118頁。查0.95第七十九頁,共118頁。第八十頁,共118頁。自由度為n-1的t分布第八十一頁,共118頁。第八十二頁,共118頁。第八十三頁,共118頁。第八十四頁,共118頁。查t0.025第八十五頁,共118頁。第八十六頁,共118頁。XB(n,p)pN(p,p(1–p))1n二項分布,p為成功率、比例等。N(μ,σ
2)Z=
N(0,1)
X-μσ第八十七頁,共118頁。第八十八頁,共118頁。第八十九頁,共118頁。自由度為n-1的卡方分布置信下限置信上限第九十頁,共118頁。α/2α/2置信下限置信上限第九十一頁,共118頁。第九十二頁,共118頁。第九十三頁,共118頁。第九十四頁,共118頁。第九十五頁,共118頁。第九十六頁,共118頁。樣本容量與抽樣分布的關系…….μxμxxf總體分布樣本分布抽樣分布誤差=|x-μx|nn>根據中心極限定理當n越大,樣本(參數)的抽樣分布越接近總體(參數)的真值。只用一個樣本估計,而不是用抽樣分布估計。△x△x[]第九十七頁,共118頁。估計誤差=△xμx
Zα/2(σ/n)=置信上(下)限置信區間置信水平=1-α(1)如果確定了置信區間,就可以確定估計誤差(邊際誤差)
。(2)如果確定了置信水平,就可以確定Zα/2。(3)如果確定了估計誤差和置信水平,再知道總體標準差σ,就可以求一定誤差范圍內和一定置信水平下所需要的樣本容量n。如果只知道置信區間,能否確定Zα/2?第九十八頁,共118頁。邊際誤差可靠性系數不重復抽樣時求樣本容量n的公式(P123)。3.意義?第九十九頁,共118頁。樣本容量n與總體方差σ2之間的關系=μxn=5σ=0μxσ=0n=10……σ→0μx1x2x3x4x5x1=x2=x3=x4=x5=……=μx總體方差越小,需要的樣本容量越小。總體分布樣本分布抽樣分布第一百頁,共118頁。樣本容量n與邊際(估計)誤差E的關系△x△x△x△x誤差越大,落入誤差范圍的樣本(參數)越多,如果縮小誤差,只有加大樣本容量,使抽樣分布變窄,才能使同樣多的樣本落入誤差范圍內。1-α1-α1-α1-αn
=
n△x>
△x1-α>1-αn<
n△x>
△x1-α=1-α△x△x△x△x誤差越大,置信水平越大第一百零一頁,共118頁。樣本容量n與可靠性系數(Z或t)的關系估計誤差=△xμx
Zα/2(σ/n)=置信上(下)限置信區間置信水平=1-α△x△xα/2α/2△x=
△xα/2>α/2Zα/2
<Zα/2n<
n
查正態分布表或t分布表可知,Z或t越大,α越小。若置信區間(誤差范圍)不變,加大Z,則σ/√n變小(或α變小),n就要變大,抽樣分布曲線就要變窄。實際上是n和α或1-α的關系。n越大,可靠性越大。第一百零二頁,共118頁。(100-115)0~0.94(σ=16)0~0.75(σ=20)Z=115-10020=0.75115B20x115A16x1151151z0同樣的值或誤差范圍邊界(115),變成標準正態分布后是不一樣的z值。第一百零三頁,共118頁。第一百零四頁,共118頁。第一百零五頁,共118頁。第一百零六頁,共118頁。第一百零七頁,共118頁。第一百零八頁,共118頁。第一百零九頁,共118頁。例1:某零件加工企業生產一種螺絲釘,對某天加工的零件每隔一定時間抽出一個,共抽出12個,測得長度(單
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生態農業廠房租賃安全及環保標準合同
- 生態旅游區施工現場勞務合作合同
- 潮汕職院劉艷紅參賽作品教育推廣與合作合同
- 住宅小區拆遷安置補償合同范本
- 車輛快遞運輸與環保服務協議
- 企業內部培訓2024-2025學年發展計劃
- 智能設備行業數字化轉型與政策監管研究-洞察闡釋
- 餐廳廚師勞動合同(含技術考核)
- 高新技術產業園區車位租賃與智能充電服務合同
- 拆除工程安全施工及質量保證協議
- 駕駛員勞務派遣投標方案
- 稀土生產工藝流程圖礦的開采技術
- 教育學 綜合實踐活動
- 地基釬探技術交底
- PE管道熱熔施工技術交底
- 經濟合同審批會簽單
- 人教版四年級數學下冊:第八單元:統計 單元測試卷(含答案)
- 電商售后客服試用期考核表范本
- 2023年四川省水電投資經營集團普格電力有限公司招聘筆試題庫含答案解析
- JGJ106-2014 建筑基樁檢測技術規范
- 2023屆湖北省武漢市東湖高新區數學六年級第二學期期末綜合測試試題含解析
評論
0/150
提交評論