




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2022-5-191第五章 抽樣推斷2022-5-192n第一節 總體參數估計n第二節 樣本容量的確定n第三節 總體參數檢驗第五章 統計推斷2022-5-193 學習目標n1.掌握估計量的優良標準n2.參數區間估計的思想與方法n3.參數假設檢驗的臨界值法與P值法n4.一定條件下,樣本容量確定的方法2022-5-194 重點與難點n1.參數區間估計的統計思想n2.估計的可靠程度、平均誤差及極限誤差的關系n3.臨界值檢驗法的統計思想n4.P值的計算方法及其含義的理解n5.參數抽樣檢驗中的兩類錯誤及其關系2022-5-195抽樣平均誤差與抽樣極限誤差n抽樣平均誤差是指所有可能出現的樣本指標(樣本平均
2、數或樣本成數或樣本方差、標準差等)的標準差,也可理解為所有樣本指標和總體指標之間的平均離差。n抽樣實際誤差是指某一次具體抽樣的過程中所得樣本指標值與總體指標數值之差。n抽樣極限誤差:樣本統計量與總體參數之間的抽樣實際誤差的可允許范圍。2022-5-196抽樣平均誤差與抽樣極限誤差n抽樣平均誤差xx樣本配合總數2xnnn重復抽樣n不重復抽樣21xNnnNn抽樣平均誤差 未知時,可用下面方法解決:(1)用過去資料或同類地區資料代替;(2)用 代替。2和2s2022-5-197抽樣平均誤差與抽樣極限誤差n抽樣極限誤差xxX n極限誤差除以抽樣平均誤差得到的相對數t,我們稱之為概率度。xxxxtt n
3、與置信度密切相關。問題是:我們希望得到一個精確度較高的樣本,同時又希望置信度較高。當然,這是不可能的。2022-5-198例1:某商場從一批袋裝食品中隨機抽取10袋,測得每袋重量(單位:克)分布為:789/780/794/762/802/813/770/785/810/806。假設每袋重量服從正態分布,以95%的把握程度估計這批產品的平均每袋重量時,允許誤差是多少?解:樣本平均數=791.1(克)樣本標準差=17.136 (克)抽樣平均誤差=5.42 (克)已知把握程度為95%,查表得t=2.2622所以允許誤差=2.26225.42=12.26 (克)2022-5-199 第一節 總體參數估
4、計n一、點估計n1.點估計的定義n2.點估計量的優良標準n二、區間估計n1.區間估計的定義n2.總體均值的區間估計2022-5-1910 一、點估計(1)n1.參數估計按是否考慮估計誤差的大小及發生的概率,估計方法分為點估計和區間估計兩大類。 n2.點估計的定義 n3.點估計不考慮估計誤差的大小,故不需確定估計量的概率分布。點估計的主要作用是尋找參數的估計量。 2022-5-1911 一、點估計(2)n點估計量的評價標準 n1.無偏性2022-5-1912n一般來說,無偏估計量并不唯一,甚至可以是無限多個。n如果 是參數的無偏估計量,但 通常不是 g( )的無偏估計量。如:( )g2ss是總體
5、方差的無偏估計量,但 不是 的無偏估計量。2XX是總體均值 的無偏估計量,但不是 的無偏估計量。2022-5-1913 一、點估計(3)n2.有效性 2022-5-1914n無偏估計量使用方差作為評判標準。n有偏估計量使用均方誤差 作為優劣的評判標準,即總體參數的兩個點估計量 滿足 ,則稱在均方誤差意義下12、2212EE12優于2211EEEE 222EEEEE E 2DE E 2MSEE 均方誤差包括兩部分:可見, 為未知參數的無偏估計時, 。均方誤差越小則估計量 的誤差平均越小,因而也越優。20E E 2022-5-1915 一、點估計(4)n3.一致性 2022-5-1916 二、區間
6、估計(1)n1.區間估計的含義 n在概率意義下計算參數 的變化范圍,即n2.區間估計中的兩個基本要求n q121Pqqqa=-2022-5-1917 二、區間估計(2)n3.Neyman原則n4.區間估計中的一些名詞2022-5-1918 二、區間估計(3)n5.區間估計時應考慮的一些具體問題2022-5-1919二、區間估計(4)總體均值的區間估計 n1.正態總體、總體方差已知;或非正態總體、大樣本 2022-5-1920 二、區間估計(5)總體均值的區間估計n2正態總體、總體方差未知、小樣本 2022-5-1921 二、區間估計(6)總體成數的區間估計 n只討論大樣本情形2022-5-19
7、22 二、區間估計(7)總體方差的區間估計2022-5-1923 二、區間估計(8)n根據上述例子,區間估計的步驟可歸納為:n(1)依題意確定待估參數;n(2)依題設條件構造與待估參數相對應的估計量;n(3)確定估計量的抽樣分布;n(4)依估計量的抽樣分布,由給定的置信度計算待估參數置信區間的上、下限。2022-5-1924例:某企業生產某種產品的工人有500人,為了了解工人生產產品的日產量資料,隨機抽取了36人進行調查。調查結果,人均日產量為25件,標準差為3件。試問:有多大的把握程度可推斷該企業日總產量在12000件13000件之間。解:抽樣平均誤差=0.5工人日均產量:2426件t=1/
8、0.5=2查表得:1-=0.95452022-5-1925例:軍隊戰士的身高服從正態分布。經抽取100個戰士,測得平均身高175cm,標準差40cm?,F在軍服廠要裁制1萬套軍服,問身高在171179cm之間應裁制多少套?解:抽樣平均誤差=4cm身高在171179cm的概率度t=4/4=1查表,得 1-=0.8413+(1-0.8413)=0.6826應裁制0.682610000=6826(套)2022-5-1926 第二節 樣本容量的確定n一、問題的提出n二、處理問題的原則n三、簡單隨機抽樣下,調查成本既定時樣本容量確定的方法2022-5-1927 第二節 樣本容量的確定 (1)一、問題的提出
9、n從推斷來看,要達到估計所要求的精確程度,自然要求樣本容量越大越好;但從抽樣來看,增大樣本容量,勢必增加人力、物力,從而導致調查成本增大,這無疑是不經濟的做法。于是在抽樣推斷中,勢必要在統計推斷的精確度與調查成本這一對矛盾間進行權衡。 2022-5-1928 第二節 樣本容量的確定 (2)n二、處理問題的原則 n1.從抽樣角度來看,處理推斷目標實現的精確度與調查成本間矛盾的原則是:在保證達到推斷目標的要求下,盡量使調查成本最低。 n2.從推斷角度來看,處理統計推斷精確度與調查成本間矛盾的原則是:在調查成本一定的情況下,盡量使推斷目標實現的效果好,即估計的精度更高。 n3.抽樣設計中樣本容量的確
10、定通常按推斷原則處理。 2022-5-1929 第二節 樣本容量的確定 (3)n三、簡單隨機抽樣下、調查成本既定時,樣本容量的確定方法 n1. 總體均值估計情形2022-5-1930 第二節 樣本容量的確定 (4)2022-5-1931其他抽樣組織方式的抽樣誤差n常見的抽樣組織形式主要有:純隨機抽樣、機械抽樣、類型抽樣、整群抽樣、多階段抽樣。2022-5-1932純隨機抽樣,即簡單隨機抽樣,是指對總體不作任何處理,不進行分類也不進行排隊,而是完全按照隨機的原則,直接從總體全部單位中抽選出樣本單位加以觀察。 具體方法有:直接抽選法、抽簽法、隨機數字表述法 特點:總體每一個單位被抽到的機會均等,且
11、方便簡單,易于掌握。 適用于總體單位的標志變異程度不大,或具有某種特征的單位均勻地分布在總體的各個部分,或對總體了解很少的情況。2022-5-1933分層抽樣,即類型抽樣或分類抽樣,是指將總體各單位按主要標志加以分層,而后在各層中按隨機原則抽取若干個樣本單位,由各層的樣本單位組成一個樣本。n 先分層,再在各層總體中隨機抽取一定的單位數。 特點:1)能提高樣本的代表性;2)能降低總體方差對抽樣平均誤差的影響。 適用對總體有一定認識的情況。從各層抽取樣本單位時,可以根據各層的單位數等比例抽樣,也可以是不等比例抽樣。等比例抽樣就是從各層中按相同的比例抽取樣本單位數。樣本單位在各層的分配比例同總體單位
12、在各層的分配比例相同。不等比例抽樣就是從方差較大的組抽取較多的樣本單位數,反之少抽一些。目的是減少抽樣誤差,提高樣本指標的代表性。2022-5-1934分層抽樣的抽樣誤差計算公式分層抽樣的抽樣誤差計算公式項目重復抽樣不重復抽樣平均數的抽樣誤差公式成數的抽樣誤差公式2ixn21ixnnN1pppn11pppnnN2022-5-1935例題:某地全部糧食耕地5000公頃,按平原和山區面積比例抽取樣本容量100公頃,各層平均每公頃產量和標準差如表。試用重復抽樣方法計算抽樣誤差。地形全部面積抽樣面積抽樣平均每公頃產量每公頃產量標準差平原4000807200600山區10002056251000合計50
13、00100-單位:公頃,公斤2022-5-1936解:平均層內方差:采用重復抽樣方法計算抽樣誤差,則:所以,抽樣誤差為69.86公斤。222260080 100020488000100iinn248800069.86100ixn2022-5-1937等距抽樣,即機械抽樣或系統抽樣,是指將總體各單位按某一標志排隊,而后按固定順序和相等間隔在總體中抽取若干樣本單位,構成樣本。n 先排隊,再計算抽樣間隔d,然后等距抽樣。 特點:保證樣本單位在總體中均勻分布,從而提高了樣本對總體的代表性,利于降低抽樣誤差。 適用對總體有一定認識的情況。按排隊依據的標志是否與所要調查的標志關,可分為無關標志排隊法和有關
14、標志排隊法。2022-5-1938按樣本單位抽選的方式不同,分為隨機起點等距抽樣、半距起點等距抽樣和對稱等距抽樣。抽樣誤差與分層抽樣類似。2022-5-1939例題:設有15個單位,已知其職工的月人均收入,并按順序進行了排列,如表所示?,F按等距抽樣法從中抽取了5個單位進行調查,要求計算抽樣平均誤差。解:間隔距離=15/5=3223.47223.475111.8515ixnnN2022-5-1940整群抽樣,是指將總體各單位劃分為若干群,然后以群為單位,從總體中。n 劃分群, 抽取群單位。 特點:設計和組織抽樣較方便;誤差大,抽樣估計精度較低。平均數的抽平均誤差:成數的抽平均誤差:21ppRrr
15、R21xxRrrR2022-5-1941n例題:某化肥廠晝夜連續生產,每分鐘產量為100袋,現在采用整群抽樣來檢驗一晝夜生產的化肥每袋的重量和包裝的一等品率,每144分鐘抽取1分鐘的全部袋裝化肥進行檢查,工抽檢10分鐘的袋裝化肥,結果如表。以95%的置信水平推斷該廠一晝夜生產的化肥平均每袋重的可能范圍和包裝一等品率的可能范圍。解:R=1440,r=10,已知1-=95%,所以t=1.9650.2ixxr22()0.094ixxxr20.0971xxRrrR0.19xxt 2022-5-1942平均袋重在50.0150.39公斤之間。70%ippr22()0.048%ipppr20.69%1pp
16、RrrR1.35%ppt 包裝一等品率在68.65%71.35%之間。2022-5-1943多階段抽樣,總體很大時,將抽樣過程劃分為幾個過渡階段,到最后才具體抽到樣本單位。n 先一階單位,再抽二階單位,。 特點:利于抽樣的組織和實施,可以提高抽樣估計精度和滿足各階段對調查資料的要求。 抽樣誤差是各階段抽樣誤差之和。2212如兩階段抽樣,其抽樣誤差為:2022-5-1944n例題:某校學生月生活費支出情況調查采用兩階段抽樣方式。將1000名學生分為10群,每群包括100名學生,先從10群中抽出5群,即以群為第一階段的抽取單位;然后從抽中的各群中抽取3%的學生組成樣本,樣本資料如表,求抽樣平均誤差
17、。n解:第一階段群內方差平均數:266i第二階段群間方差為:210666抽樣平均誤差為:2210666 10566 100334.4911510 115 100 1ixRrMmrRnM2022-5-1945 第三節 總體參數檢驗n一、假設檢驗的一般性問題n1.問題的提出n2.解決問題的統計思想n3.統計結論的兩類錯誤n4.單、雙側檢驗問題n5.P值檢驗法n6.統計檢驗的顯著性n7.假設檢驗的步驟n二、幾種常用、具體的參數檢驗方法n1.Z檢驗法; 2.T檢驗法n3. 檢驗法 4.F檢驗法2c2022-5-1946 一、假設檢驗的一般性問題(1)n(一) 問題的提出 2022-5-1947 一、假
18、設檢驗的一般性問題(2)n(二) 解決問題的統計思想 2022-5-1948 一、假設檢驗的一般性問題(3)2022-5-1949 一、假設檢驗的一般性問題(4)2022-5-1950 一、假設檢驗的一般性問題(5)n上述的判斷實際上體現著反證法的思想。判斷的基礎是樣本信息,判斷的理論依據是小概率原理,即小概率事件在一次試驗(或抽樣)中幾乎不發生。直觀來想,在所做假設是正確的情況下,那么一次試驗(或抽樣)中人們期望的結果出現的概率應該較大。然而現在的事實卻不是這樣的,期望的結果出現的概率不僅不大,反而很小,即所謂的小概率事件居然發生了,這就很不正常了,意味著一次試驗(或抽樣)中出現了出人意料的
19、結果,也意味著給了我們做出否定原假設的充分證據??梢娂僭O檢驗的思想是從不利于原假設的角度來對原假設做決策的。因此,當我們拒絕原假設時,并不意味著原假設一定是錯誤的,只是說概率意義下接受原假設的理由很不充分,而否定原假設的證據卻非常強。這與數學家“證明”某個結論的方式不同,而有點兒類似于法院里法官的判案方式。并且只要小概率 不等于零,對原假設做決策就可能錯判,存在做出錯誤選擇的風險。a2022-5-1951 一、假設檢驗的一般性問題(6)2022-5-1952 一、假設檢驗的一般性問題(7)n臨界值檢驗法示意圖 2022-5-1953 一、假設檢驗的一般性問題(8)n (三) 單、雙側檢驗問題n
20、因H1的選擇所引起并由H1的具體形式所決定。00100100010:0000對H 做雙側檢驗對H 做右側檢驗對H 做左側檢驗HHHHHHmmmmmmmmmmmm=2022-5-1954 一、假設檢驗的一般性問題(9)n(四) 統計結論的兩類錯誤n1.兩類錯誤的原因樣本的隨機性n2.2022-5-1955 一、假設檢驗的一般性問題(10)2022-5-1956 一、假設檢驗的一般性問題(11)2022-5-1957接受原假設拒絕原假設原假設H0為真判斷正確1-棄真錯誤原假設H0為偽取偽錯誤判斷正確1-假設檢驗中各種可能結果及其發生概率假設檢驗中各種可能結果及其發生概率2022-5-1958一、假
21、設檢驗的一般性問題(12)n兩類錯誤的關系2022-5-19592022-5-1960一、假設檢驗的一般性問題(13)n兩類錯誤的控制原則2022-5-1961 一、假設檢驗的一般性問題(14)n(五) P值檢驗法(概率值檢驗法)n1.2022-5-1962 一、假設檢驗的一般性問題(15)nP值的計算方法2022-5-1963 一、假設檢驗的一般性問題(16)nP值拒絕H0的力度2022-5-1964 一、假設檢驗的一般性問題(17)nP值檢驗法的決策規則 2022-5-1965 一、假設檢驗的一般性問題(18)n(六) 統計檢驗的顯著性2022-5-1966 一、假設檢驗的一般性問題(19
22、)n(七) 假設檢驗的步驟 2022-5-1967二、幾種常用、具體的參數檢驗方法2022-5-1968 Z 檢驗法(1)nZ檢驗法是在已知總體分布的方差時,對一個正態總體的均值或兩個正態總體均值的關系(均值之差)進行檢驗的方法。Z檢驗法也可用于大樣本下非正態總體的成數檢驗。 2022-5-1969 Z 檢驗法(2)n1一個正態總體均值的檢驗 n所提的假設n所構造的檢驗量0XZnms-=2022-5-1970 Z 檢驗法(3)2022-5-1971 Z 檢驗法(4)n2兩個正態總體均值之差的檢驗n所提的假設n所構造的檢驗量() ()1212221212xxZnnmmss-=+2022-5-1972 Z 檢驗法(5)2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論