




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統計學統計學主要內容主要內容參數估計的基本理論參數估計的基本理論一個總體的區間估計一個總體的區間估計兩個總體的區間估計兩個總體的區間估計樣本容量的確定樣本容量的確定重點重點總體均值、比率的區間估計總體均值、比率的區間估計統計學統計學樣樣本本總體總體樣本統計量樣本統計量如:樣本均值如:樣本均值、比率、方差、比率、方差總體均值、比總體均值、比率、方差等率、方差等統計學統計學 有合適的統計量作為估計量有合適的統計量作為估計量 有合理的允許誤差范圍有合理的允許誤差范圍 有一個可以接受的置信度有一個可以接受的置信度 總體和樣本總體和樣本 參數及統計量參數及統計量 樣本容量和樣本個數樣本容量和樣本個數 重
2、復抽樣和不重復抽樣重復抽樣和不重復抽樣 點估計和區間估計點估計和區間估計統計學統計學參數估計在統計方法中的地位參數估計在統計方法中的地位參數估計參數估計假設檢驗假設檢驗統計方法描述統計描述統計推斷統計推斷統計統計學統計學如樣本均值,樣本比率、樣本方差等如樣本均值,樣本比率、樣本方差等例如例如: 樣本均值就是總體均值樣本均值就是總體均值 的一個估計量的一個估計量如果樣本均值如果樣本均值 x =80,則,則80就是就是 的估計值的估計值統計學統計學估估 計計 方方 法法點點 估估 計計區間估計區間估計統計學統計學點估計點估計 例如:用樣本均值直接例如:用樣本均值直接作為作為總體均值的估計總體均值的
3、估計例如:用兩個樣本均值之差直接例如:用兩個樣本均值之差直接作為作為總體均值總體均值之差的估計之差的估計統計學統計學無偏性無偏性 (unbiasedness)無偏性:估計量抽樣分布的數學期望等于被估計量抽樣分布的數學期望等于被 估計的總體參數估計的總體參數 統計學統計學有效性有效性 (efficiency)有效性:有效性:對同一總體參數的兩個無偏點估計對同一總體參數的兩個無偏點估計 量,有更小標準差的估計量更有效量,有更小標準差的估計量更有效的抽樣分布的抽樣分布的抽樣分布的抽樣分布統計學統計學一致性:一致性:較小的樣本容量較小的樣本容量較大的樣本容量較大的樣本容量統計學統計學比如,某班級平均分
4、數在比如,某班級平均分數在7585之間,置信水平是之間,置信水平是95% 樣本統計量樣本統計量 (點估計點估計)置信下限置信下限置信上限置信上限統計學統計學區間估計的圖示區間估計的圖示95% 的樣本的樣本99% 的樣本的樣本 - 2.58 x +2.58 x90%的樣本的樣本 -1.65 x +1.65 x統計學統計學 為是總體參數為是總體參數未在未在區間內的比率區間內的比率 相應的相應的 為為0.01,0.05,0.10置信水平置信水平 統計學統計學由樣本統計量所構造的總體參數的估計由樣本統計量所構造的總體參數的估計區間稱為置信區間區間稱為置信區間2. 統計學家在某種程度上確信這個區間會統計
5、學家在某種程度上確信這個區間會包含真正的總體參數,所以給它取名為置包含真正的總體參數,所以給它取名為置信區間信區間 3. 用一個具體的樣本所構造的區間是一個用一個具體的樣本所構造的區間是一個特定的區間,我們無法知道這個樣本所產特定的區間,我們無法知道這個樣本所產生的區間是否包含總體參數的真值生的區間是否包含總體參數的真值我們只能是希望這個區間是大量包含總體我們只能是希望這個區間是大量包含總體參數真值的區間中的一個,但它也可能是參數真值的區間中的一個,但它也可能是少數幾個不包含參數真值的區間中的一個少數幾個不包含參數真值的區間中的一個置信區間置信區間(confidence interval)統計
6、學統計學置信區間與置信水平置信區間與置信水平樣本均值的抽樣分布樣本均值的抽樣分布統計學統計學總體數據的離散程度,總體數據的離散程度,用用 來測度來測度樣本容量,樣本容量,置信水平置信水平 (1 - ),影響,影響 z 的大小的大小統計學統計學 不對總計作任何加工整理,從整體中抽取調查不對總計作任何加工整理,從整體中抽取調查單位。單位。 最基本的抽樣形式,理論上最符合隨機性原則。最基本的抽樣形式,理論上最符合隨機性原則。 首先將總體按某一標志排序,然后按固定順序首先將總體按某一標志排序,然后按固定順序和相同間隔來抽取樣本單位。和相同間隔來抽取樣本單位。 分為按有關標志排序和按無關標志排序分為按有
7、關標志排序和按無關標志排序 樣本更均勻地分布在總體中。樣本更均勻地分布在總體中。統計學統計學 先將總體按某一有關標志分組,再按簡單隨機先將總體按某一有關標志分組,再按簡單隨機抽樣或機械抽樣的方式從各組中抽取樣本單位。抽樣或機械抽樣的方式從各組中抽取樣本單位。 把統計分組與抽樣原理有機結合,提高了樣本把統計分組與抽樣原理有機結合,提高了樣本的代表性。的代表性。 先將總體劃分為若干個群,再以群為單位,從先將總體劃分為若干個群,再以群為單位,從總體中抽取部分群進行全面調查總體中抽取部分群進行全面調查 工作量小,適用于大規模抽樣調查。工作量小,適用于大規模抽樣調查。統計學統計學大樣本估計(大樣本估計(
8、n30)正態分布正態分布小樣本估計(小樣本估計(n30)t分布分布樣本足夠大樣本足夠大正態分布正態分布卡方分布卡方分布統計學統計學 具體樣本估計值與總體參數真值之間的離差。具體樣本估計值與總體參數真值之間的離差。表達式為:表達式為: 所有可能樣本估計量的標準差定義為抽樣平均誤差所有可能樣本估計量的標準差定義為抽樣平均誤差公式為:公式為: 在一定概率下抽樣誤差的可能范圍在一定概率下抽樣誤差的可能范圍表達式為:表達式為: 樣本個數樣本個數2 t 統計學統計學一個總體參數的區間估計一個總體參數的區間估計總體參數總體參數符號表示符號表示樣本統計量樣本統計量2統計學統計學總體均值的區間估計總體均值的區間
9、估計 (大樣本大樣本)假定條件假定條件總體服從正態分布總體服從正態分布, ,且方差且方差( ) 未知未知如果不是正態分布,可由正態分布來近似如果不是正態分布,可由正態分布來近似 (n 30)2. 使用正態分布統計量使用正態分布統計量 z總體均值總體均值 在在1- 置信水平下的置信水平下的置信區間為置信區間為統計學統計學統計學統計學【 例例 】一家食品生產企業以生產袋裝食品為主,為對產量質量進一家食品生產企業以生產袋裝食品為主,為對產量質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取了合
10、要求。現從某天生產的一批食品中隨機抽取了25袋,測得每袋袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布,且總體標重量如下表所示。已知產品重量的分布服從正態分布,且總體標準差為準差為10g。試估計該批產品平均重量的置信區間,置信水平為。試估計該批產品平均重量的置信區間,置信水平為95%25袋食品的重量袋食品的重量112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3統計學統計學解:解:已知已
11、知N( ,102),n=25, 1- = 95%,z /2=1.96根據資料計算樣本均值為:根據資料計算樣本均值為: 總體均值總體均值 在在1- 置信水平下的置信區間為:置信水平下的置信區間為:該食品平均重量的置信區間為該食品平均重量的置信區間為101.44g109.28g統計學統計學【例】【例】一家保險公司收集到由一家保險公司收集到由36投保個人組成的隨機樣投保個人組成的隨機樣本,得到每個投保人的年齡本,得到每個投保人的年齡(周歲周歲)數據如下表。試建立數據如下表。試建立投保人年齡投保人年齡90%的置信區間的置信區間36個投保人年齡的數據個投保人年齡的數據統計學統計學解:解:已知已知n=36
12、, 1- = 90%,z /2=1.645根據資料計算樣本均值和標準差為:根據資料計算樣本均值和標準差為:總體均值總體均值 在在1- 置信水平下的置信區間為:置信水平下的置信區間為:投保人平均年齡的置信區間為投保人平均年齡的置信區間為37.37歲歲41.63歲歲統計學統計學假定條件假定條件 總體服從正態分布總體服從正態分布, ,且方差且方差( ) 未知未知 小樣本小樣本 (n 30)2. 使用使用 t 分布統計量分布統計量總體均值總體均值 在在1- 置信水平下的置信水平下的置信區間為置信區間為統計學統計學t 分布是類似正態分布的一種對稱分布,它通常要比正態分布是類似正態分布的一種對稱分布,它通
13、常要比正態分布平坦和分散。一個特定的分布依賴于稱之為自由度的分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數。隨著自由度的增大,分布也逐漸趨于正態分布參數。隨著自由度的增大,分布也逐漸趨于正態分布t 分布與標準正態分布的比較分布與標準正態分布的比較t 分布分布標準正態分標準正態分布布不同自由度的不同自由度的t分布分布標準正態分布標準正態分布t (df = 13)t (df = 5)統計學統計學總體均值的區間估計總體均值的區間估計 (例題分析例題分析)【例】已知某種燈泡的壽命服從正態分布,現從一批燈已知某種燈泡的壽命服從正態分布,現從一批燈泡中隨機抽取泡中隨機抽取16只,測得其使用壽命只,
14、測得其使用壽命(小時小時)如下。建立如下。建立該批燈泡平均使用壽命該批燈泡平均使用壽命95%的置信區間的置信區間16燈泡使用壽命的數據燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470統計學統計學解:解:已知已知N( , 2),n=16, 1- = 95%,t /2=2.131 根據資料計算樣本均值和標準差為:根據資料計算樣本均值和標準差為: 總體均值總體均值 在在1- 置信水平下的置信區間為置信水平下的置信區間為平均使用壽命的置信區間為平均使用壽命的置信區間為1476.81503.2小時。小時。統
15、計學統計學假定條件假定條件總體服從二項分布總體服從二項分布可以由正態分布來近似可以由正態分布來近似2. 使用正態分布統計量使用正態分布統計量 z:3. 總體比率總體比率 在在1- 置信水平下置信水平下的置信區間為:的置信區間為:統計學統計學【 例 】 某 城某 城市 想 要 估 計市 想 要 估 計下 崗 職 工 中下 崗 職 工 中女 性 所 占 的女 性 所 占 的比 率 , 隨 機比 率 , 隨 機地抽取了地抽取了100名 下 崗 職 工名 下 崗 職 工,其中,其中65人人為 女 性 職 工為 女 性 職 工。試以。試以95%的 置 信 水 平的 置 信 水 平估 計 該 城 市估 計
16、 該 城 市下 崗 職 工 中下 崗 職 工 中女 性 比 率 的女 性 比 率 的置信區間置信區間解:解:已知已知 n=100,p65% , 1- = 95%,z /2=1.96該城市下崗職工中女性比率的置信該城市下崗職工中女性比率的置信區間為區間為55.65%74.35% 統計學統計學假設條件:總體服從正態分布假設條件:總體服從正態分布樣本方差的抽樣分布服從自由度為樣本方差的抽樣分布服從自由度為(n-1)的)的 分布分布 分布不是對稱分布分布不是對稱分布總體方差的點估計為:總體方差的點估計為: 使用使用2 2檢驗統計量檢驗統計量: : 22nnS/12222/222/1統計學統計學待估計參
17、數待估計參數均均 值值比比 率率方方 差差大樣本大樣本小樣本小樣本Z分布分布2 2已知已知2 2未知未知Z分布分布t分布分布大樣本大樣本Z分布分布卡方分布卡方分布統計學統計學兩個總體參數的區間估計兩個總體參數的區間估計兩個總體參數估計主要研究問題:兩個總體參數估計主要研究問題:均值之差、比率之差、方差之比均值之差、比率之差、方差之比兩個總體均值之差的區間估計兩個總體均值之差的區間估計獨立大樣本的估計獨立大樣本的估計獨立小樣本的估計獨立小樣本的估計配對樣本的估計配對樣本的估計兩個總體比率之差的區間估計兩個總體比率之差的區間估計兩個總體方差的區間估計兩個總體方差的區間估計統計學統計學 獨立大樣本:
18、獨立大樣本:n130,n230 獨立小樣本:獨立小樣本:n130,n2302121統計學統計學21222121nn 2221212121nnxxZ 2221212/21212221212/21nnzxxnnzxx統計學統計學統計學統計學52. 1332 . 7468 . 52222212121nSnSxx811812621 xx97. 252. 196. 121212xxxxz97. 2897. 282197.1003. 521統計學統計學2121211212222121nnSnSnSp 21212111nnSxxtp 212nn2/212121p2nn2/21n1n1n1n12121pStx
19、xStxx統計學統計學例:例:為估計兩種方法為估計兩種方法組裝產品速度的差異,組裝產品速度的差異,分別對兩組不同的組分別對兩組不同的組裝方法各隨機抽取裝方法各隨機抽取12名工人,每個工人組名工人,每個工人組裝所需的時間如表所裝所需的時間如表所示。假定兩種方法組示。假定兩種方法組裝產品的時間服從正裝產品的時間服從正態分布,且方差相等。態分布,且方差相等。試以試以95%的置信水平的置信水平建立兩種方法組裝產建立兩種方法組裝產品所需平均時間差的品所需平均時間差的置信區間。置信區間。統計學統計學8 .285 .3221xx;358.19S996.15S2221;677.1721212358.19112
20、996.15112211212222121nnSnSnSp56. 3121121677.17074. 211212222121nnSttpxxxx7 . 321 xx56. 37 . 356. 37 . 3217.260.1421統計學統計學兩個總體方差未知但不等,即兩個總體方差未知但不等,即 則兩個樣本均值之則兩個樣本均值之差經過標準化后近視服從自由度為差經過標準化后近視服從自由度為v的的t分布。分布。自由度的計算:自由度的計算:兩個總體均值差的置信區間兩個總體均值差的置信區間211/1/22222121212222121nnsnnsnsnsv 222121v2/2121222121v2/2
21、1SStSStnnxxnnxx統計學統計學例:例:同樣為估計兩種同樣為估計兩種方法組裝產品速度的方法組裝產品速度的差異,第一種方法安差異,第一種方法安排排12人,第二種方法人,第二種方法安排安排8人,每個工人人,每個工人組裝所需的時間如表組裝所需的時間如表所示。假定兩種個總所示。假定兩種個總體的方差不相等。試體的方差不相等。試以以95%的置信水平建的置信水平建立兩種方法組裝產品立兩種方法組裝產品所需平均時間差的置所需平均時間差的置信區間。信區間。統計學統計學875.275 .3221xx;014.23S996.15S2221;625. 421 xx188.13188014.2311212996
22、.158014.2312996.151/1/2222222121212222121nnsnnsnsnsv05.28014.2312996.1522212121nSnSxx433. 4625. 4433. 4625. 421433. 405. 216. 205. 2t13205. 022121xxxxt058. 9192. 021統計學統計學nzdnz-dd221d2差的均值差的均值差值標準差差值標準差nStdnt -dd221d2統計學統計學53. 61nddS11ddd 67. 41053. 62622. 210Std92例:例:由由10名同名同學組成樣本,學組成樣本,讓他們分別采讓他們分別
23、采用用A和和B兩套兩套試題進行測試,試題進行測試,結果如表所示。結果如表所示。假定兩套試卷假定兩套試卷分數之差服從分數之差服從正態分布,試正態分布,試建立兩種試卷建立兩種試卷平均分之差的平均分之差的置信區間置信區間。計算:計算:極限誤差:極限誤差:置信區間置信區間67.156.3321統計學統計學誤差2121pp 2221112121n1n1ppZ222111221np1pnp1pZpp統計學統計學%13pp21%22. 3400%68%32500%55%45例:例:對電視節目收視率的調查,在農村調查對電視節目收視率的調查,在農村調查400人,有人,有32%的人收看電視節目;在城市調查的人收看
24、電視節目;在城市調查500人,有人,有45%的的人收看該節目。要求估計城市與農村電視收視率差的人收看該節目。要求估計城市與農村電視收視率差的95%置信區間。置信區間。解:城市收視率45%,農村收視率32%,則抽樣平均誤差:收視率差的95%置信區間:即城市與農村電視節目收視率差的置信區間為:6.68%,19.32%22. 396. 1%13%22. 396. 1%1321統計學統計學2221F21222122221FSSFFSS統計學統計學樣本容量的確定樣本容量的確定影響樣本容量的因素影響樣本容量的因素總體中各單位間的離散程度總體中各單位間的離散程度抽樣允許的誤差范圍抽樣允許的誤差范圍抽樣推斷的
25、可靠程度抽樣推斷的可靠程度抽樣方法和抽樣的組織方式抽樣方法和抽樣的組織方式估計總體均值時樣本容量的確定估計總體均值時樣本容量的確定估計比率時樣本容量的確定估計比率時樣本容量的確定統計學統計學 離散程度大(方差大)離散程度大(方差大)樣本代表性小樣本代表性小樣本容量樣本容量大大 允許誤差范圍允許誤差范圍=抽樣極限誤差抽樣極限誤差反映估計精度反映估計精度 允許誤差范圍小允許誤差范圍小要求估計精度高要求估計精度高樣本容量大樣本容量大 推斷的可靠度推斷的可靠度=置信度置信度 可靠度高可靠度高樣本容量大樣本容量大 組織方式的樣本代表性高組織方式的樣本代表性高抽樣誤差小抽樣誤差小樣本容量樣本容量小小 重復
26、抽樣比不重復抽樣樣本容量要大重復抽樣比不重復抽樣樣本容量要大統計學統計學其中:其中:222212221EZnn統計學統計學估計總體均值時樣本容量確定例估計總體均值時樣本容量確定例1【例】擁有工商管理學士學位的大學畢業生年薪的標準擁有工商管理學士學位的大學畢業生年薪的標準差大約為差大約為2000元,假定想要估計年薪元,假定想要估計年薪95%的置信區間,的置信區間,希望允許誤差為希望允許誤差為400元,應抽取多大的樣本容量?元,應抽取多大的樣本容量?解解: 已知已知 =2000,E=400, 1- =95%, z /2=1.96 應抽取的樣本容量為應抽取的樣本容量為即應抽取即應抽取97人作為樣本人作為樣本97400200096. 12222222Ezn統計學統計學估計總體均值時樣本容量確定例估計總體均值時樣本容量確定例2例:某校教務處預估計實驗班與普通班數學水平例:某校教務處預估計實驗班與普通班數學水平的差異程度,要求置信水平為的差異程度,要求置信水平為95%,預先估計兩,預先估計兩班考試分數的方差分別為:實驗班班考試分數的方差分別為:實驗班90、普通班、普通班120。要求估計誤差不超過。要求估計誤差不超過5分,在兩個班中應抽分,在兩個班中應抽取多少學生作為樣本。取多少學生作為樣本。解:已知解:已知1- =95%, 12 =90,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 機器設備租賃合同
- 酒店宴會廳租賃協議
- 2025年度金融公司合同保密協議模板
- 山西同文職業技術學院《醫學信息收集與信息處理》2023-2024學年第一學期期末試卷
- 邵陽工業職業技術學院《電路原理B》2023-2024學年第二學期期末試卷
- 物流司機雇傭合同
- 吉林省長春市“BEST合作體”2025屆高三第九次適應性考試英語試題含解析
- 佳木斯市東風區2024-2025學年五年級數學第二學期期末統考試題含答案
- 山東體育學院《網絡文學》2023-2024學年第二學期期末試卷
- 四川省自貢市富順縣2024-2025學年第二學期初三年級一模考試數學試題試卷含解析
- 國家開放大學《人文英語3》章節測試參考答案
- 中國暈厥診斷與治療專家共識(2014 )
- 長途大客車總布置設計
- Q∕GDW 10799.6-2018 國家電網有限公司電力安全工作規程 第6部分:光伏電站部分
- T∕CAAA 002-2018 燕麥 干草質量分級
- 一年級《20以內的加減法填括號口算題(共100道)》專項練習題
- 方格網計算步驟及方法
- 課題評分表(共1頁)
- 六年級趣味數學(課堂PPT)
- 詢價單(模板)
- 關于我縣二次供水調研報告
評論
0/150
提交評論