




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第7章參數估計作者:中國人民大學統計學院賈俊平PowerPoint統計學當前1頁,總共80頁。第7章參數估計7.1參數估計的一般問題7.2一個總體參數的區間估計7.3兩個總體參數的區間估計7.4樣本量的確定當前2頁,總共80頁。學習目標估計量與估計值的概念點估計與區間估計的區別評價估計量優良性的標準一個總體參數的區間估計方法兩個總體參數的區間估計方法樣本量的確定方法當前3頁,總共80頁。7.1參數估計的一般問題7.1.1估計量與估計值7.1.2點估計與區間估計7.1.3評價估計量的標準當前4頁,總共80頁。估計量與估計值當前5頁,總共80頁。估計量:用于估計總體參數的隨機變量如樣本均值,樣本比例,樣本方差等例如:樣本均值就是總體均值的一個估計量參數用表示,估計量用表示估計值:估計參數時計算出來的統計量的具體值如果樣本均值x
=80,則80就是的估計值估計量與估計值
(estimator&estimatedvalue)當前6頁,總共80頁。點估計與區間估計當前7頁,總共80頁。點估計
(pointestimate)用樣本的估計量的某個取值直接作為總體參數的估計值例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計無法給出估計值接近總體參數程度的信息雖然在重復抽樣條件下,點估計的均值可望等于總體真值,但由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值一個點估計量的可靠性是由它的抽樣標準誤差來衡量的,這表明一個具體的點估計值無法給出估計的可靠性的度量當前8頁,總共80頁。區間估計
(intervalestimate)在點估計的基礎上,給出總體參數估計的一個區間范圍,該區間由樣本統計量加減估計誤差而得到根據樣本統計量的抽樣分布能夠對樣本統計量與總體參數的接近程度給出一個概率度量比如,某班級平均分數在75~85之間,置信水平是95%
樣本統計量
(點估計)置信區間置信下限置信上限當前9頁,總共80頁。區間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x當前10頁,總共80頁。將構造置信區間的步驟重復很多次,置信區間包含總體參數真值的次數所占的比例稱為置信水平表示為(1-為是總體參數未在區間內的比例常用的置信水平值有99%,95%,90%相應的
為0.01,0.05,0.10置信水平
(confidencelevel)
當前11頁,總共80頁。由樣本統計量所構造的總體參數的估計區間稱為置信區間統計學家在某種程度上確信這個區間會包含真正的總體參數,所以給它取名為置信區間用一個具體的樣本所構造的區間是一個特定的區間,我們無法知道這個樣本所產生的區間是否包含總體參數的真值我們只能是希望這個區間是大量包含總體參數真值的區間中的一個,但它也可能是少數幾個不包含參數真值的區間中的一個總體參數以一定的概率落在這一區間的表述是錯誤的置信區間
(confidenceinterval)當前12頁,總共80頁。置信區間
(95%的置信區間)重復構造出的20個置信區間點估計值當前13頁,總共80頁。評價估計量的標準當前14頁,總共80頁。無偏性
(unbiasedness)無偏性:估計量抽樣分布的數學期望等于被估計的總體參數P(
)BA無偏有偏當前15頁,總共80頁。有效性
(efficiency)有效性:對同一總體參數的兩個無偏點估計量,有更小標準差的估計量更有效
AB的抽樣分布的抽樣分布P(
)當前16頁,總共80頁。一致性
(consistency)一致性:隨著樣本量的增大,估計量的值越來越接近被估計的總體參數AB較小的樣本量較大的樣本量P(
)當前17頁,總共80頁。7.2一個總體參數的區間估計7.2.1總體均值的區間估計7.2.2總體比例的區間估計7.2.3總體方差的區間估計當前18頁,總共80頁。一個總體參數的區間估計總體參數符號表示樣本統計量均值比例方差當前19頁,總共80頁。總體均值的區間估計
(正態總體、2已知,或非正態總體、大樣本)當前20頁,總共80頁??傮w均值的區間估計
(大樣本)1. 假定條件總體服從正態分布,且方差(2)已知如果不是正態分布,可由正態分布來近似(n
30)使用正態分布統計量z總體均值在1-置信水平下的置信區間為當前21頁,總共80頁??傮w均值的區間估計
(例題分析)【例】一家食品生產企業以生產袋裝食品為主,為對食品質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布,且總體標準差為10g。試估計該批產品平均重量的置信區間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3當前22頁,總共80頁??傮w均值的區間估計
(例題分析)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據樣本數據計算得:。由于是正態總體,且方差已知??傮w均值在1-置信水平下的置信區間為該食品平均重量的置信區間為101.44g~109.28g當前23頁,總共80頁。總體均值的區間估計
(例題分析)【例】一家保險公司收集到由36個投保人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數據如下表。試建立投保人年齡90%的置信區間36個投保人年齡的數據233539273644364246433133425345544724342839364440394938344850343945484532當前24頁,總共80頁??傮w均值的區間估計
(例題分析)解:已知n=36,1-=90%,z/2=1.645。根據樣本數據計算得:,
總體均值在1-置信水平下的置信區間為投保人平均年齡的置信區間為37.37歲~41.63歲當前25頁,總共80頁??傮w均值的區間估計
(正態總體、2未知、小樣本)當前26頁,總共80頁。總體均值的區間估計
(小樣本)1. 假定條件總體服從正態分布,但方差(2)
未知小樣本(n<30)使用t分布統計量總體均值在1-置信水平下的置信區間為當前27頁,總共80頁。t分布
t分布是類似正態分布的一種對稱分布,它通常要比正態分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數。隨著自由度的增大,分布也逐漸趨于正態分布xt
分布與標準正態分布的比較t分布標準正態分布t不同自由度的t分布標準正態分布t(df=13)t(df=5)z當前28頁,總共80頁??傮w均值的區間估計
(例題分析)【例】已知某種燈泡的壽命服從正態分布,現從一批燈泡中隨機抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區間16燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470當前29頁,總共80頁??傮w均值的區間估計
(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131根據樣本數據計算得:,
總體均值在1-置信水平下的置信區間為該種燈泡平均使用壽命的置信區間為1476.8h~1503.2h當前30頁,總共80頁??傮w比例的區間估計當前31頁,總共80頁。總體比例的區間估計1. 假定條件總體服從二項分布可以由正態分布來近似使用正態分布統計量z3.總體比例在1-置信水平下的置信區間為當前32頁,總共80頁。總體比例的區間估計
(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區間為55.65%~74.35%
當前33頁,總共80頁。總體方差的區間估計當前34頁,總共80頁??傮w方差的區間估計1. 估計一個總體的方差或標準差2. 假設總體服從正態分布總體方差2的點估計量為s2,且4.總體方差在1-置信水平下的置信區間為當前35頁,總共80頁。總體方差的區間估計
(圖示)221-2總體方差的1-的置信區間自由度為n-1的2當前36頁,總共80頁??傮w方差的區間估計
(例題分析)【例】一家食品生產企業以生產袋裝食品為主,現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布。以95%的置信水平建立該種食品重量方差的置信區間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3當前37頁,總共80頁。總體方差的區間估計
(例題分析)解:已知n=25,1-=95%,根據樣本數據計算得
s2=93.21
2置信度為95%的置信區間為該企業生產的食品總體重量標準差的的置信區間為7.54g~13.43g當前38頁,總共80頁。一個總體參數的區間估計
(小結)待估參數均值比例方差大樣本小樣本大樣本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布當前39頁,總共80頁。7.3兩個總體參數的區間估計7.3.1兩個總體均值之差的區間估計7.3.2兩個總體比例之差的區間估計7.3.3兩個總體方差比的區間估計當前40頁,總共80頁。兩個總體參數的區間估計總體參數符號表示樣本統計量均值差比例差方差比當前41頁,總共80頁。兩個總體均值之差的區間估計
(獨立大樣本)當前42頁,總共80頁。兩個總體均值之差的估計
(大樣本)1. 假定條件兩個總體都服從正態分布,12、22已知若不是正態分布,可以用正態分布來近似(n130和n230)兩個樣本是獨立的隨機樣本使用正態分布統計量z當前43頁,總共80頁。兩個總體均值之差的估計
(大樣本)1. 12,22已知時,兩個總體均值之差1-2在1-置信水平下的置信區間為12、22未知時,兩個總體均值之差1-2在1-置信水平下的置信區間為當前44頁,總共80頁。兩個總體均值之差的估計
(例題分析)【例】某地區教育管理部門想估計兩所中學的學生高考時的英語平均分數之差,為此在兩所中學獨立抽取兩個隨機樣本,有關數據如右表。建立兩所中學高考英語平均分數之差95%的置信區間
兩個樣本的有關數據
中學1中學2n1=46n1=33S1=5.8S2=7.2English當前45頁,總共80頁。兩個總體均值之差的估計
(例題分析)解:兩個總體均值之差在1-置信水平下的置信區間為兩所中學高考英語平均分數之差的置信區間為5.03分~10.97分當前46頁,總共80頁。兩個總體均值之差的區間估計
(獨立小樣本)當前47頁,總共80頁。兩個總體均值之差的估計
(小樣本:
12=22
)1. 假定條件兩個總體都服從正態分布兩個總體方差未知但相等:12=22兩個獨立的小樣本(n1<30和n2<30)總體方差的合并估計量估計量x1-x2的抽樣標準差當前48頁,總共80頁。兩個總體均值之差的估計
(小樣本:12=22
)兩個樣本均值之差的標準化兩個總體均值之差1-2在1-置信水平下的置信區間為當前49頁,總共80頁。兩個總體均值之差的估計
(例題分析)【例】為估計兩種方法組裝產品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12名工人,每個工人組裝一件產品所需的時間(單位:min)下如表。假定兩種方法組裝產品的時間服從正態分布,且方差相等。試以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區間兩個方法組裝產品所需的時間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5當前50頁,總共80頁。兩個總體均值之差的估計
(例題分析)解:根據樣本數據計算得合并估計量為兩種方法組裝產品所需平均時間之差的置信區間為0.14min~7.26min當前51頁,總共80頁。兩個總體均值之差的估計
(小樣本:1222
)1. 假定條件兩個總體都服從正態分布兩個總體方差未知且不相等:1222兩個獨立的小樣本(n1<30和n2<30)使用統計量當前52頁,總共80頁。兩個總體均值之差的估計
(小樣本:1222
)兩個總體均值之差1-2在1-置信水平下的置信區間為自由度當前53頁,總共80頁。兩個總體均值之差的估計
(例題分析)【例】沿用前例。假定第一種方法隨機安排12名工人,第二種方法隨機安排8名工人,即n1=12,n2=8,所得的有關數據如表。假定兩種方法組裝產品的時間服從正態分布,且方差不相等。以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區間兩個方法組裝產品所需的時間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2當前54頁,總共80頁。兩個總體均值之差的估計
(例題分析)解:根據樣本數據計算得自由度為兩種方法組裝產品所需平均時間之差的置信區間為0.192min~9.058mni當前55頁,總共80頁。兩個總體均值之差的區間估計
(匹配樣本)當前56頁,總共80頁。兩個總體均值之差的估計
(匹配大樣本)假定條件兩個匹配的大樣本(n130和n230)兩個總體各觀察值的配對差服從正態分布兩個總體均值之差d=1-2在1-置信水平下的置信區間為對應差值的均值對應差值的標準差當前57頁,總共80頁。兩個總體均值之差的估計
(匹配小樣本)假定條件兩個匹配的小樣本(n1<30和n2<30)兩個總體各觀察值的配對差服從正態分布
兩個總體均值之差d=1-2在1-置信水平下的置信區間為當前58頁,總共80頁。兩個總體均值之差的估計
(例題分析)【例】由10名學生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進行測試,結果如下表。試建立兩種試卷分數之差d=1-2
95%的置信區間
10名學生兩套試卷的得分學生編號試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916STATISTICS當前59頁,總共80頁。兩個總體均值之差的估計
(例題分析)解:根據樣本數據計算得兩種試卷所產生的分數之差的置信區間為6.33分~15.67分當前60頁,總共80頁。兩個總體比例之差區間的估計當前61頁,總共80頁。1. 假定條件兩個總體服從二項分布可以用正態分布來近似兩個樣本是獨立的2. 兩個總體比例之差1-2在1-置信水平下的置信區間為兩個總體比例之差的區間估計當前62頁,總共80頁。兩個總體比例之差的估計
(例題分析)【例】在某個電視節目的收視率調查中,農村隨機調查了400人,有32%的人收看了該節目;城市隨機調查了500人,有45%的人收看了該節目。試以95%的置信水平估計城市與農村收視率差別的置信區間12當前63頁,總共80頁。兩個總體比例之差的估計
(例題分析)解:已知n1=500,n2=400,p1=45%,p2=32%,1-=95%,z/2=1.96
1-2置信度為95%的置信區間為城市與農村收視率差值的置信區間為6.68%~19.32%當前64頁,總共80頁。兩個總體方差比的區間估計當前65頁,總共80頁。兩個總體方差比的區間估計1. 比較兩個總體的方差比用兩個樣本的方差比來判斷如果S12/S22接近于1,說明兩個總體方差很接近如果S12/S22遠離1,說明兩個總體方差之間存在差異總體方差比在1-置信水平下的置信區間為當前66頁,總共80頁。兩個總體方差比的區間估計
(圖示)FF1-F總體方差比的1-的置信區間方差比置信區間示意圖當前67頁,總共80頁。兩個總體方差比的區間估計
(例題分析)【例】為了研究男女學生在生活費支出(單位:元)上的差異,在某大學各隨機抽取25名男學生和25名女學生,得到下面的結果男學生:女學生:試以90%置信水平估計男女學生生活費支出方差比的置信區間當前68頁,總共80頁。兩個總體方差比的區間估計
(例題分析)解:根據自由度n1=25-1=24,n2=25-1=24,查得F/2(24)=1.98,F1-/2(24)=1/1.98=0.50512/22置信度為90%的置信區間為男女學生生活費支出方差比的置信區間為0.47~1.84
當前69頁,總共80頁。兩個總體參數的區間估計
(小結)待估參數均值差比例差方差比獨立大樣本獨立小樣本匹配樣本獨立大樣本12、22已12、22未Z分布Z分布12、22已知12、22未知Z分布12=2212
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 注冊會計師考試2025年綜合財務分析報告的編寫技巧試題及答案
- 單相電表安裝施工方案
- 2025年國際金融理財師考試金融服務業發展趨勢試題及答案
- 2024項目管理行為標準試題及答案
- 輔導員面對多元化需求的應對策略試題及答案
- 高手進面試題目及答案
- 2024年微生物檢測前沿試題及答案
- 深化項目管理考試內容理解的策略試題及答案
- 車位柱子改造方案范本
- 瞄準2024年農藝師考試試題及答案
- (三模)廣西2025屆高中畢業班4月份適應性測試 英語試卷(含答案解析)
- 2025年福建省能源石化集團有限責任公司招聘筆試參考題庫含答案解析
- 駕校管理系統答辯
- (新湘科版)六年級下冊科學知識點
- TSG11-2020 鍋爐安全技術規程
- 四川省2007年普通高校職教師資班和高職班對口招生統一考試
- 長輸管線焊材用量計算表
- 日立風冷熱泵H系列螺桿機組說明書
- 廣西藝術學院普通本科專業評估方案.
- 初中學生學籍表(2020年整理).doc
- 加藥系統出廠檢驗報告
評論
0/150
提交評論