




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
社會統計學任課教師:徐依婷578012689@教材:中央廣播電視大學出版社,陳衛
第七章統計推斷學習目標:
1、了解統計推斷的原理和隨機現象、概率分布
2、掌握樣本統計量的抽樣分布
3、掌握中心極限定理、總體參數的區間估計
4、掌握虛無假設和替換假設第一節統計推斷中的相關概念一、隨機性1、統計推斷就是根據統計量的分布和概率理論,由樣本統計量來推斷總體參數的過程,包括參數估計和假設檢驗兩部分內容。例如,我們知道某班級一部分同學的期末成績,以此推測這個班同學的平均成績。2、隨機現象隨機現象就是在同一組條件下,每次試驗可能出現某一結果,也可能不出現,也就偶然現象。二、概率模型(一)隨機變量:如果某現象的出現是一個隨機現象,那么變量X就是隨機變量。隨機變量分為兩類:離散型隨機變量:變量的值可以逐個列舉出來。連續性隨機變量:變量的值不能一一列舉出來,而是數軸上某一區間的任意一點。(二)概率分布概率分布就是隨機變量的取值與其概率構成的分布。通常用P(X)表示隨機變量X的概率,概率分布就是X的取值與P(X)的關系分布。根據隨機變量的不同,也分為離散型隨機變量和連續型隨機變量的概率分布兩種。離散型概率分布連續型概率分布采用函數的形式來表示連續型概率分布。連續型隨機變量取任何一個特定的值的概率為0。因而不能列出每一個值及其相應的概率,通常是研究它取某一區間值的概率。例如,研究a﹤x﹤b的概率,即求P(a﹤x﹤b)是有意義的。三、統計量1、總體與樣本:總體:由所研究的全體元素組成的集合稱為總體,而把組成總體的每個元素稱為個體。例如,在考察某一批燈泡的質量時,該批燈泡的全體就組成一個總體,而其中每個燈泡就是個體。樣本:為了解總體X的分布規律或某些特征,我們必須對總體進行抽樣觀察,即從總體X中隨機抽取n個個體,并稱為來自總體X的容量為n的樣本。(二)參數與統計量參數是研究者想要了解的總體的某種特征值,主要有總體平均數、標準差、比例等。總體參數往往是一個未知數,這也正是抽樣的意義所在,人們利用抽樣調查的方法根據樣本信息推斷總體參數值。統計量是根據樣本數據計算出來的一個量,關心的樣本統計量主要有樣本平均數、樣本標準差、樣本比例等。樣本統計量通常選用英文大寫字母來表示。與參數不同,統計量是根據樣本數據計算出來的,有關樣本的特征值,因而統計量是已知的,可以計算的,是估計總體參數的依據。第二節抽樣分布樣本分布是樣本中所有元素各個觀察值形成的分布。我們可以得知樣本中所有元素的觀察值的,樣本的分布是可以通過統計圖表示的。樣本是從總體中抽取的,必然包含總體的一些信息和特征,有時我們也稱為樣本分布或經驗分布。當抽取的樣本容量n足夠大時,樣本的分布就接近總體的分布。同樣,當總體很大,而樣本量很小時,樣本對總體的代表性就相對較差。抽樣分布抽樣分布是指樣本統計量的概率分布,它是在重復選取容量為n的樣本時,由每個樣本計算出來的統計量數值的相對頻數分布。樣本均值的抽樣分布對于每一個樣本我們都可以計算均值,抽取的樣本不同,計算的均值就不同,因而我們說樣本均值是隨機變量。樣本均值的抽樣分布是所有樣本均值形成的分布,即樣本均值的概率分布。中心極限定理樣本均值的抽樣分布與總體的分布和樣本容量n有關,當總體為正態分布時,均值抽樣分布為正態分布,或者當樣本容量n很大時,均值的抽樣分布接近正態分布。這就是著名的中心極限定理。中心極限定理具體內容為:不論總體分布是否服從正態分布,從均值為μ、方差為σ2的總體中,抽取容量為n的隨機樣本,當n充分大時(通常要求n≥30),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態分布。(三)樣本均值抽樣分布的特征假設從容量N的總體中抽取容量為n的樣本,其中總體的均值為μ,方差為σ2,樣本均值的數學期望為E(),方差為σ2x三、樣本比例的抽樣分布用π表示總體比例,用P表示樣本比例。第三節參數估計參數估計是統計推斷的一個重要部分,它是用樣本統計量推斷總體參數的過程。參數估計可分為點估計和區間估計兩種類型。一、點估計點估計就是直接用估計量作為總體參數θ的估計值。用樣本均值直接作為總體均值μ的估計值,用樣本比例P直接作為總體比例π的估計值,用樣本方差直接作為總體方差的估計值等。例如,隨機樣本的均值為6分,我們用6分直接作為總體的估計值,認為這次考試總體平均分為6分,這就是點估計。一個好的估計量的特征:(1)無偏性。用統計量估計總體參數時必定會有誤差,但是多個統計量中有的偏大、有的偏小,偏差的平均數為0,這時,這個統計量就是無偏估計量。或者說估計量抽樣分布的數學期望等于總體參數時,就具有無偏性。(2)一致性。所謂一致性是指當樣本容量無限增大時,估計值應能越來越接近它所估計的總體參數。(3)有效性。是指當總體參數的無偏估計不止一個統計量時,標準差小的估計量更有效,標準差大的有效性就相對差。也就是說,估計量與總體參數的離散程度也要較小。(4)充分性。是指一個容量為的樣本統計量,是否充分反映了全部個數據所反映總體的信息,這就是充分性。二、區間估計(一)區間估計的定義(二)置信水平和置信空間置信區間是在區間估計中,由樣本統計量所構造的總體參數的估計區間,它有估計量加減抽樣誤差構成,我們將區間的最小值稱為置信下限,區間的最大值稱為置信上限。置信水平就是將構造置信區間的步驟重復很多次,置信區間包含總體參數真值的次數所占的比例。求置信區間的步驟(四)區間估計1、總體均值的區間估計在進行區間估計時,我們應首先判斷總體是否為正態分布、樣本是否為大樣本、總體方差是否已知,然后通過樣本統計量估計總體參數。具體包括以下步驟:總體方差的區間估計與總體比例的區間估計,只要求了解。詳見書138頁。第四節假設檢驗一、概念假設檢驗是首先對總體參數建立一個假設,然后根據樣本信息區檢驗這一假設是否正確。假設檢驗和參數估計都是建立在抽樣分布的基礎上。例如,某品牌燈泡的壽命X服從正態分布(μ,125),廠方說它的平均工作壽命是1800小時。隨機測試16次,得到的平均工作溫度是1750度。樣本結果與廠方所說的是否有顯著差異?廠方的說法是否可以接受?這就是假設檢驗要解決的問題。假設檢驗的基本思想可以用小概率原理解釋。小概率原理,就是在一次試驗中小概率事件是幾乎不可能發生的。也就是說,如果我們對總體的某個假設是真實的,那么極端值(不支持假設的事件)是幾乎不可能發生的。如果發生了,我們就有理由懷疑這一假設的真實性,拒絕這一假設。第四節假設檢驗二、虛無假設和替換假設一般假設檢驗的做法是:選擇一個檢驗,使得當H0為真時,拒絕H0的犯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CSPSTC 17-2018企業安全生產雙重預防機制建設規范
- T/CRIA 29006-2023汽車輪胎高速均勻性試驗方法
- T/CNFA 5-2017傾斜式嬰兒睡床的安全要求及試驗方法
- T/CNCIA 02012-2022地坪工程施工及驗收規范通用技術條件
- T/CNCA 021-2022智能化綜采工作面運行質量規范
- T/CITS 0011-2021產品質量提升服務機構指南
- T/CIMA 0022-2020車載臺式氣相色譜-質譜聯用儀技術要求
- T/CIE 120-2021半導體集成電路硬件木馬檢測方法
- T/CHES 60-2021牧區水草畜平衡計算與評價技術規范
- T/CHATA 020-2022結核分枝桿菌重組蛋白皮膚試驗操作規范
- 中醫護理如何做好健康宣教
- 燃氣行業數字化轉型趨勢分析-全面剖析
- 醫院手術室操作流程及評分標準
- 班級學生基本情況調查
- 《小麥在人類膳食中的重要性:歷史與現代視角》論文
- 【西安交通大學】2025年電力人工智能多模態大模型創新技術及應用報告
- 分賬管理制度
- 電動汽車車網互動規模化發展策略與標準體系規劃
- 餐飲服務流程與標準操作指引
- (一模)石家莊市2025年高三年級教學質量檢測(一)物理試卷(含標準答案)
- 產品供應鏈合作協議與分銷合同簽訂備忘錄
評論
0/150
提交評論