管理統計學課件_第1頁
管理統計學課件_第2頁
管理統計學課件_第3頁
管理統計學課件_第4頁
管理統計學課件_第5頁
已閱讀5頁,還剩522頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

什么是統計資料?構成統計資料的基本組成要素有哪些?如何收集統計資料?統計資料的誤差來源有哪些?1.1統計資料定義: 統計資料(Statisticaldata)是指可用以推導出某項結論的一些事實或數字基本構成要

素元素(Element)變量(Variable)觀測(Observation)關于元素的一種屬性或特征研究對象由各元素組成資料中關于某一元素所有各變量的信息1.1統計資料變量(Variable)定量變量(Quantitativevariable) 結果可用數字表示定性變量(QualitativeVariable) 結果不可用數字表示

1.1統計資料姓名性別年齡身高(m)體重(kg)民族公司服務年限受教育年限甲男331.8565漢318乙女251.6555回216丙男261.7260滿115丁女351.6053回416戊男321.8368漢219表1-1員工個人資料表1.1統計資料F.W.Taylor的科學管理理論中的工作定額原理,用實驗式的方法獲得工人合理的日工作量資料。氣象資料收集,商品價格的變化對商品需求量的影響。統計資料的收集間接引用直接收集實驗式收集統計資料非實驗式收集統計資料1.2統計資料的收集

直接收集統計資料,無論是實驗式的還是非實驗式的,都稱為統計調查。

工作方式直接觀察口頭詢問發調查表或問卷1.3統計調查調查表是直接獲得統計資料的主要工具,調查表設計的好壞將影響所獲資料的可用性與可信性。設計問卷調查表注意事項提問的種類安排好問題的次序試點調查等級評價量表的選擇1.3統計調查提問的種類選擇式自由式讓回答人在幾個事先指定的備選答案中選擇答案。若備選答案過多,或受提問措辭和語氣的影響,可能使被調查人做不出合乎本意的選擇

必須用自己的語言表達本人的意愿,但所填答案會多種多樣。常常只用于小規模的調查研究提問的種類1.3統計調查安排問題的次序應注意的問題由客觀到主觀由熟悉到陌生相對容易的問題放在最后內容相關的問題要排得相近開始有介紹性的語言第一個問題就切中主題1.3統計調查案例:一個電話訪問的引言和第一個問題你好,我是XX大學的訪問員。我們正在調查居住在學生公寓的人是否對生活條件感到滿意。你的名字是從住宿登記簿中隨機選取的,我們的調查只會占用您至多四分鐘的時間。您可以在任何時候打斷我。我現在可以開始訪問了嗎?第一個問題是關于您對學生公寓的總體感覺的。您認為(讀選項):(1)確實滿意(2)大體滿意(3)大體不滿意(4)確實不滿意(5)(沉默)沒想法或者不知道/錯誤答案1.3統計調查試點調查試點調查當一個調查表設計完畢后,常在一小范圍進行試點調查可發現一些意料之外的問題,以便在大規模調查前改正應盡量在真實的環境中進行,同時也應保持效度試點調查的時機試點調查的作用注意問題1.3統計調查等級評價量表的選擇利用等級評價量表,可以為受訪者在一個連續區間的一些點上或者一個類型序列上設定選項,并且為每個級別賦一個量化值。根據實際調查的需要,有四種等級評價量表供選擇1.3統計調查等級評價量表要求受訪者按照等級順序回答數值之間具有差距,但不能指示比例關系類似定距型量表,能指示比例關系定序型定距型定比型被訪者屬于哪個組,就選擇哪個選項

類別型1.3統計調查李科特量表李科特量表是一種定距量表,它的基本形式是給出一組陳述,要求調查對象表明他是“強烈贊同”,“贊同”,“反對”,“強烈反對”或“未決定”。最后把各個陳述的分數相加就可以得到總分。答案反對強烈反對未決定贊同答案賦值分數加總1.3統計調查統計資料整理的目的

調查收集到的原始統計資料常常是大量的。它必須經過加工整理,如分類歸并匯總,按時間前后或按數值大小重新排列等,才容易發現數據的規律性,并便于做進一步的統計分析。加工整理,歸并匯總,重新排列調查得到的原始統計資料發現數據的規律性,作進一步的統計分析統計表類型將變量所取值按時間順序排列序列表分類表按數值分類定性分布頻數分布時間序列表地域序列將變量所取值按地域排列按性質分類2.1統計表時間序列表的例子:2.1統計表定性分布:首先建立一個元素的類別系統,使得各類互相排斥,而且是完備的,使被觀測的各元素能既不重復又無遺漏地分到各類中去。然后記錄分到同類中的元素個數,或將同類中各元素的觀測值加以歸并,這樣得到定性分布。元素分類觀測值記錄與歸并定性分布2.1統計表定性分布的例子:2.1統計表頻數分布:按變量所取的值進行分類,于是資料中每個觀測值都分到相應類中去。記錄各類中觀測值出現的次數,制成頻數分布表。確定組數k找出xmin與xmax計算組距h確定每組上下限將相應數據歸并到各組Xmin

最小值,xmax最大值2.1統計表分數計數人數(f)40—49150—59正正1460—69正正正正正正正正正正正5570—79正正正正正正正正正正正5880—89正正正正正正正正正正5290—99正正正17100—1093總數200在所屬組的記錄欄做一記號,按照我國習慣,用寫“正”字方法,英文書使用“#”符號

表2-4某校200個學生高等數學考試成績2.1統計表表2-5

某校200個學生高等數學考試成績的頻數分布表分數人數(f)分數人數(f)40—45176—812546—51082—874252—571288—931058—632994—991164—6928100—105370—7539總數2002.1統計表2.1統計表表2-5與表2-6的對比表2-5中組距等于6,頻數分布的規則性,仍然可以維持,同時細節的損失也可減輕表2-6中的組距等于2,各組頻數分布就變得很不規則了。由此可見,組數的確定應適當,亦不宜太多2.1統計表累積頻數(CumulativeFrequency):由第一組起至第i組止各頻數之和稱為第i組的累積頻數,記為Fi,即:頻率(PercentFrequency):就是頻數除以總數n:fi/n,經常以百分數表示。累計頻數與頻率2.1統計表頻數表的例子2.1統計表統計圖:統計資料整理成統計表后,可以比較清晰地展示變量的變化規律。為了使這種規律更有直觀性,常采用統計圖表示。包括:線圖、條形圖、圓餅圖等統計圖線圖條形圖圓餅圖2.2統計圖

2.2統計圖

線圖(Linegraph)2.2統計圖

(億元)條形圖(Barchart)2.2統計圖

(億元)圓餅圖(Piechart)2.2統計圖

散點圖(ScatterDiagram)2.2統計圖

雙變量的統計資料:對每一元素觀測兩個特征,記錄觀測結果,就是雙變量的統計資料雙變量常用(X,Y)形式表示,以區別兩個單變量X和Y2.3雙變量的二元分布錯誤發生時的飛行狀態,分起飛(T),巡航(C)和著陸(L)三種。錯誤發生的原因,分規范理解錯誤(R),儀表讀數錯誤(M)和其它原因(O)三種。[例2.1]在飛行模擬訓練時,用計算機測定并打印出飛行動作的錯誤,從兩方面進行測定:2.3雙變量的二元分布測定45次的打印記錄如下:2.3雙變量的二元分布根據該記錄整理的二元分布表如下:從表中看出,在起飛(T)時容易發生規范理解錯誤(R)和儀表讀數錯誤(M),而著陸(L)時不太容易發生規范理解錯誤。2.3雙變量的二元分布邊際分布:在二元分布表最下行(合計行)和最右列(合計列)分別是X和Y的單變量分布,稱為邊際分布。二元分布表最下行二元分布表最右行X的單變量分布Y的單變量分布邊際分布統稱2.3雙變量的二元分布一個雙變量的二元分布絕不同于兩個單變量的一元分布,它不僅說明兩變量各自的分布情況,而且說明兩變量之間(飛行狀態與錯誤原因之間)的相互關聯情況。而這種關聯情況(即是否存在關聯以及關聯的性態和程度等)正是研究雙變量的二元分布的主要任務。雙變量二元分布兩變量各自的分布情況變量之間相互關聯情況研究二元分布的主要任務說明2.3雙變量的二元分布3.1表示集中位置的特征數3.1.1平均數算術平均數(Arithmeticaverage)幾何平均數(GeometricMean)調和平均數定義:一組n個觀測值x1,x2,…,xn的算術平均數,定義為(1)算術平均數(Arithmeticaverage)如果資料已經分組,組數為k,用x1,x2,…,xk

表示各組中點,f1,f2…,fk

表示相應的頻數,那么(1)算術平均數(Arithmeticaverage)表3-1某校125位大學一年級新生體重表體重(公斤)組中值(x)

人數(f)46—4847449—51502052—54532555—57563858—60592161—63621264—66655(1)算術平均數(Arithmeticaverage)其平均體重:===55.592(1)算術平均數(Arithmeticaverage)

當時最小

性質(1)算術平均數(Arithmeticaverage)在數據為環比類型的問題中,算術平均數是不適用的。例如下表是天津市工業總產值在“十五”期間的逐年增長率,如求該期間平均增長率,算術平均數是不恰當的。幾何平均數可以解決這個問題。(2)幾何平均數(GeometricMean)表3-2天津市工業總產值年份比上年增長%2000200114.0200219.6200324.1200431.0200520.8(天津市2005統計年鑒)

(2)幾何平均數(GeometricMean)定義:一組n個數據的幾何平均數定義為在上式中,依次為114.0,119.6,124.1,十五期間天津市工業總產值年均增長率為21.8%。131.0,120.8于是幾何平均數:(2)幾何平均數(GeometricMean)當數據是相對變化率,求平均數時,算術平均數也不恰當。例如:甲乙兩地相距120公里,某人乘車往返甲乙兩地之間,去時速度每小時20公里,回來時速度為每小時30公里,若求平均速度,這時用算術平均數是不對的,但調和平均數可解決此類問題。(3)調和平均數在上例中,(公里/小時)定義:一組n個數據的調和平均數H,由下式定義(3)調和平均數算術平均數表示了集中位置特征,它照顧到每一個值,但它不見得是出現次數最多的值(甚至也可能不是觀測值中的一個)。所以有必要研究表示集中位置的其它的特征數。3.1.2眾數(Mode)定義:對于有頻數分布的變量,它的眾數指頻數最大的變量的值表3-3頻數分布表Xf3155273對于已分組且等組距的頻數分布,根據最大頻數,可求得眾數所在組。根據眾數定義,可知眾數不唯一。3.1.2眾數(Mode)算術平均數作為集中位置的特征還有一缺點,就是受觀測值中極端值的影響很大,而一組觀測值中的極端值常常沒有代表性。中位數將避免這種影響。3.1.3中位數(Median)

一組n個觀測值按數值大小排列,處于中央位置的值稱為中位數以表示,,當n為奇數,當n為偶數定義:即3.1.3中位數(Median)第25百分位數又稱第一個四分位數(FirstQuartile),用Q1表示;第50百分位數又稱第二個四分位數(SecondQuartile),用Q2表示;第75百分位數又稱第三個四分位數(ThirdQuartile),用Q3表示。中位數是第50百分位數一組n個觀測值按數值大小排列如x1,x2,x3,x4…處于p%位置的值稱第p百分位數。定義:3.1.4百分位數(Percentile)計算第p百分數第1步:以遞增順序排列原數據(即從小到大排列)。第2步:計算指數

第3步1.若i不是整數,將i向上取整。大于I的毗鄰整數為第p百分位數的位置。2.若i是整數,則第P百分位數是第i項與第(i+l)項數據的平均值。如何計算百分位數數據的變異程度產品質量檢查的結果說明生產是否穩定測量的結果說明測量方法或儀器是精密還是粗糙學生的成績成績是否整齊(而不是高低)3.2表示變異(分散)程度的特征數定義

其中xmax和xmin分別為數據中的極大值和極小值。3.2.1極差(或稱全距Range)R對于已分組的頻數分布(組數為k)定義平均差M.D.是離差的絕對值的平均數,即3.2.2平均差(MeanAbsoluteDeviation)方差

樣本

對于已分組的頻數分布(組數為k)總體

樣本

總體

3.2.3方差(Variance),標準差(Standard

Deviation)標準差樣本標準差總體標準差樣本標準差總體標準差對于已分組的頻數分布(組數為k)標準差的單位與X的單位相同。3.2.3方差(Variance),標準差(Standard

Deviation)定義變異系數C是一個無量綱的量。它適于用在比較有不同算術平均數或有不同量綱的兩組數據的情況。例如比較大學生身高與小學生身高,或比較130名大學生身高和體重哪個變化波動范圍比較大時,都可用變異系數。3.2.4變異系數(CoefficientofVariation)定義變異系數C是一個無量綱的量。它適于用在比較有不同算術平均數或有不同量綱的兩組數據的情況。例如比較大學生身高與小學生身高,或比較130名大學生身高和體重哪個變化波動范圍比較大時,都可用變異系數。3.3表示偏倚情況或程度的特征數

3.3.1比較眾數、中位數和算術平均數的相對位置

下圖列舉出了對稱的、具有左偏態(負偏態)和右偏態(正偏態)的頻數分布的例子。注意到它們的特點是:①對稱的分布的眾數、中位數和算術平均數相同;②具有偏倚性的分布,算術平均數突出在外,偏向分布的尾端,而中位數則介于眾數與算術平均數之間。偏倚性是表示各觀測值分布不對稱情況或程度的。3.3表示偏倚情況或程度的特征數

圖3-13.3.1比較眾數、中位數和算術平均數的相對位置>Me>Mo<Me<Mo

=Me=Mo可以看出,對于單峰的分布,對稱態:左偏態:右偏態:3.3.1比較眾數、中位數和算術平均數的相對位置(1)Pearson偏倚系數Pearson分布對稱,則k=0左偏態,則k<0右偏態,則k>03.3.2定量地描述偏倚性,常用的兩個公式(2)用標準化的三階矩陣g表示3.3.2定量地描述偏倚性,常用的兩個公式

3.4五數概括法五數概括法(2)第1四分位數(Q1)。(3)中位數(Q2)。(4)第3四分位數(Q3)。(5)最大值。(1)最小值。首先將數據按遞增順序排列,然后很容易就能確定最小值、3個四分位數和最大值了。對12個月薪數據的樣本,按照遞增順序排列如下:221022552350|238023802390|242024402450|255026302825Q1=2365Q2=2405Q3=2500上述起薪數據以五數概括為:2210,2365,2405,2500,2825。3.4五數概括法盒形圖實際上是以圖形來概括數據。我們將盒形圖延至這一章才講是因為它的關鍵是計算中位數和四分位數Q1和Q3。此外還將用到四分位數間距IQR=Q3-Q1

。盒形圖的畫法步驟如下:

(1)畫一個方盒,其邊界恰好是第1和第3四分位數。對于上述的起薪數據,Q1=2365,Q3=2500。這個方盒包含了中間的50%的數據。(2)在方盒上中位數的位置畫一條垂線(對起薪數據,中位數為2405)。因此中位數將數據分為相等的兩個部分。3.5盒形圖(3)利用四分位數間距IQR=Q3-Q1,來設定界限。盒形圖的界限定于低于Q1以下1.5個IQR和高于Q3以上1.5個IQR的位置。上、下限以外的數值作為異常值。

(4)在圖3-4中的橫線叫做須線(whisker),須線從方盒的邊線出發,直至在上、下限之內的最大值和最小值。(5)最后,任一異常值的位置以符號“*”標出。3.5盒形圖4.1關于抽樣的基本概念

為什么要抽樣? 為了收集必要的資料,對所研究對象(總體)的全部元素逐一進行觀測,往往不很現實。抽樣原因元素多,搜集數據費時、費用大,不及時而使所得的數據無意義總體龐大,難以對總體的全部元素進行研究檢查具有破壞性炮彈、燈管、磚等簡單隨機抽樣(x1,x2,……,xn): 簡單隨機抽樣是指從總體中抽取樣本容量為n的樣本時,x1,x2,……,xn這n個隨機變量必須具備以下兩個條件:這n個隨機變量與總體X具有相同的概率分布;它們之間相互獨立。4.1關于抽樣的基本概念

甲乙丙丁四個生產商,其產品質量如下表所示: 如果僅從甲乙兩個生產商的產品中進行抽樣,抽樣質量就偏高;如果僅從丙丁兩個生產商的產品中進行抽樣,抽樣質量就偏低; 因此采用簡單隨機抽樣保證隨機樣本與總體具有相同的概率分布。甲乙丙丁質量高高低低表4-14.1關于抽樣的基本概念

樣本統計量與抽樣分布: 在簡單隨機抽樣中,樣本具有隨機性,樣本的參數,s2等也會隨著樣本不同而不同,故它們是樣本的函數,記為g(x1,x2,……,xn),稱為樣本統計量。

統計量的概率分布稱為抽樣分布(Sample distribution)

4.1關于抽樣的基本概念

幾種概率分布正態分布分布

F分布

t分布4.2幾種與正態分布有關的概率分布若隨機變量X的概率密度函數記為(1)正態分布圖4-1一般正態分布(1)正態分布標準正態分布:

當時, 記為U∽N(0,1)圖4-2標準正態分布(1)正態分布非標準正態分布向標準正態分布的轉化

標準化因子

則U∽N(0,1)(1)正態分布 查表 當u大于零時,可查正態分布表 但如果u<0時,則可由式φ(-u)=1-φ(u)求出(1)正態分布線性性質: 如果,且相互獨立。對于常數,有下式成立:(1)正態分布 相互獨立且均為服從N(0,1)分布的隨機變量,則稱隨機變量所服從的分布是自由度為n的分布,且記。定義(2)分布圖4-3χ2分布圖(2)分布查表:對于給定的α,0<α<1,可在分布表中查得,即 例如

即指(2)分布性質:如果,則;設,且相互獨立,則若,已知相互獨 立,,則(2)分布總體,是X的一個樣本,為樣本的平均數,

為樣本的方差。 則: a.相互獨立

b.(2)分布 設相互獨立的隨機變量V和W分別服從自由度為n1,n2的分布,即, 則隨機變量服從F分布。n1,n2分別是它的第一自由度和第二自由度,且通常記為定義(3)F分布圖4-4F分布圖F(3)F分布查表性質(3)F分布 設隨機變量U服從標準正態分布,隨機變量W服從自由度為n的分布,且U與W相互獨立, 則稱隨機變量服從自由度為n的t分布,記為T~t(n)。定義(4)t分布(Students分布)圖4-5n=∞正態分布n=10n=1t分布圖(4)t分布(Students分布)查表或性質: 當n很大時, 此時,tα/2≈uα/2,t分布近似標準正態分布。

(4)t分布(Students分布)無限總體: 設總體X~N(μ,σ2),X1,X2,…

,Xn是總體X的隨機樣本,樣本平均數,則4.3樣本平均數的抽樣分布有限總體 有限總體若采取有放回抽樣,則與無限總體等價。有限總體容量為N而采取無放回抽樣,且n/N≤0.1,仍可視為無限總體,而當n/N>0.1時則 稱式為有限總體的修正系數。4.3樣本平均數的抽樣分布

從總體中抽取樣本容量為n的簡單隨機樣本,當樣 本容量n≥30時,樣本均值的抽樣分布可用正態 概率分布近似。4.4中心極限定理一、問卷的主要類型郵寄問卷、發送問卷訪問員根據被調查者的回答填寫思考:這兩類問卷的區別和聯系是什么?1、自填問卷:2、訪問問卷:封面信:指導語:問題和答案:其他資料:二、問卷基本結構一封致被調查者的短信,旨在向被調查者介紹說明調查者身份、目的等內容用來教被調查者如何正確填答問卷主體部分根據具體情況,包括問卷編碼、編號、發送和回收日期、調查或審核員名字、被調查者住址等

問卷標題調查的主辦單位或者個人身份(開頭或落款處)調查目的(恰當、合理)。如:為了探索我國物價改革的效果,我們舉辦了此次調查調查對象的選取方式,加上保密承諾,減少被調查者的心理壓力。如:我們從全市各工廠中隨機抽取了一部分工人作為調查對象問卷的填答方法、回收方式,致謝(一)封面信封面信一般說明以下問題:《圖書館使用情況調查問卷》親愛的同學:您好!我們是12級工商管理班的同學,為了了解大家對我院圖書館的使用情況,我們特邀您參加此項調查,您寶貴的意見和建議將成為我們學習資源建設的重要參考材料。本次調查采取隨機抽查不記名的方式,請您在您認為合適的答案的標號上打“√”,我們對您的回答將予以保密,我們期待能收到您填寫完整的問卷,謝謝。(一)封面信指導語分為:

卷頭指導語:屬于“填表說明”卷中指導語:一般針對具體某個問題作指示(二)指導語如:請在每一個問題后適合你自己情況的答案序號上劃圈,或在“____”處填上適當的內容如:(可選多個答案)例子:

注:無特殊說明的情況下,一律只選一項!

您心中理想的出國留學或就業地(可以選多種答案):

問題的類型:有關行為方面的問題有關態度或者看法方面的問題有關個人背景的問題(三)問題思考一:請判斷以下各問題屬于哪類問題1、你家訂了幾份報紙2、你認為選擇職業最重要的標準是3、年齡、性別、文化程度、年收入、職業

問題的形式開放式問題:不提供答案;如“您的建議____”

封閉式問題:提供答案以備被調查者選取(三)問題1、封閉式問題,又包括以下類型:順序式:要求被調查者從備選答案中選出部分或全部答案,并按一定原則進行排序。(三)問題例——《**地區留學市場調查》以下是幾個選擇出國留學國家的標準,它們在您心目中的重要程度如何?第一重要___,次重要____,第三重要_____1生活環境好4社會治安良好2留學費用合理5教學質量高3就業率高6社會福利好

等級式:對兩個以上分成等級的答案進行選擇,只能從中選擇出一項。常用于滿意度(三、五、七項式都可以,一般用五項式)或者一些程度調查(三)問題矩陣式/表格式:當詢問若干個有相同答案形式的問題時,可以將這些問題集中在一起構成一個問題的表達方式如:《**露天電影改進情況調查問卷》

一、您喜歡觀看我校的露天電影嗎?(只選一項)

1.喜歡2.一般3.不喜歡

二、您對我院露天電影播放時間滿意嗎?(只選一項)

1.很滿意2.滿意3.一般4.不滿意5.很不滿意三、您對我院露天電影播放地點滿意嗎?(只選一項)

1.很滿意2.滿意3.一般4.不滿意5.很不滿意四、您對我院露天電影播放質量滿意嗎?(只選一項)

1.很滿意2.滿意3.一般4.不滿意5.很不滿意五、您對我院露天電影播放片種滿意嗎?(只選一項)

1.很滿意2.滿意3.一般4.不滿意5.很不滿意(三)問題例:三、以下列出了關于我院露天電影播放質量的四方面指標。請問,您對這四方面情況的滿意度如何?請分別作出評價:(三)問題

很滿意滿意一般不滿意很不滿意1.播放時間

543212.播放地點543213.播放質量543214.播放片種54321兩項式:答案只有兩種,回答者其中選擇一項即可,多用于民意測驗如:您是否知道我院每周五晚上播放露天電影?(只選一項)1.知道2.不知道多項選擇式:給出的答案至少在兩個以上,回答者根據要求選擇其一或者選擇多項,問卷中最常用的方式如:您在周末的時候通常都做些什么?(可選多項)1.看電影2.上網3.逛街4.看電視

5.上圖書館6.外出打工7.呆在宿舍8.不一定(三)問題相倚問題:有些問題只適用于樣本中的一部分對象,而某個被調查者是否需要回答這一問題常要依據他對前面某個問題的回答結果而定,這樣的問題即相倚問題(三)問題例一:《金融學院社團發展情況調查問卷》Q9您經常參加社團的活動嗎?1、經常(跳到Q11題)

2、偶爾3、從不Q10您較少參加社團活動的最主要原因是1、沒時間2、自己本身不感興趣3、活動不吸引人4、其他(請注明)_______Q11您認為您所在社團目前收取的會費水平是否合理?1、合理2、不合理3、不知道三、您喜歡觀看我校的露天電影嗎?(只選一項)1.喜歡2.一般(請跳至第六題開始)3.不喜歡四.(第三題回答“喜歡”者回答:)您喜歡觀看我校露天電影的原因?(可選多項)1.

可以促進同學之間的友誼2.充實課余生活3.既然交了電影費,就去看看4.對播放的影片感興趣5、喜歡露天播放的形式6.其它(請注明)_________________五.(第三題回答“不喜歡”者回答:)您不喜歡觀看我校露天電影的原因?(可選多項)1.

電影的時間安排不合理2.電影播放效果不夠理想3.電影播放設備不齊全4.不喜歡露天這種形式5.放映環境糟咂,影響觀看

5.對電影的內容不感興趣6.其它(請注明)___________________(三)問題練習:請判斷下面這些問題設置的好壞,并說明你判斷的原因,如何修改?一個民族的傳統道德總會改變,您認為這些年在中國的這種情況是?你是否贊成物價不進行改革?你所在城市屬于什么類型?你認為目前職工的平均工資水平是否應提高?您對單位近年來情況的感受是?

(三)問題2、問題的語言和提問方式設計的規則2、問題的語言和提問方式設計的規則盡量用簡單的語言,避免專業術語和抽象概念問題盡量簡短避免問題含糊,定義不清的情況避免雙重或者多重含義問題問題不可以帶有傾向性,應保持中立態度不能以否定形式提問,以免誤會產生不問回答者不知道的問題不直接問敏感性問題,要間接、委婉注意問題的提法,別讓回答者有考試之感語言中的毛?。ㄈ﹩栴}3、問題的設置的技巧(1)能夠得到誠實的回答。得不到誠實答案的取消;對于懷疑得不到誠實回答的問題,應當在不同位置設置相同、相反或者相近的問題,以求相互驗證。例如:你最尊重的人是:A.有知識的人B.有錢的人C.有權的人假如你正在忙于一件對于你個人而言非常重要的事情,這個時候同事告訴你,你的頂頭上司來訪,你會:A.立即放下手中的活,與頂頭上司見面B.請同事轉告頂頭上司稍等一會,把手中的的事情處理到一個小段落后再去見他C.請同事轉告頂頭上司,現在很忙,辦完手中的事情再去(三)問題你對同行業中逃稅的情況判斷是:逃稅企業的比例低于5%逃稅企業的比例在5%-10%之間逃稅企業的比例在15%-20之間…..你對同行業民營企業逃稅的情況判斷是:逃稅企業的比例低于5%逃稅企業的比例在5%-10%之間逃稅企業的比例在15%-20之間數目數目依據研究內容、樣本性質、分析方法、擁有的人力、物力和財力等因素定一般來說,不應太長,以回答者能在10分鐘內完成為宜,至多不超過20分鐘如研究經費充足,并付給回答者一定的報酬和禮物,問卷本身質量高,回答者對內容比較有興趣的情況下,問卷稍長一些無妨。(三)問題4、問題的數目和順序安排技巧順序(請判斷以下哪些放在問卷前面合適)熟悉、簡單?生疏、難回答引發回答者興趣的問題?引起回答者緊張顧慮的問題?開放式題應放在問卷前部還是后部行為?態度?個人背景?將詢問同一類事物的問題要盡量安排在一起(體現邏輯順序)(三)問題

要保證答案具有窮盡性和互斥性善于使用“其他”問題和答案設計要協調(四)答案答案設計的要求一、您??茨念悎罂瘯ㄖ贿x一項)1、經常看2、偶爾看3、從不看二、對于《對話》節目,你覺得(只選一項)1、非常好2、好3、一般4、不好5、非常不好三、您家庭的平均月收入狀況(只選一項)1、1000元以下2、1000-2000元3、2000-6000元4、6000元以上5、不知道四.您最希望以何種方式獲知影訊?(只選一項)1.校園網2.校園海報3.校園廣播4.班委通知五.您覺得我校播放電影最合適的地方應該是?(只選一項)1.燈光球場2.霞湖球場3.其它(請注明)______________(四)答案練習:請判斷以下答案設計好壞,改進方案四、問卷的設計步驟卡片法:第一步是根據探索性工作所得到的印象和認識,把每一個問題和答案寫在一張卡片上;第二步是根據卡片上問題的主要內容,將卡片分成若干堆,即把詢問相同事物的問題卡片放在一起;第三步是在每一堆中,按合適的詢問順序將卡片前后排序;第四步是根據問卷整體的邏輯結構排出各堆卡片的前后順序,使卡片聯成一個整體;第五步是根據回答者閱讀和填答問題是否方便、是否會形成心理壓力等角度,反復檢查問題前后順序及連貫性,對不當之處逐一調整和補充;最后把調整好的問題卡片依次寫到紙上,形成問卷初稿.四、問卷的設計步驟四、問卷的設計步驟

框圖法

第一步是根據研究假設和所需資料的內容,在紙上畫出整個問卷的各個部分、及前后順序的框圖;第二步是具體地寫出每一個部分中的問題及答案,并安排好這些問題相互間的順序;第三步是根據回答者閱讀和填答問卷是否方便,對所有問題進行檢查,調整和補充;最后將調整的結果重新抄在另一張紙上,形成問卷初稿.

兩種方法的差別在于,前者是從具體問題開始,然后到部分,最后到整體;而后者相反,是從總體結構開始然后到部分.最后到具體問題.5.1點估計所謂點估計就是由樣本x1,x2,…xn確定一個統計量

用它來估計總體的未知參數,稱為總體參數的估計量。當具體的樣本抽出后,可求出樣本統計量的值。用它作為總體參數的估計值,稱作總體參數的點估計。1.無偏性(unbiasedness)

設為總體未知參數的估計量若則稱是的無偏估計量,稱具有無偏性。如果是有偏估計量,則它的偏差量為偏差=5.1.1衡量估計量優劣的標準注:具有無偏性。

,對于,具有無偏性5.1.1衡量估計量優劣的標準2.一致性(consistency) 如果對任意小的正數,有則稱是的一致估計量,稱具有一致性,可以證明均具有一致性。5.1.1衡量估計量優劣的標準3.有效性

若都是的無偏估計量且

則稱較為有效估計量。的有效估計量5.1.1衡量估計量優劣的標準4.羅—克拉美不等式兩個以上的無偏估計量具有最小方差最佳無偏估計量一個估計量羅—克拉美不等式檢驗非最佳無偏估計量5.1.1衡量估計量優劣的標準4.羅—克拉美不等式 對于一個無偏估計量的方差在一般的條件下,其方差永遠不會小于一個正數,這個正數是的下限,它依賴于總體的概率密度函數和樣本容量n

即:注:當等于不等式右端時,這時稱為最佳 無偏估計量。5.1.1衡量估計量優劣的標準[例5.1]若,是總體均值的最佳無偏估計量。[證]5.1.1衡量估計量優劣的標準羅—克拉美下限值為

為的最佳無偏估計量5.1.1衡量估計量優劣的標準1.特征數法: 用總體特征數對應的樣本特征數作為其點估計5.1.2點估計的常用方法2.最大似然法

設總體X的概率分布為

或概率密度為其中是未知參數。

如何求極大似然估計量呢?5.1.2點估計的常用方法求最大似然估計量的步驟為:(1)對給定的總體X,寫出似然函數(2)列出似然方程(3)求解上述方程,得關于的解即為的最大似然估計量。5.1.2點估計的常用方法含多個參數令似然方程或最大似然解5.1.2點估計的常用方法[例5.2]從正態分布總體X抽取隨機樣本X1,X2,…,Xn。求的最大似然估計量。解因為:所以,X的概率密度數函數為5.1.2點估計的常用方法因此,似然函數其對數函數5.1.2點估計的常用方法求得似然方程組即即解方程組得5.1.2點估計的常用方法5.2.1區間估計的概念的樣本使得置信度1-α5.2區間估計置信度1-α下θ的置信區間:1-α是置信度,置信度也稱為置信概率α稱為顯著性水平則稱5.2.1區間估計的概念一.總體均值的區間估計 總體服從正態分布,σ2已知時 當

時,(5-7)根據區間估計的定義,在1-α置信度下,總體均值μ的置信區間為:(5-8)5.2.2單個總體參數的區間估計即:

(5-9)從而有(5-10)即在1-α置信度下,μ的置信區間為:(5-11)5.2.2單個總體參數的區間估計[例5.5]

已知某零件的直徑服從正態分布,從該批產品中隨機抽取10件,測得平均直徑為202.5mm,已知總體標準差σ=2.5mm,試建立該種零件平均直徑的置信區間,給定置信度為0.95。 解:已知=202.5,

n=10,1-α=0.95查標準正態分布表,得μα/2=1.96所以在1-α置信度下,μ的置信區間為5.2.2單個總體參數的區間估計

計算結果為:[200.95,204.05]5.2.2單個總體參數的區間估計σ2未知時

(1)n≥30時,只需將中的σ用S近似代替即可(2)n<30時,由

(5-12)所以

(5-13)即(5-14)5.2.2單個總體參數的區間估計n≥30時,只需將

中的σ用S近似代替即可。n<30時,由σ2未知時5.2.2單個總體參數的區間估計所以:(5-15)即在1-α置信度下,μ的置信區間為(5-16)5.2.2單個總體參數的區間估計[例5.6]某大學從該校學生中隨機抽取100人,調查到他們平均每人每天完成作業時間為120分鐘,樣本標準差為30分鐘,試以95%的置信水平估計該大學全體學生平均每天完成作業時間。解:

1-α=0.95μα/2=1.96在95%的置信度下,μ的置信區間為5.2.2單個總體參數的區間估計由上:即[114.12,125.88]5.2.2單個總體參數的區間估計二.總體方差的區間估計(5-17)

(5-18)(5-19)5.2.2單個總體參數的區間估計所以在1-α置信度下:(5-20)(5-21)σ2的置信區間總體標準差σ的置信區間為5.2.2單個總體參數的區間估計三、總體比率的區間估計根據中心極限定理,當n較大時,時,二次分布近似正態分布。即將正態分布標準化,得(5-27)5.2.2單個總體參數的區間估計在給定置信度為時,有(5-28)括號內5.2.2單個總體參數的區間估計

記5.2.2單個總體參數的區間估計于是有解得p的置信區間為

(5-29)5.2.2單個總體參數的區間估計另一種近似解法:由于整理得:5.2.2單個總體參數的區間估計(5-30)其中中的未知,可用來代替。

5.2.2單個總體參數的區間估計一、兩個總體均值之差的估計設兩總體X~N(μ1,σ12),Y~N(μ2,σ22),由兩總體分別獨立的抽取容量為n1和n2的樣本,??5.2.3兩個正態總體參數的比較1.兩個總體方差σ12,σ22,已知,

在1-α置信度下,μ1-μ2的置信區間為(5-31)5.2.3兩個正態總體參數的比較2.兩個總體方差σ12,σ22,未知,(1)σ12≠σ22,且兩樣本容量均≥30,由S12和S22分別估計σ12和σ22,即可(2)σ12=σ22=σ2,σ2未知,(5-32)5.2.3兩個正態總體參數的比較5.2.3兩個正態總體參數的比較σ12≠σ22且兩樣本容量均≥30由S12和S22分別估計σ12和σ22,即可5.2.3兩個正態總體參數的比較σ12=σ22=σ2σ2未知在1-α置信度下,μ1-μ2的置信區間為5.2.3兩個正態總體參數的比較(5-33)5.2.3兩個正態總體參數的比較二、兩個總體方差比的區間估計由于(5-34)5.2.3兩個正態總體參數的比較在1-α置信度下,σ12∕σ22的置信區間為(5-35)5.2.3兩個正態總體參數的比較三、兩個總體比例之差的區間估計設兩個總體比例分別為P1和P2,為了估計P1-P2,分別從兩個總體中各隨機抽取容量為n1和n2的兩個隨機樣本,并計算兩個樣本的比例(5-36)5.2.3兩個正態總體參數的比較其中,在1-α置信度下,p1-p2的置信區間為5.2.3兩個正態總體參數的比較[例5.7]某減肥用品公司對其所作的報紙廣告在兩個城市的效果進行了比較,其分別從兩個城市中隨機抽取了800名成年人,其中看過該廣告的比例分別為試求:兩城市中看過該廣告的成年人比例之差的置信度為95%的置信區間。解:由于n1,n2均為大樣本,1-α=0.95,μα/2=1.965.2.3兩個正態總體參數的比較p1-p2的置信區間為故在95%置信度下,p1-p2的置信區間為(0.011,0.049)。5.2.3兩個正態總體參數的比較需要考慮問題:(1)要求什么樣的精度?即我們想構造多寬的區間?(2)對于構造的置信區間來說,想要多大的置信度?即我們想要多大的可靠度?5.3樣本容量的確定在總體均值的區間估計時,半置信區間的寬度為:可得5.3.1估計總體均值時,樣本容量的確定樣本容量n與總體方差、允許誤差、置信度有以下關系:必要樣本容量n與總體方差成正比。2.在給定的置信水平下,允許誤差越大,樣本容量就可以越小。3.樣本容量n與置信度成正比。5.3.1估計總體均值時,樣本容量的確定[例5.8]一家廣告公司想估計某類商店去年所花的平均廣告費有多少。經驗表明,總體方差約為1800000。如置信度取95%,并要使估計值處在總體平均值附近500元的范圍內,這家廣告公司應取多大的樣本?解:已知這家廣告公司應抽選28個商店作樣本(注意抽取樣本數總是整數,所以n應圓整成整數)。5.3.1估計總體均值時,樣本容量的確定估計總體比例時,允許誤差為:

(5-40)由上式可得出估計總體比例時,確定必要樣本容量的公式。由于總體比率是未知的,因此要用樣本比率代替(5-41)5.3.2估計總體比例時,樣本容量的確定[例5.9]一家市場調研公司想估計某地區有彩色電視機家庭所占的比例。該公司希望對p的估計誤差不超過0.05,要求的可靠程度為95%,應取多大容量的樣本?沒有可利用的估計值。

解:對于服從二項分布的隨機變量,當

時,其方差達到最大值。因此,在無法得到值時,可以用計算。已知:由于的估計值未知,可以采用計算必要的樣本容量:5.3.2估計總體比例時,樣本容量的確定6.1假設檢驗的一般問題假設檢驗是推斷性統計學中的一項重要內容,它是先對研究總體的參數作出某種假設,然后通過樣本的觀察來決定假設是否成立參數假設樣本觀察假設檢驗具體的統計方法6.1假設檢驗的一般問題習題:某種大量生產的袋裝食品,按規定每袋重量不得少于250g。今從一批該種食品中任意抽取50袋,發現有6袋低于250g。若規定不符合標準的比例達到5%,食品就不得出廠,問該批食品能否出廠。從2000年的新生兒中隨機抽取30個,測得其平均體重為3210g,而根據1999年的統計資料,新生兒的平均體重為3190g,問2000年的新生兒與1999年相比,體重有無顯著差異。6.1.1假設檢驗的概念

假設基本形式H0:原假設,H1:備擇假設假設檢驗:運用統計理論對上述假設進行檢驗,在原假設與備擇假設中選擇其一。6.1.2假設檢驗基本原理

小概率事件在一次試驗中幾乎不可能發生。假設檢驗的基本依據—小概率原理:6.1.2假設檢驗基本原理

假設檢驗的基本思想

前提:承認原假設小概率事件發生大概率事件發生拒絕原假設接受原假設進行一次實驗6.1.2假設檢驗基本原理

顯著水平與兩類錯誤第一類錯誤:棄真(顯著水平α)第二類錯誤:取偽顯著水平與兩類錯誤6.1.2假設檢驗基本原理

對于一定的樣本容量n,不能同時做到兩類錯誤的概率都很小。如果減小α錯誤,就會增大犯β錯誤的機會;若減小β錯誤,也會增大犯α錯誤的機會。使α、β同時變小的辦法就是增大樣本容量。一般地說,哪一類錯誤所帶來的后果越嚴重,危害越大,在假設檢驗中就應當把哪一類錯誤作為首要的控制目標。但在假設檢驗中,一般均首先控制犯α錯誤概率。兩類錯誤關系6.1.3假設檢驗的步驟一個完整的假設檢驗過程,通常包括以下四個步驟:提出原假設(Nullhypothesis)與備擇假設(Alternativehypothesis)確定適當的檢驗統計量,并計算檢驗統計量的值規定顯著性水平α作出統計決策6.2.1正態總體參數假設檢驗的步驟第一步:建立原假設H0和備擇假設H1。原假設應該是希望犯第Ι類錯誤概率小的假設。常用的假設形式:6.2正態總體參數的假設檢驗6.2.1正態總體參數假設檢驗的步驟第二步:選擇檢驗用的統計量。u檢驗t檢驗F檢驗常用統計量6.2.1正態總體參數假設檢驗的步驟第三步:確定顯著水平α的值,查相應的分布表得其臨界值以及拒絕域。第四步:進行顯著性判別。6.2.1正態總體參數假設檢驗的步驟6.2.1正態總體參數假設檢驗的步驟6.2.1正態總體參數假設檢驗的步驟6.2.2p-值的應用

p-值是一個概率值,它是用于確定是否拒絕H0的另一種方法。如果假定原假設為真,則p-值是所獲得的樣本結果至少與實測結果不同的概率值。6.2.2p-值的應用例題:某商品標簽上標明其重量至少為3公斤以上,現抽取36瓶該產品組成的一個簡單隨機樣本,得其樣本均值2.92公斤,已知總體標準差為0.18時,在顯著性水平α=0.01的情況下檢驗其商品標簽所標內容是否真實?6.2.2p-值的應用求解過程:(1)原假設H0:μ≥3,備擇假設H1:μ<3(2)檢驗統計量為:代入數據得:6.2.2p-值的應用求解過程(續):(3)U=-2.67所對應的p值為0.0038(4)0.0038<0.01,所以拒絕H0。6.3.1單個總體比率的假設檢驗如果樣本容量n與原總體比率時,用u檢驗法。6.3總體比率的假設檢驗6.3.1單個總體比率的假設檢驗[例6.2]某企業的備件庫存標準有所調整。調整前的庫存周轉率為0.932,今調查庫存資料如下表(α=0.05)6.3.1單個總體比率的假設檢驗求解過程:檢驗假設:由題意:6.3.1單個總體比率的假設檢驗求解過程(續):統計量構造與計算查正態分布表結論:調整前后,該企業的庫存周轉率無顯著差異。6.3.2兩個總體比率的假設檢驗

&&比較兩個總體比率有無顯著差異時,如比較兩種機車生產產品的次品率有無顯著差異,可取容量n1、n2足夠大,使得這樣就可采用u檢驗法。詳見下表6-3。6.3.2兩個總體比率的假設檢驗6.4第二類錯誤概率例題:某種品牌電池標明其使用壽命為120小時,若已知總體的標準差σ=12小時,現選取36節電池組成一個樣本,顯著性水平α=0.05。檢驗假設:H0:μ≥120H1:μ<120

構造統計量6.4第二類錯誤概率α=0.05,例題(續):假設檢驗的拒絕規則:如果U<-1.645,則拒絕H0上述問題中,拒絕規則為:6.4第二類錯誤概率例題(續):時,拒絕H0

當時,接受H0。6.4第二類錯誤概率例題(續):如果假定電池壽命的均值μ=112小時,當μ=112確實是真卻接受了H0:μ≥120時,犯第二類錯誤的概率有多大呢?6.4第二類錯誤概率例題(續):圖6-2給出了當均值μ=112時,的抽樣分布,其上側陰影部分的面積為的概率。6.4第二類錯誤概率例題(續):根據圖6-2,計算得由標準正態概率分布表可知,當U=2.36時,μ=112時,β=0.0091。6.5對總體均值進行假設檢驗時樣本容量的確定檢驗假設:H0:μ≥μ0H1:μ<μ0

6.5對總體均值進行假設檢驗時樣本容量的確定圖6-3上半部分為當H0為真并且μ=μ0時的抽樣分布。6.5對總體均值進行假設檢驗時樣本容量的確定圖6-3中下半部分為當H0為假時,總體均值的值,記作μ1。所以:得:6.5對總體均值進行假設檢驗時樣本容量的確定由上面得到的公式可得α、β和樣本容量n之間的關系:αβ和n之間關系當三者中有二者已知時,即可計算得到第三者。對于給定的顯著性水平α,增大樣本容量將會減少β對于給定的樣本容量,減小α會使β增大,相反增大α將會使β減小。6.6非參數的假設檢驗 前兩節的假設檢驗都是在已知總體的分布類型(如正態分布)下進行的。 但是在許多問題中,總體不一定是屬于正態分布,甚至總體的分布未知。 為此,本節介紹統計上常用的不依賴于總體分布及其參數知識的檢驗——非參數檢驗(NonparametricTests)方法。

6.6.1兩個總體分布差異的檢驗

實際問題中,經常要檢驗兩種不同的處理方法效果是否相同。 例如,比較在不同鉆機、不同操作人員、不同地質條件下,鉆機效率是否相同等等。 諸如此類問題是對兩個總體的分布是否相同的檢驗。下面介紹兩種簡單易行的方法:“符號檢驗法”和“秩和檢驗法”。符號檢驗法(SignTests) 設兩個總體X1,X2,它們的分布皆未知,以f1(x)和f2(x)分別表示兩總體的概率密度。我們要檢驗f1(x)=f2(x)是否成立。

于是

H0:f1(x)=f2(x),H1:f1(x)≠f2(x)符號檢驗法(SignTests) 為此對兩個總體分別獨立地抽取m個元素,即得到m對數據: (a1,b1),(a2,b2),…,(am,bm) 如果f1(x)=f2(x)假設成立,那么ai>bi或ai<bi(i=1,2,…,m)應該有相同的概率(1/2)。且樣本ai>bi

與ai<bi的個數差異不應很大。符號檢驗法(SignTests) 令ai>bi的事件為yi,其取值為1,0 于是

y=y1+y2+...+ym服從二項分布 根據二項分布計算出了比較ai>bi或ai<bi差異的臨界值Sα(n)符號檢驗法步驟:比較樣本數據求出n:n=n++n-在顯著水平α下,根據n值查符號檢驗表得其臨界值Sα(n)判別顯著性ai>bi記為“+”,“+”的個數記為n+ai<bi記為“-”,“-”的個數記為n-ai=bi記為“0”,“0”的個數記為n0

若S0=min{n+,n-}<Sα(n),則拒絕H0,接受H1;認為f1(x)與f2(x)有顯著差異。若S0=min{n+,n-}>Sα(n),則接受H0,認為f1(x)與f2(x)無顯著差異。秩和檢驗法

符號檢驗法的缺點:沒有充分利用數據本身提供的信息,而且必須在數據成對時使用。 如果兩樣本數據不成對,則可用秩和檢驗法。秩和檢驗法秩和檢驗法的做法: 建立H0和H1;將兩組數據依從小到大次序(秩號)排列成表,如果有兩個以上重復的數,則取秩號平均數作為其秩。 取樣本容量小的一組(樣本容量相同時,取平均數小的一組),其數據個數記為n1,則另一組數據個數記為n2,將樣本容量小的一組所對應的秩相加稱為該組的秩和(SumofRanks),記為T。秩和檢驗法 如果兩個總體分布無顯著差異,則T值不應太大或太小。所謂太大或太小是比較而言,其比較值就是秩和檢驗表中的下限T1和上限T2(在給定的顯著水平α下, 若T1<T<T2,則接受H0:f1(x)=f2(x),認為兩總體分布無顯著差異。 若T>T2或T<T1,則拒絕假設H0而接受H1:f1(x)≠f2(x),認為兩個總體分布有顯著差異。秩和檢驗法

秩和檢驗法的原理和符號檢驗法類似。 對于兩個總體X1,X2,其概率密度為f1(x)和f2(x),從中分別獨立抽取樣本觀測值a1,a2,…,am;b1,b2,…bn。如果f1(x)=f2(x)的假設成立,那么在將兩個樣本的觀測值混合排列的次序中,某個秩數對應的數是ai和bi的概率應是相等的。秩和檢驗法 [例6.4]某藥廠生產殺蟲藥品,檢查兩種配方藥品殺蟲的效果(死亡百分數)如下:

問兩種配方殺蟲效果有無顯著差異?甲配方效果樣本6765646867646970乙配方效果樣本636264646568707169秩和檢驗法解: 將數據按秩號排列,并將數據少的甲組數據用綠色填充區別乙組數據秩號123456789數據626364646464656567秩號1011121314151617數據6768686969707071秩和檢驗法 甲組的秩和T=4.5+4.5+7.5+9.5+9.5+11.5+13.5+15.5=76 在α=0.05下查秩和檢驗表,n1=8,n2=9時,T2=90,54=T1<T=76<T2=90,所以判定甲、乙兩種配方的殺蟲效果無顯著差異。124.54.54.54.57.57.59.59.511.511.513.515.515.517

6.6.2總體分布的假設檢驗擬合優度檢驗法正態概率紙列聯表的獨立性檢驗(1)擬合優度檢驗法

已知總體分布函數F(x)的類型F0(x)或概率密度 f(x)的類型f0(x)以及總體X的隨機樣本X1,X2,…,Xn。 H0:F(x)=F0(x)或H0:f(x)=f0(x) H1:F(x)≠F0(x)或H1:f(x)≠f0(x)用檢驗法進行檢驗,具體步驟如下: (1)求出F0(x)或f0(x)中未知參數的估計值(一般用最大似然估計值),從而寫出F0(x)或f0(x)的具體表達式。 (2)按第二章的分組方法,把樣本值分成m個區間(a0,a1),(a1,a2),…(ai-1,ai),…,(am-1,am)。(1)擬合優度檢驗法

(3)求出樣本觀測值在每個區間(ai-1,ai)內的頻數fi (4)根據已寫出的F0(x)或f0(x),計算出總體X在每個區間(ai-1,ai)中的概率值pi。(1)擬合優度檢驗法

(5)構造統計量

對于大樣本,上述統計量近似服從自由度為m-r-1的分布(r是分布函數概率密度函數中觀測值估計的參數個數)。(1)擬合優度檢驗法

(6)在給定顯著水平α下查出分布表中的臨界值,

,則拒絕原假設H0。

,則接受原假設H0。(1)擬合優度檢驗法

[例6.5]

盒中有5種球,重復抽取200次,(每次抽1個球)各種球出現的次數見下表。問盒中5種球的個數是否相等?顯著水平α=0.05。(1)擬合優度檢驗法

解:

H0:“5種球的個數相等”, H1:“5種球的個數不等”。 由已知n=200,m=5,如果H0正確,則每次抽得第i種球概率pi=1/5種別finpifi-npi(fi-npi)2/npi1234535404338444040404040-503-240.62500.2250.10.4∑20020001.35(1)擬合優度檢驗法

計算出

查表得:1.35<9.448 接受H0,認為盒中5種球的個數相等。(1)擬合優度檢驗法

(2)正態概率紙 正態概率紙就是一種檢驗總體是否為正態分布的較直觀易行的工具。 正態概率紙是由垂直于橫軸,縱軸的若干條直線構成的格紙。 橫軸是按等份刻度,表示觀測值x 縱軸表示正態分布累積概率值 縱軸是按非等分刻度,其目的是使服從正態分布的觀測值在正態概率紙上的圖形呈一條直線。正態概率紙的使用步驟:將樣本觀測值分組,且求出各組的頻率和累積頻率在正態概率紙上畫出相應的點用直線連接各點每組區間右端點為橫坐標,累積頻率為縱坐標如果這些點基本在一條直線上,則可以認為樣本來自正態總體。中間的點應盡量地靠近直線,兩端的點可以稍有些偏離。(2)正態概率紙(2)正態概率紙 [例6.6]某市1987年一次

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論