SPSS基礎(chǔ)第3部分學(xué)習(xí)資料_第1頁(yè)
SPSS基礎(chǔ)第3部分學(xué)習(xí)資料_第2頁(yè)
SPSS基礎(chǔ)第3部分學(xué)習(xí)資料_第3頁(yè)
SPSS基礎(chǔ)第3部分學(xué)習(xí)資料_第4頁(yè)
SPSS基礎(chǔ)第3部分學(xué)習(xí)資料_第5頁(yè)
已閱讀5頁(yè),還剩178頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章均值比較與方差檢驗(yàn)本章主要內(nèi)容:1、單個(gè)總體均值的t檢驗(yàn)(One-SampleTTest);2、兩個(gè)獨(dú)立總體樣本均值的t檢驗(yàn)(Independent-SampleTTest);3、兩個(gè)有聯(lián)系總體均值均值的t檢驗(yàn)(Paired-SampleTTest);4、單因素方差分析(One-WayANOVA);5、雙因素方差分析(GeneralLinearModel

Univariate)。假設(shè)條件:研究的數(shù)據(jù)服從正態(tài)分布或近似地服從正態(tài)分布。在Analyze菜單中,均值比較檢驗(yàn)可以從菜單CompareMeans,和GeneralLinearModel得出。7.1假設(shè)檢驗(yàn)的基本問題一、假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)是除參數(shù)估計(jì)之外的另一類重要的統(tǒng)計(jì)推斷問題。它的基本思想可以用小概率原理來(lái)解釋。所謂小概率原理,就是認(rèn)為小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生。也就是說(shuō),如果對(duì)總體的某個(gè)假設(shè)是真實(shí)的,那么不利于或不能支持這一假設(shè)的小概率事件A在一次試驗(yàn)中是幾乎不可能發(fā)生的;要是在一次試驗(yàn)中事件A竟然發(fā)生了,我們就有理由懷疑這一假設(shè)的真實(shí)性,拒絕這一假設(shè)。假設(shè)檢驗(yàn)的基本思想

前提:承認(rèn)原假設(shè)小概率事件發(fā)生大概率事件發(fā)生拒絕原假設(shè)接受原假設(shè)進(jìn)行一次實(shí)驗(yàn)根據(jù)樣本觀測(cè)值來(lái)判斷一個(gè)有關(guān)總體的假設(shè)是否成立的問題,就是假設(shè)檢驗(yàn)問題(hypothesistesting)。

某廠生產(chǎn)一種供出口的罐頭,經(jīng)驗(yàn)表明罐頭的凈重服從正態(tài)分布。標(biāo)準(zhǔn)規(guī)格是每罐凈重250克,標(biāo)準(zhǔn)差是3克?,F(xiàn)從生產(chǎn)線上隨機(jī)抽取100罐進(jìn)行檢查,稱得其平均凈重251克。問這批罐頭是否合乎規(guī)格凈重?則樣本均值服從均值為250,標(biāo)準(zhǔn)差0.3的正態(tài)分布250250假設(shè)總體服從均值為250,標(biāo)準(zhǔn)差3的正態(tài)分布250250.6249.4樣本均值服從均值為250,標(biāo)準(zhǔn)差0.3的正態(tài)分布2510.95450樣本均值服從均值為250,標(biāo)準(zhǔn)差0.3的正態(tài)分布2.00-2.003.330接受域拒絕域拒絕域臨界值臨界值Z統(tǒng)計(jì)量顯著性水平假設(shè)檢驗(yàn)是對(duì)我們所關(guān)心的卻又是未知的總體參數(shù)先作出假設(shè),然后抽取樣本,利用樣本提供的信息,根據(jù)小概率原理對(duì)假設(shè)的正確性進(jìn)行判斷的一種統(tǒng)計(jì)推斷方法。二、假設(shè)的表達(dá)式例:由統(tǒng)計(jì)資料得知,1989年某地新生兒的平均體重3190千克,現(xiàn)從1990年的新生兒中隨機(jī)抽取100個(gè),測(cè)得其平均體重為3210千克,問1990年的新生兒與1989年相比,體重有無(wú)顯著差異。原假設(shè)(nullhypothesis)采用等式的方式,即如果原假設(shè)不成立,就要拒絕原假設(shè)。在需要的另一個(gè)假設(shè)中做出選擇,這個(gè)假設(shè)稱為備擇假設(shè)(alternativehypothesis)。備擇假設(shè)表達(dá)式為:假設(shè)基本形式

H0:原假設(shè),H1:備擇假設(shè)假設(shè)檢驗(yàn):運(yùn)用統(tǒng)計(jì)理論對(duì)上述假設(shè)進(jìn)行檢驗(yàn),在原假設(shè)與備擇假設(shè)中選擇其一。提出原假設(shè)和備擇假設(shè)某廠生產(chǎn)一種供出口的罐頭,經(jīng)驗(yàn)表明罐頭的凈重服從正態(tài)分布。標(biāo)準(zhǔn)規(guī)格是每罐凈重250克,標(biāo)準(zhǔn)差是3克?,F(xiàn)從生產(chǎn)線上隨機(jī)抽取100罐進(jìn)行檢查,稱得其平均凈重251克。問這批罐頭是否合乎規(guī)格凈重?確定檢驗(yàn)統(tǒng)計(jì)量規(guī)定顯著性水平α顯著性水平α對(duì)應(yīng)犯拒真錯(cuò)誤的概率,通常取α=0.05或α=0.01或α=0.0455計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值作出統(tǒng)計(jì)決策拒絕原假設(shè),即這批罐頭不符合規(guī)格凈重。假設(shè)檢驗(yàn)的另一種方法:p-值的應(yīng)用

p-值是一個(gè)概率值,它是用于確定是否拒絕H0的另一種方法。如果假定原假設(shè)為真,則p-值是所獲得的樣本結(jié)果至少與實(shí)測(cè)結(jié)果不同的概率值。例題:某商品標(biāo)簽上標(biāo)明其重量至少為3公斤以上,現(xiàn)抽取36瓶該產(chǎn)品組成的一個(gè)簡(jiǎn)單隨機(jī)樣本,得其樣本均值2.92公斤,已知總體標(biāo)準(zhǔn)差為0.18時(shí),在顯著性水平α=0.01的情況下檢驗(yàn)其商品標(biāo)簽所標(biāo)內(nèi)容是否真實(shí)?求解過程:(1)原假設(shè)H0:μ≥3,備擇假設(shè)H1:μ<3(2)檢驗(yàn)統(tǒng)計(jì)量為:代入數(shù)據(jù)得:(4)0.0038<0.010,所以拒絕H0。(3)z=-2.67所對(duì)應(yīng)的p值為0.0038三、假設(shè)檢驗(yàn)的兩類錯(cuò)誤

接受或拒絕H0,都可能犯錯(cuò)誤

I類錯(cuò)誤——棄真錯(cuò)誤,發(fā)生的概率為α(αerror)

II類錯(cuò)誤——取偽錯(cuò)誤,發(fā)生的概率為β(βerror)7.2正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)正態(tài)總體參數(shù)假設(shè)檢驗(yàn)的步驟第一步:建立原假設(shè)H0和備擇假設(shè)H1。原假設(shè)應(yīng)該是希望犯第Ι類錯(cuò)誤概率小的假設(shè)。

常用的假設(shè)形式:第二步:選擇檢驗(yàn)用的統(tǒng)計(jì)量。z檢驗(yàn)t檢驗(yàn)F檢驗(yàn)常用統(tǒng)計(jì)量第三步:確定顯著水平α的值,查相應(yīng)的分布表得其臨界值以及拒絕域。第四步:進(jìn)行顯著性判別。7.2.1一個(gè)正態(tài)總體的參數(shù)檢驗(yàn)在一個(gè)正態(tài)總體的參數(shù)檢驗(yàn)中,用到的檢驗(yàn)統(tǒng)計(jì)量主要有三個(gè):Z統(tǒng)計(jì)量,t統(tǒng)計(jì)量,統(tǒng)計(jì)量。Z統(tǒng)計(jì)量和t統(tǒng)計(jì)量常用于均值和比例的檢驗(yàn),統(tǒng)計(jì)量則用于方差檢驗(yàn)。選擇什么統(tǒng)計(jì)量進(jìn)行檢驗(yàn)需要考慮一些因素,這些因素主要有:總體的標(biāo)準(zhǔn)差是否已知,樣本量的大小。(一)總體標(biāo)準(zhǔn)差是否已知總體方差檢驗(yàn)統(tǒng)計(jì)量μ=μ0時(shí)檢驗(yàn)統(tǒng)計(jì)量的分布假設(shè)

拒絕域σ2已知σ2未知(二)樣本量總體標(biāo)準(zhǔn)差已知未知Z統(tǒng)計(jì)量樣本容量Z統(tǒng)計(jì)量t統(tǒng)計(jì)量大小二、總體均值的檢驗(yàn)例題:某廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工的零件的橢圓度漸近服從正態(tài)分布,其總體均值為0.081mm,總體標(biāo)準(zhǔn)差為0.025mm。今另?yè)Q一種新機(jī)床進(jìn)行加工,取200個(gè)零件進(jìn)行檢驗(yàn),得到橢圓度均值為0.076mm。問新機(jī)床加工零件的橢圓度總體均值與以前有無(wú)顯著差別。(α=0.05)接受域拒絕域拒絕域例題:某批發(fā)商欲從廠家購(gòu)進(jìn)一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不能低于1000小時(shí)。已知燈泡使用壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為20小時(shí)。在總體中隨機(jī)抽取了100個(gè)燈泡,得其均值為960小時(shí),批發(fā)商是否應(yīng)該購(gòu)進(jìn)這批燈泡。解一:接受域拒絕域解二:接受域拒絕域

例題:電視機(jī)顯像管批量生產(chǎn)的質(zhì)量標(biāo)準(zhǔn)為平均使用壽命1200小時(shí),標(biāo)準(zhǔn)差為300小時(shí)。某電視機(jī)廠宣稱其生產(chǎn)的顯像管質(zhì)量大大超過規(guī)定標(biāo)準(zhǔn)。為了進(jìn)行驗(yàn)證,隨機(jī)抽取100件為樣本,測(cè)得平均使用壽命為1245小時(shí)。能否說(shuō)該廠的顯像管質(zhì)量顯著地高于規(guī)定標(biāo)準(zhǔn)。解一:接受域拒絕域解二:接受域拒絕域

某機(jī)器制造出的肥皂的標(biāo)準(zhǔn)厚度為5cm,今欲了解機(jī)器性能是否良好,隨機(jī)抽取10塊肥皂為樣本,測(cè)得平均厚度為5.3cm,標(biāo)準(zhǔn)差為0.3cm,試以0.01的顯著性水平檢驗(yàn)機(jī)器性能良好的假設(shè)。接受域拒絕域拒絕域

一個(gè)汽車輪胎制造商聲稱,某一等級(jí)輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000km,對(duì)一個(gè)由120個(gè)輪胎組成的隨機(jī)樣本作了試驗(yàn),測(cè)得平均值和標(biāo)準(zhǔn)差分別為41000km和5000km。已知輪胎壽命的公里數(shù)近似服從正態(tài)分布。能否根據(jù)這些數(shù)據(jù)作出該制造商的產(chǎn)品同他所說(shuō)的標(biāo)準(zhǔn)相符的結(jié)論。接受域拒絕域例題:某高爾夫球場(chǎng)在過去幾個(gè)月里高爾夫運(yùn)動(dòng)者有20%是女性,為增加女性運(yùn)動(dòng)者比率,球場(chǎng)以特價(jià)方式吸引女性運(yùn)動(dòng)者,一周以后,一個(gè)400名運(yùn)動(dòng)者所組成的樣本中,300名為男性,100名為女性。能否得出結(jié)論認(rèn)為球場(chǎng)的女性運(yùn)動(dòng)者比率上升了(α=0.05)。三、總體比例的檢驗(yàn)接受域拒絕域7.2.2兩個(gè)總體參數(shù)的檢驗(yàn)一、兩個(gè)總體參數(shù)之差的抽樣分布大樣本(n1≥30且n2≥30)情形下,近似服從正態(tài)分布,即:式中:σ1──總體1的標(biāo)準(zhǔn)差

σ2──總體2的標(biāo)準(zhǔn)差

n1──來(lái)自總體1簡(jiǎn)單隨機(jī)樣本的的樣本容量

n2──來(lái)自總體2簡(jiǎn)單隨機(jī)樣本的的樣本容量σ1和σ2已知式中:s1──來(lái)自總體1的樣本標(biāo)準(zhǔn)差

s2──來(lái)自總體2的樣本標(biāo)準(zhǔn)差

n1──來(lái)自總體1簡(jiǎn)單隨機(jī)樣本的的樣本容量

n2──來(lái)自總體2簡(jiǎn)單隨機(jī)樣本的的樣本容量σ1和σ2未知大樣本(n1≥30且n2≥30)情形下,近似服從正態(tài)分布,即:小樣本情形下,存在自由度為n1+n2-2的t分布,即:式中:s1──來(lái)自總體1的樣本標(biāo)準(zhǔn)差

s2──來(lái)自總體2的樣本標(biāo)準(zhǔn)差

n1──來(lái)自總體1簡(jiǎn)單隨機(jī)樣本的的樣本容量

n2──來(lái)自總體2簡(jiǎn)單隨機(jī)樣本的的樣本容量σ1和σ2未知,但已知σ1=σ2

有兩種方法可用于制造某種以抗拉強(qiáng)度為重要特征的產(chǎn)品。根據(jù)以往的資料得知,第一種方法生產(chǎn)出的產(chǎn)品其抗拉強(qiáng)度的標(biāo)準(zhǔn)差為8kg,第二種方法的標(biāo)準(zhǔn)差為10kg。從兩種方法生產(chǎn)的產(chǎn)品中各抽一個(gè)隨機(jī)樣本,樣本的容量分別為n1=32,n2=40,測(cè)得=50kg,=44kg。問兩種方法生產(chǎn)出來(lái)的產(chǎn)品平均抗拉強(qiáng)度是否有顯著差別(α=0.05)。

一個(gè)車間研究用兩種不同的工藝組裝某種產(chǎn)品所用的時(shí)間是否相同。讓一個(gè)組的10工人用第一種工藝組裝該種產(chǎn)品,平均所需時(shí)間為26.1分鐘,樣本標(biāo)準(zhǔn)差為12分鐘。另一組8名工人用第二種工藝組裝,平均所需時(shí)間為17.6分鐘,標(biāo)準(zhǔn)差為10.5分鐘。已知用兩種工藝組裝產(chǎn)品所用時(shí)間服從正態(tài)分布,且σ1=σ2,試問能否認(rèn)為用第二種方法組裝比第一種方法要好。

某制造公司有兩種方法可供員工執(zhí)行某生產(chǎn)任務(wù)。為使產(chǎn)出最大化,公司試圖確認(rèn)哪種方法有最短完成時(shí)間。抽取樣本有兩個(gè)可供選擇的方案1、獨(dú)立樣本方案:抽取工人的一個(gè)簡(jiǎn)單隨機(jī)樣本,其中每個(gè)工人使用方法1;抽取工人的另一個(gè)簡(jiǎn)單隨機(jī)樣本,其中每個(gè)工人使用方法2。均值差的檢驗(yàn)可采用前述獨(dú)立樣本條件下的檢驗(yàn)方法。2、匹配樣本方案:抽取工人的一個(gè)簡(jiǎn)單隨機(jī)樣本,每個(gè)工人選用一種方法,后用另一種方法,兩種方法的次序是隨機(jī)排列的;每個(gè)工人提供一對(duì)數(shù)據(jù),一個(gè)是方法1的,另一個(gè)是方法2的。工人方法1的完成時(shí)間(分鐘)方法2的完成時(shí)間(分鐘)完成時(shí)間的差值(di)1234566.05.07.06.26.06.45.45.26.55.96.05.80.6-0.20.50.30.00.6匹配樣本數(shù)據(jù)

匹配樣本方案中,兩種生產(chǎn)方法是在相似的條件下被檢驗(yàn)的(即由同一個(gè)工人執(zhí)行),所以該方案往往比獨(dú)立樣本方案有更小的抽樣誤差。這主要是由于匹配樣本方案中作為抽樣誤差來(lái)源之一的工人個(gè)體間的差異被去掉了。差值(di)的樣本均值與樣本標(biāo)準(zhǔn)差假設(shè)差值(di)服從正態(tài)分布,則檢驗(yàn)統(tǒng)計(jì)量樣本數(shù)據(jù)沒有提供足夠的證據(jù)拒絕H0。對(duì)α=0.05,自由度為n-1=5的t分布(t0.025=2.571),雙側(cè)檢驗(yàn)的拒絕法則為:如果t<-2.571或t>2.571,則拒絕H0。檢驗(yàn)的統(tǒng)計(jì)量的值為:二、兩個(gè)總體比率之差的檢驗(yàn)大樣本情形下,p1-p2近似服從正態(tài)分布,即:p1-p2抽樣分布

對(duì)兩個(gè)大型企業(yè)青年工人參加技術(shù)培訓(xùn)的情況進(jìn)行調(diào)查,調(diào)查結(jié)果如下:甲廠:調(diào)查60人,18人參加技術(shù)培訓(xùn)。乙廠:調(diào)查查40人,14人參加技術(shù)培訓(xùn)。能否根據(jù)以上調(diào)查結(jié)果認(rèn)為乙廠工人參加技術(shù)培訓(xùn)的人數(shù)比例高于甲廠(α=0.05)。7.3.1單個(gè)總體的t檢驗(yàn)

(One-SampleTTest)分析

單個(gè)總體的t檢驗(yàn)分析也稱為單一樣本的t檢驗(yàn)分析,也就是檢驗(yàn)單個(gè)變量的均值是否與假定的均數(shù)之間存在差異。如將單個(gè)變量的樣本均值與假定的常數(shù)相比較,通過檢驗(yàn)得出預(yù)先的假設(shè)是否正確的結(jié)論。例1:根據(jù)2002年我國(guó)不同行業(yè)的工資水平,檢驗(yàn)國(guó)有企業(yè)的職工平均年工資收入是否等于10000元,假設(shè)數(shù)據(jù)近似地服從正態(tài)分布。首先建立假設(shè):H0:國(guó)有企業(yè)工資為10000元;H1:國(guó)有企業(yè)職工工資不等于10000元檢驗(yàn)過程的操作按照下列步驟:1、單擊Analyze

CompareMeans

One-SampleTTest,打開One-SampleTTest主對(duì)話框,如圖所示。

2、從左邊框中選中需要檢驗(yàn)的變量(國(guó)有單位)進(jìn)入檢驗(yàn)框中。3、在TestValue框中鍵入原假設(shè)的均值數(shù)10000。4、單擊Options按鈕,得到Options對(duì)話框,選項(xiàng)分別是置信度(默認(rèn)項(xiàng)是95%)和缺失值的處理方式。選擇后默認(rèn)值后返回主對(duì)話框。5、單擊OK,得輸出結(jié)果。如表所示。從上面檢驗(yàn)結(jié)果表(1)可以得出國(guó)有單位職工工資的平均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤等反映數(shù)據(jù)特征的數(shù)據(jù)。從表(2)中可知檢驗(yàn)的結(jié)果。即相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量t值為4.121,自由度為30,假設(shè)檢驗(yàn)的P值(sig)小于0.05,故原假設(shè)不成立,檢驗(yàn)結(jié)論是拒絕原假設(shè)H0,接受假設(shè)H1。即認(rèn)為國(guó)有企業(yè)職工的平均工資與10000元的假設(shè)差異顯著。例題:為確認(rèn)某市12—15歲青少年是否達(dá)到160.0厘米的標(biāo)準(zhǔn)身高,對(duì)該市同年齡段的青少年作了一次抽樣調(diào)查,獲樣本數(shù)據(jù)如下。試以0.05的顯著性水平作出統(tǒng)計(jì)推斷。序號(hào)性別年齡身高體重序號(hào)性別年齡身高體重1

2

3

4

5

6

7

8

9

101112131415男男男男男女女女女女男男男男男131313131313131313131314141414156.0155.0144.6161.5161.3158.0161.0162.0164.3144.0157.9176.1168.0164.5153.047.537.838.641.643.347.347.147.033.833.849.254.550.044.058.0161718192021222324252627282930女女女女女男男男男男女女女女女141414141415151515151515151515164.7160.5147.0153.2157.9166.0169.0170.0165.1172.0159.4161.3158.0158.6169.044.153.036.430.140.457.058.551.058.055.044.745.444.342.851.1三十名學(xué)生的身高與體重?cái)?shù)據(jù)7.3.2兩個(gè)總體的t檢驗(yàn)7.2.1兩個(gè)獨(dú)立樣本的t檢驗(yàn)(Independent-samplesTTest)Independent-sampleTTest是檢驗(yàn)兩個(gè)沒有聯(lián)系的總體樣本均值間是否存在顯著的差異,兩個(gè)沒有聯(lián)系的總體樣本也稱獨(dú)立樣本。例2.某醫(yī)藥研究所考察一種藥品對(duì)男性和女性的治療效果是否有顯著差異,調(diào)查了10名男性服用者及7名女性服用者,對(duì)他們服藥后的各項(xiàng)指標(biāo)進(jìn)行綜合評(píng)分,服用的效果越好,分值就越高,每人所得的總分見下表,試根據(jù)表中的數(shù)據(jù)檢驗(yàn)這種藥品對(duì)男性和女性的治療效果是否存在顯著差異。解:由于藥品對(duì)男性或女性的影響是無(wú)聯(lián)系的,因此這兩個(gè)樣本是相互獨(dú)立的??梢詰?yīng)用兩獨(dú)立樣本的假設(shè)檢驗(yàn)。首先,建立假設(shè)H0:該藥品對(duì)男性和女性的治療效果沒有顯著差異;H1:該藥品對(duì)男性和女性的治療效果有顯著差異。具體操作步驟:1、單擊Analyze

CompareMeans

Independent-sampleTTest,打開Independent-sampleTTest主對(duì)話框如圖。2、選擇要檢驗(yàn)的變量“綜合得分”進(jìn)入檢驗(yàn)框中。3、選擇分組變量“性別”進(jìn)入分組框中,然后單擊DefineGroup按紐,打開分組對(duì)話框如圖所示,確定分組值后返回主對(duì)話框,如果沒有分組,可以選擇Cutpoint單選項(xiàng),并在激活的框內(nèi)輸入一個(gè)值作為分組界限值。4、由Option選擇按紐確定置信度值和缺失值的處理方式。5、點(diǎn)擊OK可得輸出結(jié)果。第三列和第四列是檢驗(yàn)兩樣本數(shù)據(jù)的方差是否相等,從檢驗(yàn)結(jié)果得知兩樣本的方差沒有顯著差異。從第五列開始是對(duì)兩個(gè)樣本的均值的是否相等進(jìn)行檢驗(yàn)。從假設(shè)檢驗(yàn)的P值看出,它大于顯著性水平0.05,所以說(shuō)男女之間的機(jī)械能力之間并無(wú)顯著差異,因此接受原假設(shè)H0。而第八列之后分別是均值差、均值差標(biāo)準(zhǔn)誤、均值差的置信區(qū)間。序號(hào)性別年齡身高體重序號(hào)性別年齡身高體重1

2

3

4

5

6

7

8

9

101112131415男男男男男女女女女女男男男男男131313131313131313131314141414156.0155.0144.6161.5161.3158.0161.0162.0164.3144.0157.9176.1168.0164.5153.047.537.838.641.643.347.347.147.033.833.849.254.550.044.058.0161718192021222324252627282930女女女女女男男男男男女女女女女141414141415151515151515151515164.7160.5147.0153.2157.9166.0169.0170.0165.1172.0159.4161.3158.0158.6169.044.153.036.430.140.457.058.551.058.055.044.745.444.342.851.1三十名學(xué)生的身高與體重?cái)?shù)據(jù)試以0.10的顯著性水平,對(duì)該市男女青少年的身高進(jìn)行比較。7.3.3兩個(gè)有聯(lián)系總體間的均值比較

(Paired-SampleTTest)

Paired-SampleTTest是檢驗(yàn)兩個(gè)有聯(lián)系正態(tài)總體的均值是否存在顯著的差異。又稱配對(duì)樣本的t檢驗(yàn)。

例3:某企業(yè)對(duì)生產(chǎn)線上的工人進(jìn)行某種專業(yè)技術(shù)培訓(xùn),要對(duì)培訓(xùn)效果進(jìn)行檢驗(yàn),從參加培訓(xùn)的工人中抽取30人,將他們培訓(xùn)前后的數(shù)據(jù)每加工500個(gè)零件的不合格品數(shù)進(jìn)行對(duì)比,得到數(shù)據(jù)表見表。試根據(jù)表中數(shù)據(jù)檢驗(yàn)培訓(xùn)前后工人的平均操作技術(shù)水平是否有顯著提高,也就是檢驗(yàn)培訓(xùn)效果是否顯著。解:這顯然是配對(duì)樣本均值的假設(shè)檢驗(yàn)的問題。所以要建立假設(shè):H0:培訓(xùn)前后工人的技術(shù)水平?jīng)]有顯著差異;H1:培訓(xùn)前后工人的技術(shù)水平有顯著差異;根據(jù)中心極限定理,在大樣本的情況下,樣本均值近似地服從正態(tài)分布。所以可以利用正態(tài)參數(shù)的檢驗(yàn)方法進(jìn)行均值的檢驗(yàn)。其檢驗(yàn)過程的具體操作步驟為:1、單擊Analyze

CompareMeans

Paired-SampleTTest,打開Paired-SampleTTest主對(duì)話框如圖

2、選擇要檢驗(yàn)的兩變量進(jìn)入檢驗(yàn)框中,注意,一定要選擇兩個(gè)變量進(jìn)入檢驗(yàn)框內(nèi),否則將無(wú)法得到檢驗(yàn)結(jié)果。3、由Option選擇按紐確定置信度值95%和缺失值的處理方式。4、點(diǎn)擊OK得輸出結(jié)果。5、根據(jù)輸出結(jié)果作出結(jié)論如表所示。上表的檢驗(yàn)結(jié)果知,假設(shè)檢驗(yàn)的P值小于0.05,因此可以得出培訓(xùn)前后的差異是顯著的,故拒絕假設(shè)H0,接受假設(shè)H1,認(rèn)為培訓(xùn)的效果是顯著的。

為分析不同促銷形式對(duì)商品銷售額是否產(chǎn)生顯著影響,分別搜集了7種商品在不同促銷形式下的銷售額數(shù)據(jù)。試對(duì)兩種促銷效果作出統(tǒng)計(jì)推斷。商品促銷形式1促銷形式2123456765737330735673343637264337607.4方差分析7.4.1方差分析的基本問題一、方差分析的內(nèi)容1、定義:方差分析就是對(duì)多個(gè)總體均值是否相等這一假設(shè)進(jìn)行檢驗(yàn)。

某飲料企業(yè)生產(chǎn)一種新型飲料。飲料的顏色分為黃色、無(wú)色、粉色和綠色四種。為確定飲料的顏色是否對(duì)飲料的銷售量有顯著影響,從5個(gè)超市中搜集了該種飲料的樣本數(shù)據(jù)如下表所示。管理者想用這些樣本數(shù)據(jù)來(lái)檢驗(yàn)假設(shè):顏色對(duì)銷售量沒有顯著影響。超市黃色無(wú)色粉色綠色1234527.925.128.524.226.526.528.725.129.127.231.228.330.827.929.630.829.632.431.732.8樣本均值

樣本方差=26.44=3.298=27.32=2.672=29.56=2.143=31.46=1.658總均值=28.695

方差分析是對(duì)多個(gè)總體均值是否相等這一假設(shè)進(jìn)行檢驗(yàn)。四種顏色飲料銷售量樣本數(shù)據(jù)總體1總體2總體3總體4因變量或稱響應(yīng)變量自變量或稱因素水平1水平2水平3水平4處理1處理2處理3處理4樣本1樣本2樣本3樣本4方差分析的基本原理方差分析的假定條件1.對(duì)每個(gè)總體,響應(yīng)變量服從正態(tài)分布:2.對(duì)每個(gè)總體,響應(yīng)變量的方差相同:3.觀察值是獨(dú)立的總體1總體3總體4總體2不盡相等方差分析的基本原理于是:各個(gè)水平下的觀測(cè)值可視為相應(yīng)總體的隨機(jī)樣本。方差分析的問題就變?yōu)椋簷z驗(yàn)所有數(shù)據(jù)是否可以看作來(lái)自同一總體的樣本。

原假設(shè)為假時(shí),樣本均值來(lái)自不同的抽樣分布。

原假設(shè)為真時(shí),樣本均值來(lái)自同一個(gè)抽樣分布。不盡相等不盡相等1m方差分析的基本原理二、方差分析的原理(一)數(shù)據(jù)差異的來(lái)源1、因素的水平不同(系統(tǒng)性差異);2、隨機(jī)因素(隨機(jī)性差異)。(二)、數(shù)據(jù)差異的度量1、水平之間的方差(組間方差)——系統(tǒng)性因素和隨機(jī)因素的共同作用。2、水平內(nèi)部的方差(組內(nèi)方差)——隨機(jī)性因素的作用。(三)、方差分析的基本思想:如果因素對(duì)結(jié)果沒有影響,那么水平間的方差就只含隨機(jī)性差異而沒有系統(tǒng)性差異,其值與水平內(nèi)部方差就應(yīng)該很接近,兩個(gè)方差的比值就會(huì)接近于1;反之,水平間方差就同時(shí)包含系統(tǒng)性差異和隨機(jī)性差異,兩個(gè)方差的比值就會(huì)明顯大于1,當(dāng)這個(gè)比值大到某個(gè)程度(比如說(shuō)大于某個(gè)臨界值)就可以作結(jié)論:不同水平間存在顯著差異。三、檢驗(yàn)統(tǒng)計(jì)量1、方差分析的統(tǒng)計(jì)假設(shè):;2、檢驗(yàn)的統(tǒng)計(jì)量:組間均方差與組內(nèi)均方差之比

是一個(gè)統(tǒng)計(jì)量,服從分布(Distribution)。至少兩個(gè)總體的均值不等7.4.2單因素方差分析觀測(cè)值因素(i)(j)A1A2…Ak1x11x21…xk12x12x22…xk2……………nx1nx2n…xkn一、單因素方差分析的步驟(一)計(jì)算水平均值和總體均值二、關(guān)系強(qiáng)度的測(cè)量7.4.1單因素方差分析-spss單因變量的單因素方差分析主要解決多于兩個(gè)總體樣本或變量間均值的比較問題。是一種對(duì)多個(gè)(大于兩個(gè))總體樣本的均值是否存在顯著差異的檢驗(yàn)方法。其目的也是對(duì)不同的總體的數(shù)據(jù)的均值之間的差異是否顯著進(jìn)行檢驗(yàn)。單因素方差分析的應(yīng)用條件:在不同的水平(因素變量取不同值)下,各總體應(yīng)當(dāng)服從方差相等的正態(tài)分布。例4,某企業(yè)需要一種零件,現(xiàn)有三個(gè)不同的地區(qū)的企業(yè)生產(chǎn)的同種零件可供選擇,為了比較這三個(gè)零件的強(qiáng)度是否相同,每個(gè)地區(qū)的企業(yè)抽出6件產(chǎn)品進(jìn)行強(qiáng)度測(cè)試,其值如表所示。假設(shè)每個(gè)企業(yè)零件的強(qiáng)度值服從正態(tài)分布,試檢驗(yàn)這三個(gè)地區(qū)企業(yè)的零件強(qiáng)度是否存在顯著差異。解:首先建立假設(shè)H0:三個(gè)地區(qū)的零件強(qiáng)度無(wú)顯著差異;H1:三個(gè)地區(qū)的零件強(qiáng)度有顯著差異。具體操作過程如下:1、單擊Analyze

CompareMeans

One-WayANOVA,打開One-WayANOVA對(duì)話框。2、從左框中選擇因變量”零件強(qiáng)度”進(jìn)入Dependentlist框內(nèi),選擇因素變量”地區(qū)”進(jìn)入Factor框內(nèi)。點(diǎn)擊OK就可以得到方差分析下表。由于F統(tǒng)計(jì)量值的P值明顯小于顯著性水平0.05,故拒絕假設(shè)H0,認(rèn)為這三個(gè)地區(qū)的零件強(qiáng)度有顯著差異。如果需要對(duì)各地區(qū)間的零件強(qiáng)度進(jìn)行進(jìn)一步的比較和分析,可以通過按鈕Option選項(xiàng),contrast對(duì)照比較,PostHoc多重比較去實(shí)現(xiàn)。3、單擊Option按紐,打開Option對(duì)話框如圖所示:在Option選項(xiàng)中選擇輸出項(xiàng)。主要有不同水平下樣本方差的齊性檢驗(yàn),缺失值的處理方式及均值的圖形。本例中選擇Homogeneityofvariancetest進(jìn)行不同水平間方差齊性的檢驗(yàn)以及Descriptive基本統(tǒng)計(jì)描述。在MissingValue欄中選擇系統(tǒng)默認(rèn)項(xiàng)。完成所有選擇后返回主對(duì)話框,然后單擊OK,就可以得到三個(gè)地區(qū)零件強(qiáng)度分析表。4、Contrasts按鈕可以用來(lái)進(jìn)一步分析隨著控制變量水平的變化,觀測(cè)值變化的總體趨勢(shì)以及進(jìn)一步比較任意指定水平間的均值差異是否顯著。單擊Contrasts按鈕,打開One-WayANOVA:Contrasts對(duì)話框,見圖。如果要對(duì)組間平方和進(jìn)行趨勢(shì)成分檢驗(yàn),選中Polynomial多項(xiàng)式復(fù)選項(xiàng),選中后激活Degree參數(shù)框,在Degree框中選擇趨勢(shì)檢驗(yàn)多項(xiàng)式的階數(shù),有最高次數(shù)可達(dá)5次。系統(tǒng)將給出指定階數(shù)和低于指定階次各階次的自由度、F值和F檢驗(yàn)的概率值。在Contrast欄,指定需要對(duì)照比較兩個(gè)水平的均值。在Coefficients框中輸入一個(gè)系數(shù),單擊Add按紐,系數(shù)就進(jìn)入到Coefficients框中。重復(fù)上述,依次輸入各組均值的系數(shù)。注意系數(shù)的和應(yīng)當(dāng)?shù)扔?。如;圖就是指第一個(gè)水平與第三個(gè)水平的均值差比較。5、如果需要將水平間兩兩比較,可以單擊PostHoc按紐,打開多重比較對(duì)話框。在該對(duì)話框中列出了二十種多重比較檢驗(yàn),涉及到許多的數(shù)理統(tǒng)計(jì)方法,在實(shí)際中只選用其中常用的方法即可。對(duì)話框下部的Significancelevel表示顯著性水平,默認(rèn)值是0.05,也可以根據(jù)需要重新輸入其它值。如果滿足在水平間方差相等的條件,常用LSD(least-significantdifference最小顯著性差異法),表示用t檢驗(yàn)完成各組均值間的配對(duì)比較。當(dāng)方差不等的情況下,可以選擇Tamhane

sT2,用t檢驗(yàn)進(jìn)行各組均值間的配對(duì)比較。從表可以看出,地區(qū)2與地區(qū)3之間的差異是非常顯著的,它們均值差的檢驗(yàn)的尾概率為0.005,明顯小于顯著性水平0.05。

四種顏色飲料銷售量樣本數(shù)據(jù)超市黃色無(wú)色粉色綠色1234527.925.128.524.226.526.528.725.129.127.231.228.330.827.929.630.829.632.431.732.8[數(shù)據(jù)集12]=2=3=4color=1sale定義變量單因素方差分析調(diào)用此過程可完成單因素方差分析單因素方差分析

單因素方差分析的基本過程可采納系統(tǒng)的默認(rèn)方式。各種

選項(xiàng)多重比較F統(tǒng)計(jì)量=10.544的P值=0.000<0.05。故拒絕原假設(shè),接受備擇假設(shè),即不同顏色的飲料的銷售量有顯著差異。單因素方差分析

對(duì)四種顏色下各總體的均值進(jìn)行多重比較。最小顯著性差異法

由于方差分析的前提是各水平下的總體服從方差相等的正態(tài)分布,因此須對(duì)方差分析的前提進(jìn)行檢驗(yàn)。輸出不同水平下的描述性統(tǒng)計(jì)量輸出方差相等性的檢驗(yàn)結(jié)果輸出各水平下均值的折線圖。計(jì)算中涉及的變量含有缺失值時(shí)暫時(shí)剔除觀測(cè)剔除所有含有缺失值的觀測(cè)

檢驗(yàn)統(tǒng)計(jì)量=0.255相伴P值=0.856>0.05故可以認(rèn)為4種水平下各總體的方差無(wú)顯著差異,滿足單因素方差分析中的方差相等性要求。單因素方差分析樣本數(shù)據(jù)所顯示的四種顏色飲料銷售量的差異。單因素方差分析第8章非參數(shù)檢驗(yàn)

前面進(jìn)行的假設(shè)檢驗(yàn)和方差分析,大都是在數(shù)據(jù)服從正態(tài)分布或近似地服從正態(tài)分布的條件下進(jìn)行的。但是如果總體的分布未知,如何進(jìn)行總體參數(shù)的檢驗(yàn),或者如何檢驗(yàn)總體服從一個(gè)指定的分布,都可以歸結(jié)為非參數(shù)檢驗(yàn)方法。非參數(shù)檢驗(yàn)包括下列內(nèi)容: 本章主要內(nèi)容:1、總體分布的假設(shè)檢驗(yàn);2、兩種以上的現(xiàn)象之間的關(guān)聯(lián)性檢驗(yàn)(見列聯(lián)分析);3、總體分布未知時(shí),關(guān)于單個(gè)總體均值的檢驗(yàn);兩個(gè)總體均值或分布的差異是否顯著的檢驗(yàn),以及多個(gè)未知總體的單因素方差分析。4、某種現(xiàn)象的出現(xiàn)的隨機(jī)性檢驗(yàn);在SPSS分析軟件中,非參數(shù)檢驗(yàn)在菜單Analyze?NonparametricTest中顯示,共有8種檢驗(yàn)方法。這8種檢驗(yàn)方法依次是:Chi-square卡方檢驗(yàn)Binomial二項(xiàng)分布檢驗(yàn)Runs游程檢驗(yàn)1-SampleK-S單個(gè)樣本柯爾莫哥洛夫-斯米諾夫檢驗(yàn)2Independentsample兩個(gè)獨(dú)立樣本檢驗(yàn)KIndependentsampleK個(gè)獨(dú)立樣本檢驗(yàn)2RelatedIndependentsample兩個(gè)相關(guān)樣本檢驗(yàn)KRelatedIndependentsampleK個(gè)相關(guān)樣本檢驗(yàn)8.1Chi-SquareTest卡方檢驗(yàn)卡方檢驗(yàn)是一種常用的檢驗(yàn)總體分布是否服從指定的分布的一種非參數(shù)檢驗(yàn)方法。其檢驗(yàn)思想是:將總體的取值范圍分成有限個(gè)互不相容的子集,從總體中抽取一個(gè)樣本,考察樣本觀察值落到每個(gè)子集中的實(shí)際頻數(shù),并按假設(shè)的總體分布計(jì)算每個(gè)子集的理論頻數(shù),最后根據(jù)實(shí)際頻數(shù)和理論頻數(shù)的差構(gòu)造卡方統(tǒng)計(jì)量,當(dāng)原假設(shè)成立時(shí),統(tǒng)計(jì)量服從卡方分布。以此來(lái)檢驗(yàn)假設(shè)總體的分布是否成立。下面通過例題來(lái)說(shuō)明具體的檢驗(yàn)方法。例10.1擲一個(gè)骰子300次,每個(gè)面出現(xiàn)的次數(shù)(取變量名為Shi)見表,用數(shù)字1,2,3,4,5,6分別表示六個(gè)面的點(diǎn)數(shù),試在顯著性水平0.05下檢驗(yàn)顆骰子是否是均勻的?解:如果這個(gè)骰子是均勻的,則每次試驗(yàn)出現(xiàn)六個(gè)點(diǎn)數(shù)的可能性是相等的。建立原假設(shè)H0:每個(gè)點(diǎn)出現(xiàn)的概率等于1/6;備擇假設(shè)H1:每個(gè)點(diǎn)出現(xiàn)的概率不等于1/6。具體操作步驟:1、首先建立數(shù)據(jù)文件,注意變量Shi的變量值是300次試驗(yàn)的所有結(jié)果。然后單擊Analyze

NonparametricTest

Chi-SquareTest,Chi-SquareTest打開對(duì)話框如圖所示。2、指定檢驗(yàn)統(tǒng)計(jì)量,本例中選擇變量Shi進(jìn)入檢驗(yàn)框中。3、在ExpectValues欄內(nèi)指定期望分布的頻數(shù)值,有兩個(gè)選擇項(xiàng)。4、在ExpectRange

欄中指定檢驗(yàn)值的范圍。系統(tǒng)默認(rèn)從數(shù)據(jù)中得到的最小值和最大值作為取值范圍,也可選擇自定義取值范圍。本例中選擇系統(tǒng)默認(rèn)項(xiàng)。5、單擊Option按鈕,打開對(duì)話框如下圖所示,對(duì)話框中有兩個(gè)選擇欄:Statistics欄,選擇輸出的統(tǒng)計(jì)量:有統(tǒng)計(jì)描述和四分位數(shù)兩個(gè)選項(xiàng),基本統(tǒng)計(jì)描述輸出變量的均值、標(biāo)準(zhǔn)差、最大值和最小值,缺失值數(shù)量等。MissingValue欄,選擇處理缺失值的方式。本例中選擇系統(tǒng)默認(rèn)項(xiàng),將剔除參與對(duì)比的缺失值

7、單擊OK,系統(tǒng)運(yùn)行,輸出結(jié)果如表所示。8.2一個(gè)樣本的K-S檢驗(yàn)Chi-SquareTest卡方檢驗(yàn)在進(jìn)行均勻分布時(shí)的檢驗(yàn)比較方便,但在進(jìn)行其它總體分布的檢驗(yàn)時(shí)需要預(yù)先計(jì)算出理論分布期望值并輸入到計(jì)算機(jī)中。這樣操作起來(lái)比較麻煩,下面介紹一種K-S檢驗(yàn)方法,可以非常方便快捷地檢驗(yàn)常用的四種總體分布形式,使檢驗(yàn)過程更加簡(jiǎn)單。一個(gè)樣本的K-S檢驗(yàn)又稱單個(gè)樣本柯爾莫哥洛夫-斯米諾夫檢驗(yàn),這種檢驗(yàn)可以檢驗(yàn)樣本數(shù)據(jù)是否服從Normal正態(tài)分布、Poisson泊松分布、Uniform均勻分布及Exponential指數(shù)分布等四種分布形式。但一般要求在大樣本條件下進(jìn)行檢驗(yàn)。下面通過例題介紹這種檢驗(yàn)方法。例5.2:某棉織廠質(zhì)量檢驗(yàn)部門抽檢驗(yàn)了50匹布,每匹布上的疵點(diǎn)數(shù)如下:21011205113011201100134001141252624151120110320233試檢驗(yàn)布匹上的疵點(diǎn)是否服從的泊松分布。(α=0.05解:如果只檢驗(yàn)疵點(diǎn)數(shù)的分布,可以用一個(gè)樣本的K-S檢驗(yàn)。即檢驗(yàn)假設(shè):H0:布匹上的疵點(diǎn)服從泊松分布,H1:布匹上的疵點(diǎn)不服從泊松分布。具體檢驗(yàn)的操作過程如下:1、根據(jù)原始數(shù)據(jù)建立數(shù)據(jù)文件,在其數(shù)據(jù)編輯窗口單擊Analyze

NonparametricTest

1-sampleK-S,打開對(duì)話框。2、選擇檢驗(yàn)變量“疵點(diǎn)”進(jìn)入檢驗(yàn)框;3、在TestDistribution欄中選擇檢驗(yàn)數(shù)據(jù)的分布假設(shè),系統(tǒng)默認(rèn)正態(tài)分布,根據(jù)本例中的要求,選擇泊松分布。4、在Options對(duì)話框中選擇輸出結(jié)果形式及缺失值處理方式。5、單擊OK。從上面的檢驗(yàn)結(jié)果可以看出,樣本平均值為1.68,由樣本計(jì)算的統(tǒng)計(jì)量為0.569,假設(shè)檢驗(yàn)的P值為0.902,遠(yuǎn)遠(yuǎn)大于0.05,所以可以認(rèn)定疵點(diǎn)數(shù)服從泊松分布,故接受假設(shè)H0。如果將要檢驗(yàn)布匹上的疵點(diǎn)是否服從λ=1.5.的泊松分布。則要通過Chi-square檢驗(yàn)。即檢驗(yàn)假設(shè)H0:布匹上的疵點(diǎn)服從λ=1.5.泊松分布,H1:布匹上的疵點(diǎn)不服從λ=1.5.泊松分布。設(shè)λ=1.5,通過泊松分布的分布計(jì)算出X取每一值概率并得出理論頻數(shù)如表。具體檢驗(yàn)步驟如下:1、打開數(shù)據(jù)文件,在數(shù)據(jù)編輯窗口單擊Analyze

NonparametricTest

Chi-SquareTest,打開Chi-SquareTest對(duì)話框。2、指定檢驗(yàn)統(tǒng)計(jì)量本例中選擇變量疵點(diǎn)進(jìn)入檢驗(yàn)框中。3、在ExpectValues欄內(nèi)指定理論值,選擇Values,依次輸入各組由給定分布所計(jì)算的理論值,每輸入一個(gè)值,點(diǎn)擊Add,直到輸入全部理論值為止。4、單擊OK,系統(tǒng)運(yùn)行。

從上面的結(jié)果可以看出,由樣本計(jì)算的統(tǒng)計(jì)量值為12.671,P值小于0.05,故接受H1,認(rèn)為每匹布的疵點(diǎn)數(shù)不是服從λ=1.5的泊松分布。但是,注意,在這次檢驗(yàn)中頻數(shù)小于5的值太多,按照卡方檢驗(yàn)法的條件,應(yīng)當(dāng)適當(dāng)合并小于5的組,將疵點(diǎn)數(shù)大于等于4的觀察值合并成一組,再進(jìn)行檢驗(yàn),在合并時(shí)注意定義一個(gè)新的變量,給變量值重新編碼,主要將變量值大于等于4(有4,5,6三個(gè)值)的值賦予同一個(gè)碼值,即相當(dāng)于一個(gè)組,與之相應(yīng)的觀測(cè)頻數(shù)和理論頻數(shù)合并相加后,再進(jìn)行卡方檢驗(yàn),就可以得到最終結(jié)果。8.3兩個(gè)獨(dú)立樣本的檢驗(yàn)(TestforTwoIndependentSample)

如果兩個(gè)無(wú)聯(lián)系總體的分布是未知的,則檢驗(yàn)兩個(gè)總體的均值或分布是否有顯著差異的方法是一種非參數(shù)檢驗(yàn)方法,或者稱為兩個(gè)獨(dú)立樣本的檢驗(yàn)。檢驗(yàn)是通過兩個(gè)總體中分別抽取的隨機(jī)樣本數(shù)據(jù)進(jìn)行的。下面通過例題解釋具體操作過程。例3:為了調(diào)查甲、乙兩地的土壤對(duì)種植的同一種西瓜有無(wú)影響,從這兩個(gè)產(chǎn)地分別隨機(jī)抽取同種的8只和7只西瓜,重量(市斤)如下:試根據(jù)樣本數(shù)據(jù)檢驗(yàn)兩地的土壤對(duì)種植西瓜在重量上是否有顯著差異。解:建立假設(shè)H0:甲乙兩地的西瓜重量沒有顯著差異;H1:甲乙兩地的西瓜重量有沒有顯著差異。然后根據(jù)上面給出的數(shù)據(jù)建立數(shù)據(jù)文件,注意數(shù)據(jù)文件中有一個(gè)表示重量數(shù)據(jù)的變量和一個(gè)表示地區(qū)分組的變量。最后在數(shù)據(jù)編輯窗口進(jìn)行檢驗(yàn)。檢驗(yàn)的具體操作過程如下:1、單擊Analyze

NonparametricTest

2IndependentSample,打開Two-Independent-Sample對(duì)話框如圖所示。2、選擇檢驗(yàn)的變量進(jìn)入檢驗(yàn)框中,選擇分組變量進(jìn)入GroupingVariable框中,單擊DefineGroup鍵,打開DefineGroup對(duì)話框。3、在TestType欄中,確定檢驗(yàn)方法。SPSS中提供了四種檢驗(yàn)方式:這四種方式分別是:Mann-WhitneyU曼—惠特尼檢驗(yàn),同時(shí)適用于小樣本和大樣本的情況。Kolmogorov-SmirnovZK-S檢驗(yàn),適用于大樣本的情況。MasesExtremeReactions極端反應(yīng)檢驗(yàn),適用于小樣本的情況。

Wald-Wolfowitzruns游程檢驗(yàn),適用于大樣本的情況。這四種檢驗(yàn)方法的側(cè)重點(diǎn)有所不同,但都是先將兩樣本數(shù)據(jù)混合排序,再?gòu)牟煌慕嵌确治霾z驗(yàn)兩個(gè)獨(dú)立總體的分布是否有顯著的差異。有時(shí)這幾種檢驗(yàn)結(jié)果可能不一樣,所以要結(jié)合數(shù)據(jù)的探索分析考察數(shù)據(jù)的分布狀況作出結(jié)論。常用的檢驗(yàn)方法是Mann-WhitneyU方法,該方法同時(shí)適用于大樣本和小樣本的情況。本例中就選擇Mann-Whitney和Kolmogorov-Smirnov方法。4、選擇輸出的結(jié)果形式及缺失值處理方式;5、單擊OK,得輸出結(jié)果。

上表中顯示的是Mann-WhitneyU曼—惠特尼檢驗(yàn)的秩和表,右表中有適用于大小兩種樣本的統(tǒng)計(jì)量,由于例題是小樣本的情況,所以選擇小樣本U統(tǒng)計(jì)量和精確概率的計(jì)算結(jié)果,從檢驗(yàn)結(jié)果知兩個(gè)地區(qū)的西瓜重量上無(wú)顯著差異。上表顯示的是頻數(shù)表,下表中顯示檢驗(yàn)結(jié)果,從表中看到檢驗(yàn)統(tǒng)計(jì)量值Z為0.414,P值接近1,故兩地種植的西瓜的重量沒有顯著差異。因此,上面的兩種檢驗(yàn)的結(jié)論是一致的。即兩地種植的同一種西瓜地的重量沒有顯著差異。

8.4兩個(gè)有聯(lián)系樣本檢驗(yàn)

(TestforTworelatedsamples)兩個(gè)有聯(lián)系的樣本檢驗(yàn)一般用于比較一個(gè)現(xiàn)象在采取了某項(xiàng)措施前后的變化是否顯著,或者說(shuō)采取的措施是否有效。也可以檢驗(yàn)同一個(gè)測(cè)試對(duì)象上的兩種測(cè)試方法是否一致。取n個(gè)測(cè)試對(duì)象作為樣本,則樣本數(shù)據(jù)是成對(duì)出現(xiàn)的。也可以檢驗(yàn)這樣兩個(gè)樣本是否服從相同的分布等。這種檢驗(yàn)在實(shí)際中應(yīng)用范圍很廣,如對(duì)于一種藥品效果比較檢驗(yàn),農(nóng)業(yè)上對(duì)于一種新的糧食品種與原有品種的比較檢驗(yàn),工業(yè)中新工藝方法、新材料與原方法和材料的比較檢驗(yàn)等等。下面通過一個(gè)例題說(shuō)明兩個(gè)有聯(lián)系樣本的檢驗(yàn)方法。例5.4:一車間為了提高工作效率,對(duì)某種零件的加工過程進(jìn)行改進(jìn),為了比較加工時(shí)間是否明顯減少,抽取15名工人對(duì)比他們改革前后零件的加工時(shí)間,得到相應(yīng)的數(shù)據(jù)如下:試根據(jù)數(shù)據(jù)檢驗(yàn)改進(jìn)后零件的加工時(shí)間是否明顯減少(α=0.05)?改進(jìn)前(m):70,76,56,63,63,56,58,60,65,65,75,66,56,59,70改進(jìn)后(m):48,54,60,64,48,55,54,45,51,48,56,48,64,50,54解:根據(jù)上面的數(shù)據(jù)建立數(shù)據(jù)文件SY-15,這顯然是兩個(gè)有聯(lián)系的樣本,故采用兩個(gè)有聯(lián)系的樣本檢驗(yàn)方法。具體操作如下:建立假設(shè)H0:改進(jìn)前后的零件加工時(shí)間沒有顯著差異;H1:改進(jìn)前后的零件加工時(shí)間明顯減少。1、單擊Analyze

NonparametricTest

2RelatedSample,打開TwoRelatedSample對(duì)話框如圖所示。3、在TestType欄中選擇檢驗(yàn)方式。SPSS中給出了三種檢驗(yàn)方法,分別是:Wilcoxon:威爾克科森秩和檢驗(yàn),只給出大樣本近似檢驗(yàn)概率。Sign:符號(hào)檢驗(yàn),給出精確檢驗(yàn)概率。McNemar:適用于二值變量的檢驗(yàn)本例中選擇Wilcoxon和Sign檢驗(yàn)。2、選擇檢驗(yàn)的兩個(gè)變量進(jìn)入檢驗(yàn)框中。

4、在Options框內(nèi)選擇輸出結(jié)果形式和缺失值處理方式。5、單擊OK,輸出結(jié)果如表。SignTest符號(hào)檢驗(yàn)

WilcoxonSignedRanksTest威爾克科森秩和檢驗(yàn)

威爾克科森秩和檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量Z的值為-2.870,假設(shè)檢驗(yàn)的P值為0.004,小于0.05;而符號(hào)檢驗(yàn)的頻數(shù)表和檢驗(yàn)表,同樣,假設(shè)檢驗(yàn)的P值為0.035,也小于0.05,故拒絕原假設(shè),認(rèn)為改進(jìn)前后的差異是顯著的。8.5多個(gè)樣本的非參數(shù)檢驗(yàn)

(KSamplesTest)

一、多個(gè)獨(dú)立樣本的單因素方差分析(TestforSaveralIndependentSamples)在總體分布未知的情況下,多個(gè)獨(dú)立樣本的檢驗(yàn)是檢驗(yàn)多個(gè)獨(dú)立總體的平均值是否存在顯著的差異。由于總體分布未知,所以檢驗(yàn)過程是建立秩的基礎(chǔ)上。下面通過例題來(lái)說(shuō)明具體的檢驗(yàn)方法。例5.6仍以2002年全國(guó)職工平均工資表為例,如果定義一個(gè)分組變量,將我國(guó)東部、中部和西部各省標(biāo)上1,2,3作為分組值,下面來(lái)考察東部、中部和西部的職工平均工資是否存在顯著差異(α=0.05)?解:建立假設(shè)H0:各地區(qū)的職工平均工資沒有顯著差異;H1:各地區(qū)的職工平均工資有顯著差異;可以從分組中得到三個(gè)獨(dú)立的樣本數(shù)據(jù),顯然可以用多個(gè)獨(dú)立樣本的檢驗(yàn)。具體操作步驟如下:1.打開數(shù)據(jù),在數(shù)據(jù)窗口單擊Analyze

NonparametricTest

KIndependentSample,打開K-Independent-Sample對(duì)話框如圖所示。2.選擇檢驗(yàn)的變量進(jìn)入檢驗(yàn)框中。本例中選擇國(guó)有單位,城鎮(zhèn)集體和港澳臺(tái)商進(jìn)入TestVariableList框內(nèi)。3.在TestType欄中選擇檢驗(yàn)方式。SPSS軟件給出兩種檢驗(yàn)方式,Kruskal-WallisH檢驗(yàn),利用秩平均建立檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)多個(gè)獨(dú)立總體的分布是否存在顯著差異。Median中位數(shù)檢驗(yàn),利用卡方統(tǒng)計(jì)量檢驗(yàn)多組樣本的中位數(shù)差異是否顯著。本例中選擇Kruskal-Wallis統(tǒng)計(jì)量。4.在Options對(duì)話框內(nèi)選擇輸出結(jié)果形式和缺失值處理方式。5.單擊OK,輸出結(jié)果如表。Ranks秩和表中給出每個(gè)變量各組的秩平均。TestStatistics(a,b)檢驗(yàn)統(tǒng)計(jì)表中給出檢驗(yàn)結(jié)果,其結(jié)果顯示:卡方統(tǒng)計(jì)量結(jié)果顯示:國(guó)有企業(yè)、城鎮(zhèn)集體及港澳臺(tái)商企業(yè)這三個(gè)變量的職工平均工資在中國(guó)的東部、中部和西部地區(qū)的的差異都是顯著的。

Ranks秩和表

TestStatistics(a,b)檢驗(yàn)統(tǒng)計(jì)表

二、多個(gè)有聯(lián)系樣本的方差分析

(KRelatedSamplesTest)多個(gè)有聯(lián)系樣本的方差分析,又稱多個(gè)配對(duì)樣本的檢驗(yàn),是在總體分布未知的情況下,用于比較多個(gè)有聯(lián)系的總體分布的差異性。可以歸納為:多個(gè)有聯(lián)系的總體是否存在顯著差異;多個(gè)評(píng)判結(jié)果是否存在顯著差異(一致性檢驗(yàn));由于總體分布未知,所以檢驗(yàn)都是建立秩和的基礎(chǔ)上。下面通過例題來(lái)說(shuō)明具體的檢驗(yàn)方法。例7對(duì)于五個(gè)企業(yè)生產(chǎn)的同一類型產(chǎn)品,由四個(gè)使用單位分別對(duì)這些企業(yè)生產(chǎn)的產(chǎn)品進(jìn)行評(píng)價(jià),以打分的形式表示評(píng)價(jià)結(jié)果,滿分是10分,得出評(píng)價(jià)結(jié)果如表所示。試檢驗(yàn)使用單位的判斷標(biāo)準(zhǔn)是否一致(α=0.05)。解:建立假設(shè)H0:使用單位的判斷標(biāo)準(zhǔn)沒有顯著差異;H1:使用單位的判斷標(biāo)準(zhǔn)有顯著差異。根據(jù)評(píng)分表建立數(shù)據(jù)文件,多個(gè)有聯(lián)系樣本檢驗(yàn)的具體操作步驟如下

1.打開數(shù)據(jù),在數(shù)據(jù)窗口單擊Analyze

NonparametricTest

KRelatedSamples,打開K-Related-Samples對(duì)話框如圖所示。2.選擇檢驗(yàn)的變量進(jìn)入檢驗(yàn)框中。本例中選擇企業(yè)的產(chǎn)品A、B、C、D、E進(jìn)入TestVariableList框內(nèi)。3.在TestType欄中選擇檢驗(yàn)方式。SPSS軟件給出三種檢驗(yàn)方式:Friendman檢驗(yàn),適用于等間距變量數(shù)據(jù),利用秩平均建立Friendman檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)多個(gè)有聯(lián)系的總體的分布是否存在顯著差異。原假設(shè)是無(wú)顯著差異。Kendall′sW一致性檢驗(yàn),適用于分析評(píng)判者的判別標(biāo)準(zhǔn)是否一致。通過Kendall一致性系數(shù)W值越接近1,說(shuō)明評(píng)判者的評(píng)價(jià)標(biāo)準(zhǔn)一致性越好。Cochran′sQ檢驗(yàn),適用于二值變量數(shù)據(jù),原假設(shè)是無(wú)顯著差異。4.在Statistics對(duì)話框內(nèi)選擇輸出結(jié)果形式和缺失值處理方式。5.單擊OK,輸出

Kendall'sWTest檢驗(yàn)表如表。Ranks秩TestStatistics檢驗(yàn)統(tǒng)計(jì)表

Ranks秩表示每個(gè)企業(yè)產(chǎn)品的秩平均值,TestStatistics檢驗(yàn)統(tǒng)計(jì)表輸出統(tǒng)計(jì)檢驗(yàn)的結(jié)果可以看出,Kendall一致性系數(shù)W比較小,即四個(gè)使用單位的評(píng)價(jià)結(jié)果明顯是不一致的。解:根據(jù)題意建立數(shù)據(jù)文件.檢驗(yàn)假設(shè):

H0:四種品牌之間的差異不顯著

H1:四種品牌之間的差異顯著檢驗(yàn)步驟如下:例8某企業(yè)為了比較該企業(yè)的產(chǎn)品在顧客中的滿意程度,同時(shí)調(diào)查了包括自己企業(yè)在內(nèi)的四種暢銷品牌的顧客滿意程度,得到數(shù)據(jù)如表所示:試根據(jù)上面調(diào)查結(jié)果分析,四種品牌之間的差異是否顯著(α=0.05)?1.打開數(shù)據(jù),在數(shù)據(jù)窗口單擊Analyze

NonparametricTest

KRelatedSamples,打開K-Related-Samples對(duì)話框如圖所示。2.選擇檢驗(yàn)的變量進(jìn)入檢驗(yàn)框中。本例中選擇所有變量進(jìn)入TestVariableList框內(nèi)。3.在TestType欄中選擇檢驗(yàn)方式。本例中的數(shù)據(jù)是二值變量,故選擇Cochran′sQ檢驗(yàn)。4.在Statistics對(duì)話框內(nèi)選擇輸出結(jié)果形式和缺失值處理方式。本例中取默認(rèn)項(xiàng)。5.單擊OK,輸出

Cochran′sQ檢驗(yàn)表如表。Frequencies頻數(shù)表TestStatistics檢驗(yàn)表

從檢驗(yàn)表中看出,Cochran′sQ統(tǒng)計(jì)量值為29.809,假設(shè)檢驗(yàn)的P值遠(yuǎn)遠(yuǎn)地小于0.05,故拒絕H0,認(rèn)為該企業(yè)的產(chǎn)品與其它品牌的差異是顯著的。如果需要,企業(yè)還可以與其它品牌進(jìn)行兩兩比較分析,讀者可以自行做出兩個(gè)有聯(lián)系的樣本檢驗(yàn)。8.6游程檢驗(yàn)(RunsTest)游程檢驗(yàn)可以檢驗(yàn)下面兩種情況:?jiǎn)螛颖咀兞康娜≈凳欠袷请S機(jī)的。兩獨(dú)立總體的分布是否存在顯著差異。例5:為了鑒別兩種操作方法對(duì)勞動(dòng)效率的影響,隨機(jī)抽取12人用第一種操作方法。10人用第二種操作方法,每人的日產(chǎn)量見表,試問這兩種操作方法有無(wú)顯著差異?解:如果兩種操作方法差異不顯著,則有這兩組工人的日產(chǎn)量排列是隨機(jī)的,故根據(jù)表中數(shù)據(jù)建立數(shù)據(jù)文件,將兩組工人的日產(chǎn)量數(shù)據(jù)進(jìn)行統(tǒng)一排序,觀察排序后工人所在組的標(biāo)志值的排列是否是隨機(jī)的。建立原假設(shè)H0:兩種操作方法沒有顯著差異;備擇假設(shè)H1:兩種操作方法的差異是顯著的。1、單擊Analyze

NonparametricTest

Runs,打開RunsTest對(duì)話框如圖所示。2、選擇檢驗(yàn)的變量:將變量“組別”進(jìn)入檢驗(yàn)框中。3、在Cutpoint欄中選擇劃分二類的檢驗(yàn)分類點(diǎn),系統(tǒng)默認(rèn)中位數(shù)。本例中選擇1.5作為檢驗(yàn)分類點(diǎn)。4、在在Options框內(nèi)選擇輸出結(jié)果形式和缺失值處理方式。5、單擊OK,輸出結(jié)果見表。由表給出的檢驗(yàn)結(jié)果知,按照產(chǎn)量排序后,組別標(biāo)志值的游程為2,由樣本計(jì)算的檢驗(yàn)統(tǒng)計(jì)量Z為-4.417,P值為0.017,小于0.05,拒絕原假設(shè)H0,即認(rèn)為兩種操作方法的差異顯著。第十六章卡方檢驗(yàn)

--兩個(gè)定性變量之間的關(guān)系@文彤老師統(tǒng)計(jì)學(xué)回顧χ2檢驗(yàn)是用途很廣的一種假設(shè)檢驗(yàn)方法,主要用于分類資料統(tǒng)計(jì)推斷,包括:兩個(gè)率或兩個(gè)構(gòu)成比比較的卡方檢驗(yàn);多個(gè)率或多個(gè)構(gòu)成比比較的卡方檢驗(yàn)以及分類資料的相關(guān)分析等它最基本的無(wú)效假設(shè)是:H0:觀察頻數(shù)與期望頻數(shù)沒有差別其原理為考察基于H0的理論頻數(shù)分布和實(shí)際頻數(shù)分布間的差異大小,據(jù)此求出相應(yīng)的P值。2025年3月19日@文彤老師126Crosstabs過程分析實(shí)例在CCSS的分析報(bào)告中,所有受訪家庭會(huì)按照家庭年收入被分為低收入家庭和中高收入家庭兩類,現(xiàn)希望考察不同收入級(jí)別的家庭其轎車擁有率是否相同。2025年3月19日@文彤老師127方法原理理論頻數(shù)基于H0成立,兩樣本所在總體無(wú)差別的前提下計(jì)算出各單元格的理論頻數(shù)來(lái)2025年3月19日@文彤老師128方法原理殘差設(shè)A代表某個(gè)類別的觀察頻數(shù),E代表基于H0計(jì)算出的期望頻數(shù),A與E之差被稱為殘差殘差可以表示某一個(gè)類別觀察值和理論值的偏離程度,但殘差有正有負(fù),相加后會(huì)彼此抵消,總和仍然為0。為此可以將殘差平方后求和,以表示樣本總的偏離無(wú)效假設(shè)的程度2025年3月19日@文彤老師129方法原理另一方面,殘差大小是一個(gè)相對(duì)的概念,相對(duì)于期望頻數(shù)為10時(shí),20的殘差非常大;可相對(duì)于期望頻數(shù)為1000時(shí)20就很小了。因此又將殘差平方除以期望頻數(shù)再求和,以標(biāo)準(zhǔn)化觀察頻數(shù)與期望頻數(shù)的差別。這就是我們所說(shuō)的卡方統(tǒng)計(jì)量,在1900年由英國(guó)統(tǒng)計(jì)學(xué)家Pearson首次提出,其公式為:2025年3月19日@文彤老師130方法原理從卡方的計(jì)算公式可見,當(dāng)觀察頻數(shù)與期望頻數(shù)完全一致時(shí),卡方值為0;觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小,卡方值越??;反之,觀察頻數(shù)與期望頻數(shù)差別越大,兩者之間的差異越大,卡方值越大。當(dāng)然,卡方值的大小也和自由度有關(guān)2025年3月19日@文彤老師131方法原理卡方分布顯然,卡方值的大小不僅與A、E之差有關(guān),還與單元格數(shù)(自由度)有關(guān)2025年3月19日@文彤老師132結(jié)果解釋列出的檢驗(yàn)結(jié)果2025年3月19日@文彤老師133四格表

2值的校正英國(guó)統(tǒng)計(jì)學(xué)家Yates認(rèn)為,

2分布是一種連續(xù)型分布,而四格表資料是分類資料,屬離散型分布,由此計(jì)算的

2值的抽樣分布也應(yīng)當(dāng)是不連續(xù)的,當(dāng)樣本量較小時(shí),兩者間的差異不可忽略,應(yīng)進(jìn)行連續(xù)性校正(在每個(gè)單元格的殘差中都減去0.5)若n>40,此時(shí)有1<T

5時(shí),需計(jì)算Yates連續(xù)性校正

2值T<1,或n<40時(shí),應(yīng)改用Fisher確切概率法直接計(jì)算概率2025年3月19日@文彤老師134Crosstabs過程如何閱讀卡方檢驗(yàn)結(jié)果教科書的看法當(dāng)n≥40且所有T≥5時(shí),用普通的卡方檢驗(yàn),若所得P約等于Alpha,改用確切概率法;當(dāng)n≥40但有1≤T<5時(shí),用校正的卡方檢驗(yàn);當(dāng)n<40或有T<1時(shí),不能用卡方檢驗(yàn),改用確切概率法。實(shí)際的做法一律向下看齊2025年3月19日@文彤老師135配對(duì)卡方檢驗(yàn)分析實(shí)例某公司期望擴(kuò)展業(yè)務(wù),增開幾家分店,但對(duì)開店地址不太確定。于是選了20個(gè)地址,請(qǐng)兩位資深顧問分別對(duì)20個(gè)地址作了一個(gè)評(píng)價(jià),把它們?cè)u(píng)為好、中、差三個(gè)等級(jí),以便確定應(yīng)對(duì)哪些地址進(jìn)行更進(jìn)一步調(diào)查,那么這兩位資深顧問的評(píng)價(jià)結(jié)果是否一致?2025年3月19日@文彤老師136配對(duì)卡方檢驗(yàn)方法原理顯然,本例對(duì)同一個(gè)個(gè)體有兩次不同的測(cè)量,從設(shè)計(jì)的角度上講可以被理解為自身配對(duì)設(shè)計(jì)按照配對(duì)設(shè)計(jì)的思路進(jìn)行分析,則首先應(yīng)當(dāng)求出各對(duì)的差值,然后考察樣本中差值的分布是否按照H0假設(shè)的情況對(duì)稱分布按此分析思路,最終可整理出如前所列的配對(duì)交叉表2025年3月19日@文彤老師137方法原理注意主對(duì)角線上兩種檢驗(yàn)方法的結(jié)論相同,對(duì)問題的解答不會(huì)有任何貢獻(xiàn)非主對(duì)角線上的單元格才代表了檢驗(yàn)方法間的差異假設(shè)檢驗(yàn)步驟如下(以四格表為例):H0:B=CH1:B

C2025年3月19日@文彤老師138方法原理2025年3月19日@文彤老師139分層卡方檢驗(yàn)進(jìn)一步控制城市的影響,在控制城市影響的前提下得到更準(zhǔn)確的家庭收入分級(jí)和轎車擁有情況的關(guān)聯(lián)程度測(cè)量指標(biāo)。層間差異的檢驗(yàn)條件獨(dú)立性的檢驗(yàn)2025年3月19日@文彤老師140第17章相關(guān)分析與回歸模型的建立與分析

相關(guān)分析和回歸分析是統(tǒng)計(jì)分析方法中最重要內(nèi)容之一,是多元統(tǒng)計(jì)分析方法的基礎(chǔ)。相關(guān)分析和回歸分析主要用于研究和分析變量之間的相關(guān)關(guān)系,在變量之間尋求合適的函數(shù)關(guān)系式,特別是線性表達(dá)式。本章主要內(nèi)容:對(duì)變量之間的相關(guān)關(guān)系進(jìn)行分析(Correlate)。其中包括簡(jiǎn)單相關(guān)分析(Bivariate)和偏相關(guān)分析(Partial)。建立因變量和自變量之間回歸模型(Regression),其中包括線性回歸分析(Linear)和曲線估計(jì)(CurveEstimation)。數(shù)據(jù)條件:參與分析的變量數(shù)據(jù)是數(shù)值型變量或有序變量。9.1相關(guān)分析在SPSS中,可以通過Analyze菜單進(jìn)行相關(guān)分析(Correlate),Correlate菜單如圖所示。8.1.1簡(jiǎn)單相關(guān)分析兩個(gè)變量之間的相關(guān)關(guān)系稱簡(jiǎn)單相關(guān)關(guān)系。有兩種方法可以反映簡(jiǎn)單相關(guān)關(guān)系。一是通過散點(diǎn)圖直觀地顯示變量之間關(guān)系,二是通過相關(guān)系數(shù)準(zhǔn)確地反映兩變量的關(guān)系程度。8.1.1.1散點(diǎn)圖SPSS軟件的繪圖命令集中在Graphs菜單。下面通過例題來(lái)介紹具體操作方法。例1:數(shù)據(jù)庫(kù)中的變量X表示山東省人均國(guó)內(nèi)生產(chǎn)總值,Y表示山東省城鎮(zhèn)居民的消費(fèi)額(資料來(lái)源:山東省2003年統(tǒng)計(jì)年鑒),現(xiàn)畫出散點(diǎn)圖來(lái)觀察兩個(gè)變量的關(guān)聯(lián)程度。單擊Graphs

Scatter,打開Scatterplot散點(diǎn)圖對(duì)話框,如圖3.2所示。然后選擇需要的散點(diǎn)圖,圖中的四個(gè)選項(xiàng)依次是:Simple簡(jiǎn)單散點(diǎn)圖

Matrix矩陣散點(diǎn)圖Overlay重疊散點(diǎn)圖

3-D三維散點(diǎn)圖

如果只考慮兩個(gè)變量,可選擇簡(jiǎn)單的散點(diǎn)圖Simple,然后點(diǎn)擊Define,打開SimpleScatterplot對(duì)話框,如圖所示。9.1.1.2簡(jiǎn)單相關(guān)分析操作簡(jiǎn)單相關(guān)分析是指兩個(gè)變量之間的相關(guān)分析,主要是指對(duì)兩變量之間的線性相關(guān)程度作出定量分析。仍然上題為例,說(shuō)明居民收入與某商品的銷售量?jī)勺兞康南嚓P(guān)分析過程,具體操作如下:1、打開數(shù)據(jù)庫(kù)后,單擊Analyze

Correlate

Bivariate打開Bivariate對(duì)話框,見圖所示。

2、從左邊的變量框中選擇需要考察的兩個(gè)變量進(jìn)入Variables框內(nèi),從CorrelationCoefficients欄內(nèi)選擇相關(guān)系數(shù)的種類,有Pearson相關(guān)系數(shù),Kendall′s一致性系數(shù)和Spearman等級(jí)相關(guān)系數(shù)。從檢驗(yàn)欄內(nèi)選擇檢驗(yàn)方式,有雙尾檢驗(yàn)和單尾檢驗(yàn)兩種。3、單擊Options按紐,選擇輸出項(xiàng)和缺失值的處理方式。本例中選擇輸出基本統(tǒng)計(jì)描述。4、單擊OK,可以得到相關(guān)分析的結(jié)果。9.1.2偏相關(guān)分析簡(jiǎn)單相關(guān)關(guān)系只反映兩個(gè)變量之間的關(guān)系,但如果因變量受到多個(gè)因素的影響時(shí),因變量與某一自變量之間的簡(jiǎn)單相關(guān)關(guān)系顯然受到其它相關(guān)因素的影響,不能真實(shí)地反映二者之間的關(guān)系,所以需要考察在其它因素的影響剔除后二者之間的相關(guān)程度,即偏相關(guān)分析。例2:為了考察火柴銷售量的影響因素,選擇煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量作為影響因素,得數(shù)據(jù)表。試求火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù).解:根據(jù)數(shù)據(jù)表建立數(shù)據(jù)文件,求解火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù)具體操作如下:1、首先打開數(shù)據(jù)文件,單擊Analyze

Correlate

Partial,打開PartialCorrelations對(duì)話框,見圖所示。2、從左邊框內(nèi)選擇要考察的兩個(gè)變量進(jìn)入Variables框內(nèi),其它客觀存在的變量作為控制變量進(jìn)入Controllingfor框內(nèi),如本例中考察煤氣戶數(shù)與火柴銷量的偏相關(guān)系數(shù)進(jìn)入Variables框內(nèi),其它相關(guān)變量(除年份外)進(jìn)入Controllingfor框內(nèi)。3、單擊Options按紐,打開Options對(duì)話框如圖所示。從Statistics欄中選擇輸出項(xiàng),有平均值及標(biāo)準(zhǔn)差,Zero-ordercorrelations表示在輸出偏相關(guān)系數(shù)的同時(shí)輸出變量間的簡(jiǎn)單相關(guān)系數(shù)。另外還有缺失值的處理方式。本例中選擇簡(jiǎn)單相關(guān)系數(shù)。4、選擇結(jié)束后,單擊OK得輸出結(jié)果

表中的上半部分是簡(jiǎn)單相關(guān)系數(shù),下半部分是偏相關(guān)系數(shù)。從表中可以看出,火柴銷量與煤氣戶數(shù)的簡(jiǎn)單相關(guān)系數(shù)為0.8260,自由度為13,檢驗(yàn)的P值為0.000;而偏相關(guān)系數(shù)為0.6046,自由度為10,檢驗(yàn)的P值為0.037,表示煤氣戶數(shù)對(duì)火柴銷量的真實(shí)影響是顯著的。9.2線性回歸分析線性回歸是統(tǒng)計(jì)分析方法中最常用的方法之一。如果所研究的現(xiàn)象有若干個(gè)影響因素,且這些因素對(duì)現(xiàn)象的綜合影響是線性的,則可以使用線性回歸的方法建立現(xiàn)象(因變量)與影響因素(自變量)之間的線性函數(shù)關(guān)系式。由于多元線性回歸的計(jì)算量比較大,所以有必要應(yīng)用統(tǒng)計(jì)分析軟件實(shí)現(xiàn)。這一節(jié)將專門介紹SPSS軟件的線性回歸分析的操作方法,包括求回歸系數(shù),給出回歸模型的各項(xiàng)檢驗(yàn)統(tǒng)計(jì)量值及相應(yīng)的概率,對(duì)輸出結(jié)果的分析等相關(guān)內(nèi)容。9.2.1線性回歸模型假設(shè)條件與模型的各種檢驗(yàn)1、線性回歸的假設(shè)理論(1)正態(tài)性假設(shè):即所研究的變量均服從正態(tài)分布;(2)等方差假設(shè):即各變量總體的方差是相等的;(3)獨(dú)立性假設(shè),即各變量之間是相互獨(dú)立的;(4)殘差項(xiàng)無(wú)自相關(guān)性,即誤差項(xiàng)之間互不相關(guān),Cov(

i,

j)=02、線性回歸模型的檢驗(yàn)項(xiàng)目(1)回歸系數(shù)的檢驗(yàn)(t檢驗(yàn))。(2)回歸方程的檢驗(yàn)(F檢驗(yàn))。(3)擬合程度判定(可決系數(shù)R2)。(4)D.W檢驗(yàn)(殘差項(xiàng)是否自相關(guān))。(5)共線性檢驗(yàn)(多元線性回歸)。(6)殘差圖示分析(判斷異方差性和殘差序列自相關(guān))。9.2.2線性回歸分析的具體步驟

SPSS軟件中進(jìn)行線性回歸分析的選擇項(xiàng)為Analyze→Regression→Linear。例3.仍然用例2的數(shù)據(jù),考察火柴銷售量與各影響因素之間的相關(guān)關(guān)系,建立火柴銷售量對(duì)于相關(guān)因素煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量的線性回歸模型,通過對(duì)模型的分析,找出合適的線性回歸方程。解:建立線性回歸模型的具體操作步驟如下:1、打開數(shù)據(jù)文件,單擊Analyze

Regression

Linear打開Linear對(duì)話框如圖所示。2、從左邊框中選擇因變量Y進(jìn)入Dependent框內(nèi),選擇一個(gè)或多個(gè)自變量進(jìn)入Independent框內(nèi)。從Method框內(nèi)下拉式菜單中選擇回歸分析方法,有強(qiáng)行進(jìn)入法(Enter),消去法(Remove),向前選擇法(Forward),向后剔除法(Backward)及逐步回歸法(Stepwise)五種。本例中選擇逐步回歸法(Stepwise)。3、單擊Statistics,打開LinearRegression:Statistics對(duì)話框,可以選擇輸出的統(tǒng)計(jì)量如圖所示。RegressionCoefficients欄,回歸系數(shù)選項(xiàng)欄。Estimates(系統(tǒng)默認(rèn)):

輸出回歸系數(shù)的相關(guān)統(tǒng)計(jì)量:包括回歸系數(shù),回歸系數(shù)標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量(t值)及相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量概率的P值(sig)。本例中只選擇此項(xiàng)。Confidenceintervals:輸出每一個(gè)非標(biāo)準(zhǔn)化回歸系數(shù)95%的置信區(qū)間。Covariancematrix:

輸出協(xié)方差矩陣。與模型擬合及擬合效果有關(guān)的選擇項(xiàng)。Modelfit是默認(rèn)項(xiàng)。能夠輸出復(fù)相關(guān)系數(shù)R、R2及R2修正值,估

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論