心理統計與測量學(修改)_第1頁
心理統計與測量學(修改)_第2頁
心理統計與測量學(修改)_第3頁
心理統計與測量學(修改)_第4頁
心理統計與測量學(修改)_第5頁
已閱讀5頁,還剩44頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

目錄一、描述統計 1〔一〕統計圖表 2〔二〕集中量數 3〔三〕差異量數 5〔四〕相對量數 6〔五〕相關量數 7二、推斷統計〔核心〕 8〔一〕推斷統計的數學根底 9〔二〕參數估計 10〔三〕假設檢驗 11〔四〕方差分析〔重點〕 12〔五〕統計成效與效果量 14〔六〕一元線性回歸方程 15〔七〕卡方檢驗 16〔八〕非參數檢驗 16〔九〕多元統計分析初步 18《心理統計學》前言這門課占35分,結構一般是〔9個單項選擇+1個多項選擇+1個簡答或綜合〕,不過每年可能不一樣,分值權重感覺比測量要大一些,特別是大題,不過大致差不多。

心理統計學在心理學中的重要性不言而喻,如果說實驗心理學的建立讓心理學成為一門獨立的科學,那么心理統計學可謂是最大的功臣。沒有心理統計學提供強有力的科學數據。心理學的理論就僅僅是個理論,上不了臺面。世界上只有一個東西不會撒謊,那就是數據,一個理論如果沒有強大的數據支持,那么這個理論的可信度也就大打折扣了。所以心理統計學就承當了這么一個工作,為你的理論在數學上提供可靠的科學依據。

總所周知,高等數學是心理學本科的必修課之一,很多人認為心理統計學難學和數學不好有關,雖說心理統計和數學都是和數字打交道。不過,他們確真沒多大聯系。打個比方,學心理統計學就好比是學電腦,會使用就行〔office的使用〕。學數學就好比學編程,掌握程序的來龍去脈〔編寫office的程序〕。心理統計學對于心理學是一種工具。學好這個是為了將來運用SPSS這些統計軟件做準備的。

〔當然,如果你追求更高層次的數理統計,硬要搞清楚這些公式怎么來的,也好,不過最好等考上了,再慢慢研究也不遲〕

本寶典也好比是心理統計學這個工具的使用手冊,不過還需兩件神器:智力正常的人腦+按鍵正常的計算器〔帶統計功能〕

這局部參考書目如下:

《心理學專業根底綜合考試大綱》〔2011年版〕教育部考試中心

《心理學專業根底綜合考試大綱解析》〔2011年版〕高教

《現代心理與教育統計學》張厚粲徐建平北師大出版社〔2004年版〕

《心理與教育統計學》邵志芳上海科學普及出版社〔2004年版〕

《心理學統考重難點手冊》2011第三版

《MJ心理大綱詳解》〔小白修訂版〕白云子

《心理統計常用公式總結》開始一、描述統計所謂描述描述統計,就是描述一組數據的全貌。〔集中趨勢,離中趨勢,相關關系〕,也是推論統計的根底。〔一〕統計圖表我們隨便拿來一片實證研究的論文,里面都有統計圖和統計表。可以把你整理的數據以最直觀的方式呈現給讀者,讓讀者一目了然。在做統計圖和統計表之前要先對你搜集來的資料進行初步的整理,對數據進行排序和統計分組1、統計圖統計圖一般采用直角坐標系,通常橫軸表示自變量〔類別〕,稱為分類軸。縱軸表示因變量〔次數〕,稱為數值軸。統計圖一般由下面幾個局部組成:〔這個書上有圖,一看便知〕張奶奶P29圖號及圖題;圖目;圖尺;圖形;圖例;圖注次數分布圖

根據次數分布表繪制的圖,更為直觀。

直方圖

矩形面積表示連續性隨機變量次數分布的圖性。沒畫矩形叫組織圖。

次數多邊形圖

是一種表示連續性隨機變量次數分布的線形圖累加次數分布圖根據累加次數分布表繪制而成,分為累加直方圖和累加曲線圖2、統計表統計表一般由下面幾個局部組成:〔這個書上有圖,一看便知〕張奶奶P28表號;標目;數字;表注次數分布表

簡單次數分布表〔數據個數和分布范圍比擬小的時候用〕

依據每一個分數值在一列數據中出現的次數或總計數資料編制成的統計表。

分組次數分布表〔數據個數和分布范圍比擬大的時候用〕

數據量很大時,應該把所有的數據先劃分在假設干區間,然后按其數值大小劃分到相應區域的組別內,分別統計各個組別中包括的數據的個數,再用列表的形式呈現出來。

編制步驟:

1、求全距,就是最大數和最小數之間的差距。

2、決定組距和組數,

組距〔i〕,任意一組的起點和終點的距離,根據全距來定。全距大,組距也可以大一些,一般取2、3、4、5、10、20等。便于計算。如果先確定了組數,那么全距除以組數后取整也可以。

組數〔K〕,分組數目,要根據數目的多少來確定,如果數據在100個以上,一般分10—20組。

分組最優關系公式〔總體正態〕:〔N為數據個數,K為近似取整〕

3、列出分組區間

就是組限,一組起點和終點之間的距離。組限有表述上下限〔10—19;20—29〕和精確上下限〔9.5—19.499;19.5—29.499〕,一般書寫時按照表述上下限,計算和分組時按照精確上下限。

4、登記次數〔將數據等級到相應的組別內〕

5、計算次數〔計算各組次數和總次數并核對,然后寫出組中值、次數、頻數和百分次數〕

相對次數分布表:用頻數比率或百分數來表示次數

累加次數分布表:把各組的次數由下而上,或由上而下加在一起。最后一組的累加次數等于總次數。

雙列次數分布表:對有聯系的兩列變量用同一個表表示其次數分布。

不等距次數分布表:工資級別,年齡分組

其它的統計圖表

簡單表

只列出統計指標名稱

分組表

只有一個分類標志的統計表也叫單向表

復合表

分組標志有兩個以上

條形圖

主要用于表示離散型數據

圓形圖

也叫餅圖,用于表示間斷性資料

線形圖

更多用于表示連續性資料〔二〕集中量數用于描述數據分布中大量數據朝某個方向集中的程度

1、算術平均數

平均數的特點:

在一組數據中每個變量與平均數之差〔離均差〕的總和等于0

在一組數據中,每一個數都加上一個常數C,那么所得的平均數為原來的平均數加常數C

在一組數據中,每一個數都乘以一個常數C,所得的平均數為原來的平均數乘以常數C

平均數的意義:

算術平均數是應用最普遍的集中量數,是“真值”最正確的估計值。所謂真值就是觀測事物真值的值。當觀測次數趨于無窮時,算術平均數趨于真值。

平均數的優缺點:

優點:

1、反響靈敏〔任何一個值變動,都能反響出來〕

2、計算嚴密〔有確定的公式〕

3、計算簡單〔簡單的四那么運算〕

4、簡明易解〔概念容易理解〕

5、較少受抽樣變動的影響〔觀測樣本的大小或個體大小的變化,對計算的影響很小〕

缺點:

1、易受極端數據的影響〔正因為反響靈敏,所以受極端數據影響大,可以通過剔除極端值的方法解決〕

2、假設出現模糊不清的數據時,無法計算平均數〔如果缺少數據,一般采用中數代替〕

書寫時,注意比原來測量的數據多一位數字

計算和運用平均數的原那么

同質性原那么〔不同質的數據不能算〕

平均數與個體數值相結合的原那么〔不要忘記結合個體數值給予參考〕

平均數與標準差、方差相結合原那么〔標準差小,平均數的代表性好〕

2、中數

中數符號是以Md或Mdn,表示按順序排列在一起的一組數據中居于中間位置的數,在這組數據中,有一半數據比它大,一半數據比它小。

計算方法:

一組數據中有重復數值的情況〔算法不一樣〕【我用SPSS算過,其實還是直接算的】

重復數列不在中間時,沒關系

重復的數列在中間時,有點難算,我總結了一種方法,保證做對。

無論是奇數偶數都適合,叫畫線法,首先將數列排序,然后再中數的位置畫一條線,奇數的會穿過數字,偶數的會劃在兩個數字之間,然后對這個數取精確上下限。標出下限所在的位置和上限所在的位置。最后中數就是精確下限加上這條線分隔的位置的比例〔畫線位置占了全距的幾分之幾〕。就可以了。

(偶數)舉個例子:11,11,11,11,13!13,13,17,17,18

線劃在感慨號那,13的精確下限是12.5,嘆號的位置是第一個三分之一處,所以就是12.5+0.33=12.83

中數的優缺點:

優點:

計算簡單,容易理解

中數概念簡單明白

缺點:

不是每個數據都參與計算,不能反映全體

反響不夠靈敏,極端值的變化對中數不產生影響

中數受抽樣影響較大,不如平均數穩定

中數不能進行代數運算

使用條件:

出現極端數據

分布兩端數據或個別數據不清楚

需要快速估計時

3、眾數

出現次數最多的那個數。掩蓋的信息比揭示的多,一般應用不廣泛。

計算方法:〔皮爾遜公式需要接近正態,金式公式適合偏態〕

眾數的優缺點:

優點:概念簡單明了,較少受極端數目的影響

缺點:不穩定,受樣本變動的影響,反響不夠靈敏,并能進行代數運算

使用條件:

快速粗略的尋找一組數據的代表值

當一組數據出現不同質情況時

次數分布中有兩極端數目時,除了用中數還可以用眾數

當粗略估計次數分布形態時,有時用平均數與眾數之差

平均數,中數,眾數三者的關系

正態分布中:平均數,中數,眾數相等

正偏態分布:Mo<Mdn<M

負偏態分布:M<Mdn<Mo

〔記住眾數最高就行〕〔三〕差異量數用于描述數據分布中大量數據彼此分散的程度

1、離差和平均差

離差就是離均差,是某一數據與平均數的差,表示每一個觀測值與平均數距離的大小,正負號說明了偏差的方向,所以觀測值離差的總和總是為0。

平均差就是所以離差絕對值的平均值。平均差充分考慮了每個數值的離中情況,完整的反響了全部數值的分散程度,在反響離中趨勢方面比擬靈敏,計算方法也比擬簡單。

計算公式:

2、方差和標準差

方差也叫變異數,均方。作為樣本統計量用符號s2表示,作為總體參數用符號σ2表示,是離均差平方后的平均數。

標準差是方差的平方根。作為樣本統計量用符號s表示,作為總體參數用符號σ表示。

計算方法:

方差:

標準差:

總標準差的合成

其中

方差和標準差的性質和意義

性質:方差是對一組數據中各種變異的總和的測量,具有可加性和可分解性特點。方差分析就是利用方差的這個特點。并進一步說明各種變異對總結過的影響

標準差是方差的平方根,不可以進行代數運算,但有如下特點:

每一個觀測值都加一個相同的常數C之后,計算得到的標準差等于原來的標準差

每一個觀測值都乘以一個相同的常數C,所得到的標準差等于原標準差乘以這個常數

以上兩點結合如果先乘以一個常數,再加上一個常數,所得到的標準差等于原標準差乘以這個常數

意義:

方差與標準差是表示一組數據離散程度的最好指標,其值越大,說明次數分布的離散程度越大。它們是統計描述與統計推斷分析中最常用的差異量數。

標準差的特點:

優點:反響靈敏;公式嚴密;計算容易;適合代數運算;受抽樣變動小,簡單明了

確定:易受極端數據影響

3、變異系數

變異系數又稱差異系數,他是一種相對量數。

適用條件:

兩個或兩個以上樣本所使用的觀測工具不同,所測的特質不同

兩個或兩個以上樣本使用的是同種觀測工具,所測的特質相同,但樣本間水平差異較大

計算方法:

使用須知:測量數據必須等距;測量工具具備絕對零;由于尚無有效的檢驗方法,目前不能進行推理統計。〔四〕相對量數1、百分位數

百分位數是指量尺上的一個點,在此點以下,包括數據分布中全部數據個數的一定百分比。第P個百分位數就是指在其值P的數據以下,包括分布中全部數據的百分之p。

2、百分等級

指一個分數在整個數據分布中所處的百分位置

3、標準分數

標準分數〔Z分數〕:以標準差為單位表示一個原始分數在團體中所處位置的相對位置量數,離平均數有多遠,表示原始分數在平均數以上或以下幾個標準差的位置,從而明確該分數在團體中的相對位置。

簡而言之,標準差解決了一個大問題,分數經過標準化就可以放在一起比擬了。高考分數就是經過標準化以后,所以可以直接相加。

計算方法:

,其中X為原始數據,為平均數,S為標準差

把原始分數轉換成標準分數,就是把單位不等距和缺乏明確參照點的分數轉換為以標準差為單位,以平均數為參照點的分數

標準分數的性質:

標準分數無單位,以標準差為單位,以平均數為參照點的分數

轉換得到的標準分數可以是正值也可以是負值,所有原始分數的Z分數之和為0,,Z分數的平均數也為0.

將原始分數,轉換為標準分數,是線性轉換,不改變原有的分數的性質和分布。標準分數的形態和原分布相同。

假設原始分數呈正態分布,那么轉換得到的均值為0,標準差為1的標準正態分布

標準分數的優點:可比性;可加性;明確性;穩定性

標準分數的應用:

比擬幾個分屬性質不同的觀測值在各自分布中的相對位置

計算不同質的觀測值的總和或平均值,以表示在團體中的相對位置

表示標準測驗分數

異常值的取舍〔正負3個標準差以外的數據〕

常用變式

T分數:T=10*Z+50平均數:50標準差:10

CEEB分數:CEEB=100*Z+500平均數:500標準差:100

智商:IQ=15*Z+100〔韋氏智力量表〕平均數:100標準差:15〔五〕相關量數前面講的都是單變量數據資料的分布特征,相關那么是用于描述雙變量數據相互之間的關系。

相關就是變量間的不精確,不穩定的相互關系。

相關系數:相關關系強度的指標。作為樣本的統計量用r表示,作為總體參數一般用ρ表示。是和平均數,標準差一樣應用廣泛的統計量。取值范圍是[-1,1]。我們這里講的相關是線性相關。當然即使是線性相關為0仍可能存在曲線相關。

1、積差相關

使用條件:兩個呈線性關系的正態連續變量〔正態,雙變量,成對,連續,大樣本〕

計算方法:

,其中

N為成對數據的數目,Sx、Sy分別為X和Y的標準差

〔變式〕

原始數據:

計算積差相關系數的差法公式

關于平均數估計的方法,因為計算機的普及,這種方法已不再使用,考試應該也不會考

2、等級相關

使用條件:這是非參數相關方法,要求兩個變量至少有一個是順序水平。也就是積差相關不滿足的,您就用這個。但是注意,凡符合積差相關的不用等級相關。這個精度低些。

計算方法:

,其中D為各對偶等級之差

直接用等級序數計算:,其中RX、RY分別為二變量各等級數

有相同等級時:

3、肯德爾等級相關

當要同時研究三個或三個以上變量的一致性或相關性時,可以使用肯德爾和諧系數

使用條件:至少是順序水平

形式:

多個評定者對一組被試或評定等級的一致性

同一個評定者對同一組被試屢次評定

計算方法:

有相同等級:

肯德爾U系數

適用于對K個評價者的一致性進行統計分析,處理的問題和W系數是一樣的,知識所處理的資料不一樣。還記得實驗心理學的對偶比擬法么,就是用該方法來計算相關系數

計算方法:

4、點二列相關與二列相關

當兩列變量,一列是等比或等距數據,另一列是類別變量。要求這樣的相關就需用到者兩種方法

所謂二分變量指取值只有兩種變量。包括客觀二分變量和人為二分變量

客觀二分變量:如性別,只有男女兩種

人為的二分變量:如考試成績分為及格和不及格。如果及格線是65分,有些人的成績就會由及格變為不及格。所以說這種變量是人為的。

點二列相關

使用條件:一列總體正態,至少等距數據,另一列是客觀的二分變量

計算方法:

,其中是兩個二分變量對偶的連續變量的平均數,

p、q是二分變量各自所占的比率,p+q=1,St是連續變量的標準差

二列相關

使用條件:一列總體正態,至少等距數據,另一列是人為的二分變量

,其中ST與是連續變量的標準差與平均數,y為P的正態曲線的高度

5、Φ相關

適用條件:當兩個互相關聯著的變量分布都是真正的二分變量時

計算方法:

后記描述統計是推論統計的根底,所以必須認真看,認真背。有人問,要不要背公式,我認為根底公式必須牢記于心,就好似你上戰場打仗,槍很好,但是卻沒子彈一般為難。掌握了統計原理,還怕背幾個公式。其實也不多的。統計一旦考大題那可是30分那,所以千萬不可掉以輕心。

介紹:

弗蘭西斯·高爾頓〔FrancisGalton,1822年2月16日—1911年1月17日〕,查爾斯·達爾文的表親〔高爾頓為達爾文的表兄〕,是一名英格蘭維多利亞時代的文藝復興人、人類學家、優生學家、熱帶探險家、地理學家、創造家、氣象學家、統計學家、心理學家和基因學家。高爾頓一生中發表了超過340篇的報告和書籍,他在1909年被授與爵士。他在1883年率先使用「優生學」〔eugenics〕一詞。在他于1869年的著作《遺傳的天才》〔HereditaryGenius〕中,高爾頓主張人類的才能是能夠透過遺傳延續的。此外,他在統計學方面也有奉獻,高爾頓在1877年發表的關于種子的研究結果中指出了回歸到平均值〔regressiontowardthemean〕現象的存在,這個概念與現代統計學中的“回歸”并不相同,但是卻是回歸一詞的起源。在此后的研究中高爾頓第一次使用了相關系數〔correlationcoefficient〕的概念。他使用字母“r”來表示相關系數,這個傳統一直延續至今。同時他也發表了關于指紋的論文和書籍,被認為對于現代利用指紋進行犯罪搜查方面有很大的奉獻。二、推斷統計〔核心〕科學研究的目的是,通過對樣本數據的研究來推測總體,并對推斷的正確性如何進行概率檢驗。他的根底是概率論。〔一〕推斷統計的數學根底1、概率

后驗概率:出現概率與觀測概率的比值穩定在一個常數P上

先驗概率:直接計算的比值,是真實的概率,而不是估計值

經過屢次觀測時,后驗概率根本接近先驗概率

概率的根本性質:任何一個隨機事件的概率都是非負的;在一定條件下必然發生的必然事件的概率為1;在一定條件下,不可能事件的概率為0

概率的加法定理:互不相容事件之和等于兩個事件概率之和

概率的乘法定理:兩個獨立事件發生的概率等于兩事件概率的乘積

2、正態分布

正態分布呈倒掛的鐘形,兩頭小,中間大;正態分布的中央點最高,然后逐漸向兩側下降,曲線的形式是先向內彎,然后向外彎。平均數μ和標準差σ決定著曲線的位置和形狀:σ越大,曲線越是“低闊”;σ越小,曲線越是“高窄”。

標準正態分布

平均數為0,標準差為1的正態分布,就是標準正態分布。

3、二項分布

二項分布是指僅有兩種不同性質結果的概率分布。

二項分布的形態

離散型分布,概率直方圖是階躍式

p=q的時候,對稱。否那么出現偏態

n趨于無窮大時,二項分布趨于正態

二項分布的平均數:標準差:

一般認為,當p<q,np≥5〔或p>q,nq≥5〕,二項分布接近正態

4、t分布

特點:鐘形,單峰對稱。與正態分布相比,中間低而陡峭,兩邊高而平坦。平均數為0

t分布與標準差無關,而與n-1〔自由度df〕有關,隨自由度得變化而變化,當自由度趨于無窮時,t分布趨于正態分布,且方差為1。我們認為自由度大于30,可近似正態分布。自由度是t分布中獨立隨機變量的數目。

5、F分布

特點:正偏態分布,他的分布曲線隨分子,分母的自由度不同而不同,當兩個自由度都趨近于無窮時,F分布趨于正態分布。F總為正值,因為是兩個方差的比率。當分子自由度為1時,F值與分母自由度相同概率的t值的平方相等。F分布常用于有關方差的研究當中。

6、樣本平均數分布

總體分布為正態,方差未知時,樣本平均數的分布為t分布

總體分布非正態,其方差又未知時,如果n>30,認為是近似正態分布

7、抽樣原理與抽樣方法

抽樣原理

隨機化是抽樣研究的根本原那么,隨機抽樣可以控制掉大多數額外變量。

我們都說通過樣本來推測總體,那什么樣的樣本才能推測出總體呢,當然是具有代表性的樣本嘍,怎么找到具有代表性的樣本呢,那就需要運用抽樣原理與抽樣方法

簡單隨機抽樣

抽取時,總體的每個個體應有獨立的、等概率被抽取的可能。比方抽簽法和隨機數字法。

優點:最符合隨機原那么,分析抽樣誤差比擬簡明

缺點:總體很大時,操作困難。忽略總體已有的信息,降低樣本代表性。

等距抽樣

也叫系統抽樣,是在簡單隨機抽樣中,每隔一段取一個。

優點:簡便易行

缺點:如果總體具有周期性變化,那么不能用。

分層隨機抽樣

按照總體已有的某些特征,將總體分成幾個不同局部,在分別在每一局部中隨機抽樣。

優點:充分利用了總體的信息,樣本代表性及推論的精確性更好

分階段抽樣

如果總體很大,樣本很小,中間層次有較多單位,但并無過大區別,也可采取分階段的方法。〔二〕參數估計1、點估計、區間估計與標準誤

點估計:是用樣本統計量來估計總體參數,因為樣本統計量為數軸上的一點值,估計的結果也以一個點的數值表示,所以稱為點估計。

良好估計量的標準:無偏性,有效性,一致性,充分性

區間估計:就是根據估計量以一定可靠程度推斷總體參數所在區間范圍,他是用數軸上一段距離表示未知參數可能落入的范圍,它雖不具體指出總體參數等于什么,但能指出未知總體參數落入某一區間的概率有多大。

置信區間:在某一置信信度時,總體參數所在的區域或區域長度。

顯著性水平:指估計總體落在某一區間的時,犯錯誤的概率。

區間估計的原理:樣本分布理論

標準誤:反響樣本均數之間的變異,是多個樣本平均數的標準差。用來衡量抽樣誤差,標準誤越小,樣本對總體就越有代表性。推斷總體也就越可靠。

平均數分布的標準誤:

〔總體方差時〕

2、總體平均數的估計

總體平均數的估計方法大致有三種,比照方下:〔小白修訂版整理〕正態法〔Z〕t分布法近似正態法〔Z’〕條件未知總體正態,n不管大小;或總體非正態,n≥30總體不管正態與否,n≥30標準誤求得置信區間*注:未知,n<30時,必需用t分布法

3、標準差與方差的區間估計

標準差分布的區間估計

根據抽樣分布理論,n>30時,樣本標準差分布近似正態分布,且,那么有:

方差分布的區間估計

由于樣本方差與總體方差之比的分布呈χ2分布,因此有:〔df=n-1〕在對標準差的總體進行估計時,可先對其方差進行估計〔用χ2〕,求得方差置信區間后,再開平方。其正平方根,便是標準差的相當于方差置信水平的置信區間。〔三〕假設檢驗1、假設檢驗的原理

在統計學,通過樣本統計量得出的差異做出一般性結論,判斷總體參數之間是否存在差異,這種推論過程稱作假設檢驗。假設檢驗包括參數檢驗〔總體分布〕和非參數檢驗〔總體分布未知〕

假設檢驗的根本思想是概率性質的反證法。

假設檢驗的過程簡而言之,就是三步走:

1、確定研究假設H1

2、確定與研究假設對立的假設,虛無假設〔H0〕,將H0作為直接檢驗的假設

3、進行檢驗,H0真H1假或H0假H1真

費舍曾說過:每一實驗的存在,僅僅是為了給事實一個反駁虛無假設的時機。

注意:假設檢驗是依據小概率原理來推翻原假設的,也就是在統計學上成立。是百分之99或百分之95的情況下成立的。

假設檢驗的兩類錯誤〔后來應用于信息論的信號檢測論〕擊中率+漏報率=100%虛報率+正確否認率=100%反響〔注意:在這里H0是無信號,H1是有信號〕接受H1〔拒絕H0〕接受H0〔拒絕H1〕輸入有信號〔H1〕擊中漏報〔β錯誤〕噪音〔H0〕虛報〔α錯誤〕正確拒絕

其實很簡單,我們用反證法進行假設檢驗的時候,所作出的推斷不可能百分之一百正確,那么我們就們就可能犯錯誤。一項研究,如果我們的一項研究其實是假的,但是檢驗出來是真的,那么虛報了,犯了I類錯誤〔拒絕了真的虛無假設H0〕,如果是真的,但是檢驗出來是假的,那么就是漏報了,犯了II類錯誤〔接受了假的虛無假設H0〕

那么看著上圖我們來看看α和β的關系

α+β≠1;其他條件不變時,α和β,一個增加,另一個必然減少。但是樣本容量增大,那么他們同時變小。

我們需要的是在樣本容量一定的情況下,同時減少兩種錯誤。一般我們控制I類錯誤,所以就將犯I類錯誤的概率α稱為假設檢驗的顯著性水平。

單側檢驗〔既強調大小又強調方向〕與雙側檢驗〔強調大小不強調方向〕

2、樣本與總體平均數差異的檢驗〔表格來自小白修訂版,已經完美了!〕檢驗方法總體情況標準誤檢驗值Z檢驗正

態t檢驗未知Z’檢驗非正態且n≥30未知

3、兩樣本平均數差異的檢驗

既然是兩個樣本的話,那么就存在獨立〔樣本彼此間無關,往往是組間的〕,相關〔樣本彼此間存在關聯,往往是組內的〕

兩個總體都是正態分布,兩個總體方差都

獨立樣本的平均數差異檢驗用Z檢驗:

相關樣本間平均數差異的檢驗也是Z檢驗

兩個總體都是正態分布,兩總體方差未知

方差齊性,獨立樣本的平均數差異檢驗用獨立樣本t檢驗〔求聯合方差〕方差不齊性,獨立樣本的平均數差異檢驗用柯蘭克-柯克斯t檢驗〔了解就好〕

相關系數未知的相關樣本的平均數差異檢驗用t檢驗

其中D為每一對對應數據之差

〔,n為對子數〕

相關系數的相關樣本的平均數差異檢驗用t檢驗

兩個總體都是非正態分布

當n1和n2都是大樣本〔大于等于30〕時,不管方差是否齊性,都可用近似Z’檢驗:

4、方差齊性檢驗

通常求F值得時候,將較大的樣本方差放在分子,較小的樣本方差放在分母

5、相關系數的顯著性檢驗

由于當ρ=0時〔近似正態〕和當ρ≠0時〔不是正態〕,的分布相差很大,所以要分開檢驗

積差相關的顯著性檢驗

當ρ=0時,總體上并無相關,用t檢驗

其中

當ρ≠0時,總體上是相關的,先通過查表將r和ρ轉化為費舍Zr和Zρ然后進行Z檢驗。〔四〕方差分析〔重點〕1、方差分析的原理與根本過程

使用條件:總體正態分布,變異間相互獨立,各實驗出的方差要一致

方差齊性檢驗,采用哈特萊最大F比率法〔上面有〕

一般Z檢驗和t檢驗只能比擬兩組數據的平均數差異的顯著性,而方差分析可以比擬多組平均數差異的顯著性檢驗,還向下兼容,是個多面手。

我們現在講的方差分析是單因素方差分析,也就是只有一個自變量的方差分析。比擬它們不同水平之間的顯著性。

方差分析的根本原理是方差的可分解性。方差分析把實驗數據的總變異分解成假設干不同的來源分量。要想兩組數據差異顯著,很明顯,就是兩個數據之間的變化要比兩個數據內部的變化要大才行,所以只需要組間的變異顯著大于組內就可以了。這就很好辦了。因為總變異=組內變異+組間變異。把它們三個算出來就OK了。

注意:這里的平方和指觀測數據與平均數據離差的平方總和

總平方和=組內平方和+組間平方和

很多人就奇怪了,這不是方差分析么?怎么是平方和呢?

別著急,還記得方差是離均差平方和的平均數么?放心,再除以樣本容量就是方差了。

當然不能直接除以n,因為自由度df才是總體方差的無偏估計量,那么就是

總方差=組內方差+組間方差〔這里方差一般叫均方〕

那么比擬組間變異和組內變異,就變成了,比擬組間方差和組內方差了。由于他們只比應該用F檢驗來進行的,下面的又到大家熟悉的內容了

下面是計算方法:

平方和的計算式

總平方和:

組間平方和:

組內平方和:

自由度的分解

總自由度:

組間自由度:

組內自由度:

變異的分解

總變異:

組間變異:

組內變異:

結論:如果F<1,說明數據的總變異中,組內的只占很少一局部。F=1,組間變異還不是夠大。F>1而且落入F分布的臨界區域才外表差異顯著。

2、完全隨機設計的方差分析

看懂了上面的,接下來就容易多了。只要把變異搞清楚就可以了。這個是被試間設計,這里的變異只有組間和組內,所以直接按照上面算就行了。

3、隨機區組設計的方差分析

這個好多人說不懂,區組就是按區分組的意思,每個區組的被試都是同質的,同一區組的被試接受所以實驗處理。也叫組內設計,這樣就把個別差異的影響也考慮在內,最后可以將這種變異別離出來以提高效率。就把組內變異=區組變異+誤差項變異。那么組間變異只要顯著大于誤差項變異就可以認為差異顯著了。另外區組變異顯著大于誤差項變異說明區組效應顯著,分組是有必要的。

最后,要是考到了方差分析千萬別忘記了最后還有個方差分析表要寫!!!

4、協方差分析

關于這局部內容據《重難點手冊》上說是來自左任俠的《教育與心理統計學》華師大1982年,有興趣的同學可以去看看,我找了沒找到。

協方差分析是方差分析與回歸的綜合使用法,是方差分析的引申與擴大,其目的是為了控制誤差。如果你認真看實驗心理學的話,在額外變量的控制中,就有用協方差分析的方法來控制誤差。

原理是,因為實驗中很多被試在測試時都不在同一個起始位置〔如閱讀速度,有的人天生閱讀快,有的人天生閱讀慢〕,這時我們可以現根據回歸,使各被試都校正到同一初始位置,然后再進行方差分析。

5、多因素方差分析

這個內容,幾乎但凡實驗處理,都會用到的。計算應該不會考大題,因為不用電腦的話估計個把小時還算不出來。就算考了,也沒幾個做得出來。所以知道原理和簡單的計算就可以了

所謂多因素方差分析是對多個自變量之間進行顯著性檢驗,這里面我們不但要研究各個因素內各水平之間有無顯著性差異〔主效應〕,還要研究因素之間是否有相互作用〔交互作用〕

后面其實好辦,還是進行變異分析。

SS處理間:指所有由實驗處理引起的變異。

SSA:A因素的處理效應。

SSB:B因素的處理效應。

SSAB:AB間的交互作用。

SS處理內:隨機區組設計中,處理平方和被進一步分解為區組效應和殘差平方和兩局部

SS區組:區組效應;

SS殘差:即誤差變異,其均方用作其他均方F檢驗時的誤差項。

一般記到這個公式:SS總=SSA+SSB+SS〔AB〕+SSE

6、事后檢驗

方差分析只告訴你那些水平之間到底顯著還是不顯著,要是不顯著也沒事,一旦顯著了,你總得知道是誰和誰發生顯著關系的吧,這就需要進行事后檢驗。注意可不能用t檢驗或者z檢驗哦,這樣會導致反α類錯誤的概率增加。所以就要使用多重比擬的方法進行顯著性檢驗,目前比擬流行的是N-K檢驗法〔也叫q檢驗〕這個一般不太可能考大題。〔五〕統計成效與效果量看了這么多,我們也學了不少檢驗的方法,但是我們往往在檢驗過后只知道檢驗的結果,顯著或不顯著,但是卻不知道,檢驗的效果怎么樣。這時候大綱的這個考點就展現出魅力了。一份論文最終的結果有沒有說服力,不單單是一個差異顯著就完事了,最好還要說明這個差異有多么,顯著。

1、統計成效擊中率+漏報率=100%虛報率+正確否認率=100%反響〔注意:在這里H0是無信號,H1是有信號〕接受H1〔拒絕H0〕接受H0〔拒絕H1〕輸入有信號〔H1〕擊中漏報〔β錯誤〕噪音〔H0〕虛報〔α錯誤〕正確拒絕

從這個圖我們很容易就看出了,要想效果好,這個擊中率就必須提高。擊中率是1-β,它反映著正確區分真實差異的能力,統計學把它稱為統計成效。

2、效果量

效果量是反響統計檢驗效果大小的指標。一般用d表示。

是一種比率,本質上等同于信號檢測論中的〔區分力指數〕,計算公式為:

獨立樣本:;

相關樣本:〔六〕一元線性回歸方程1、一元線性回歸方程的建立、檢驗及應用

還記得前面講到的相關關系么,相關關系是一種不穩定不確定的相互關系。線性回歸是對相關關系的進一步研究。這里就是要確定相關關系之間的數學模型,使之更好的為我所用。實驗心理學了其實也講過回歸,當然這兩個還是有點區別的,回歸指的是極端數據向平均數據靠攏的趨勢,比方兩個高個子的結婚,小孩可能比兩人矮而趨近人類種族的平均身高。后來回歸被用于描述這種不確定的關系

一元線性回歸方程〔兩個變量間的線性相關〕

回歸方程建立的方法

1、做散點圖觀察是否能成一條直線

2、設回歸方程

3、選用適當方法,求出a,b

4、將a,b代入后得到回歸方程

平均數法〔粗略,幾乎不用〕【我用這個算過彩票,無果】

最小二乘法

由于做散點圖,任意兩點就可以畫出一條直線,多以有很多條,必須找一條代表性最好。

簡而言之就是要使誤差的平方和最小

最后求出來的方程叫y對x的一元線性回歸方程

回歸模型的檢驗

有效性的上下指標

測定系數,是回歸離差平方和在總離差平方和中所占的比例,是回歸方程的有效性上下的指標。就是R的平方

顯著性檢驗

就是對于回歸系數b進行顯著性檢驗,如果b是顯著的,同樣也說明所建的回歸方程是顯著的,或者說X與Y之間存在顯著的線性關系。一般用t檢驗

從上述公式可以看出,知道相關系數就可以對回歸系數進行顯著性檢驗

回歸方程的應用

回歸分析的目的,就是在測定自變量X與應變量Y的關系為顯著性相關后,借助擬合的較優回歸模型來預測在自變量X為一定值時因變量Y的開展變化。運用建立的回歸模型進行估計和預測是它主要的應用。

點預測:就是將確定自變量x的值直接代入回歸模型,得到y值

區間預測:是以一定概率為保證,預測當自變量x取一定值x時,因變量y的可能范圍。

2、可化為一元線性回歸方程的曲線方程

對數函數

令,那么曲線轉化為:

指數函數

或〔〕

對方程兩端求對數,得:

令,,那么方程轉化為:

冪函數

對方程兩端取對數,得:

令,,,得:

雙曲線函數

令,得:〔七〕卡方檢驗前面講到的數據,都是通過測量所得的計量數據,但是心理研究有很多是計數數據,我們這時就可以使用卡方檢驗,當然這時一種非參數的檢驗方法。

使用條件:

分類相互排斥,互不包容

觀測值相互獨立

期望次數的大小至少在5個以上

1、擬合度檢驗

用途:主要用來檢驗一個因素多項分類的實際觀察數與某理論次數是否接近,由于它檢驗的內容僅涉及一個因素多項分類的計數資料也算是單因素檢驗。

這里主要是考慮某總體分布和某種分布相符合,不涉及總體參數的問題。所以卡方檢驗的本質就是檢驗實測次數與期望次數是否一致

計算方法:先根據樣本的分布情況求出理論次數。

自由度=分類項數-用到統計量的個數

我們查表時,得到的概率是雙側概率,但是因為卡方總為正值,所以看上去像單側。

如果小樣本的話〔期望次數的小于5個〕應該進行校正

耶茨連續性校正公式:

2、獨立性檢驗

用途:主要用于兩個或兩個以上因素多項分類的計數資料分析〔血型與性格是否有關系〕,多用于我們說的RXC表〔列聯表〕的格式。

1、提出假設

2、理論次數的計算

3、卡方檢驗

4、自由度確實定

其中為該格的次數;為該格所在行的總次數;為該格所在列的總次數

如果是四格表〔2×2列聯表〕的話,可以用更簡單的公式一步求解。

獨立樣本

列聯表中假設某格的理論次數小于5,一般需要進行葉茨校正:

相關樣本

列聯表中假設某格的理論次數小于5,同樣需要校正:〔八〕非參數檢驗如果說參數檢驗是正規軍的話,非參數檢驗可算是預備役了,也就是參數檢驗不行時,在上。一般參數檢驗都有嚴格的要求,不是正態分布,就是方差齊性啥的。而非參數檢驗那么沒有嚴格要求。

優點:特別適合順序變量,特別適合小樣本,計算很快。

缺點:未能利用數據的全部信息,將數據轉換成順序變量時會喪失一局部信息,精度不高。而且不能處理交互作用。

1、獨立樣本均值差異的非參數檢驗

秩和檢驗法

用法:與參數檢驗獨立樣本t檢驗相對應

兩樣本容量均小于10

將兩樣本數據混合,從小到大排序,求秩次;

對容量較小的樣本求秩和,記為T;

查表,假設T≤T1或T≥T2那么兩樣本差異顯著;假設T1<T<T2那么差異不顯著〔注意這里的否認域與一般假設檢驗的否認域是相反的〕。

兩樣本容量均大于10時

接近于正態分布,用Z檢驗

中數檢驗法

用途:對應著兩獨立樣本平均數之差的t檢驗,用中數作為集中趨勢的量度

計算:將兩個樣本數據混合從小到大排列

求混合排列的中數

分別找出每一樣本中大于混合中數及小于混合中數的數據個數,列成四個表

對四個表進行卡方檢驗〔怎么檢驗?剛剛還講過卡方檢驗,別說不知道。〕

克-瓦氏單向方差分析

用途:對應于方差分析的完全隨機設計

計算方法:

當組數k=3,ni≤5時

將所有數據混合,排序,求出各個水平的秩和,記為

計算H值:

查表,查H表

當組數k=3,ni>5時

算法同上,算出H值,再用張P357的校正公式進行校正后查卡方表。但是如果未校正時已達顯著,那么可以不使用校正公式

2、相關樣本均值差異的非參數檢驗

符號檢驗法

用法:相關樣本顯著性t檢驗對應,也是以中數作為集中趨勢的量度

計算方法:

當對子數N≤25

1、對于沒對數據之差,不計大小,只記符號。正號的記為n+,負號的記為n-,0不用管。數值較小的記為r,n+加n-等于N。

2、根據N與r查符號檢驗表,假設r大于表中臨界值,那么差異不顯著,即接受虛無假設〔又是與一般參數檢驗相反,要特別注意〕。

可以看出n+與n-差的越多,越顯著。

當對子數N>25

分成的正負號的分布符合二項分布,且大樣本時服從正態分布,故可用Z檢驗

根據二項分布:

符號等級檢驗法

用途:和上面的是一樣的,但是從名字上也可以看出,不但考慮了符號,還考慮了等級,所以有著更高的精度

計算方法:

當對子數N≤25

1、把相關樣本對應數據之差值按絕對值從小到大作等級排列

2、在各個等級前面添上原來的正負號

3、分別求出帶正號的等級和〔T+〕與帶負號的等級和〔T-〕,取兩者之中較小的記作T。

4、根據N查附表,當T值大于臨界值時說明差異不顯著,小于臨界值時說明差異顯著

當對子數N>25

一般認為T分布接近正態分布,可以用Z檢驗

弗里德曼兩因素等級方差分析

用途:對應于方差分析的隨機區組設計

流程:先把每一個個體的K個觀測值的大小賦予相應等級,以這些等級為根底,計算卡方值作為檢驗統計量

計算方法:

1、將每一區組的K個數據〔K個實驗處理數〕從大到小排除等級

2、每種實驗處理n個數據等級和,以Ri表示

3、代入公式

假設K=3且n≤9,或K=4且n≤4,那么查表;

假設K=3且n>9,或K=4且n>4,查df=K-1的χ2表。〔九〕多元統計分析初步如果說多因素方差分析還有可能出計算題的話,那么下面這些幾乎是不可能出計算的,姑且不說有多少本科生上過這個內容,就算上過也未必做得來,更不要說還有大量的跨考生了。所以對他們做些了解就可以了。

1、多元線性回歸分析

我們前面看到的一元線性回歸,其實一個因變量只受到了一個自變量的影響,變化是按照就是一條直線。但是你也知道,一件事的產生往往是由很多原因導致的,所以往往大量情況時多個自變量影響一個因變量,這就是多元線性回歸,往往是曲線。

多元線性回歸模型的一般式為:

2、主成分分析

主成分分析實際上就是一種數據簡化技術,由于在數據評價中常常會用到多個指標,但是指標越多,就越難以評價,所以我們希望能把多個指標轉換成少數幾個綜合指標。這就是主成分分析。這些綜合指標稱為主成分。主要目的是降維,一般而言保存的主成分盡量少點,最好只有一個。

3、因素分析

是處理多變量數據的一種統計方法,他可以揭示多變量之間的關系,其主要目的是從為數眾多的可觀測的變量中概括和綜合除少數幾個因子,用較少的因子變量來最大程度地概括和解釋原有的觀測信息,從而建立起簡潔的概念系統,揭示出事物之間本質的聯系。附:假設檢驗總表〔來源于小白修訂MJ大綱解析〕數據類型單樣本問題獨立樣本比擬相關樣本比擬多組樣本的比擬相關問題獨立樣本重復測量等距型總體正態分布單樣本t/z檢驗獨立樣本t/z檢驗相關樣本t檢驗獨立樣本方差分析重復測量方差分析Pearson積差相關分布形態未知大樣本下相應的t/z檢驗大樣本下相應的t/z檢驗大樣本下相應的t檢驗轉化為順序型轉化為順序型順序型符號檢驗法曼-惠特尼U檢驗維爾克松T檢驗克-瓦氏單向方差分析弗里德曼雙向等級方差分析Spearman等級相關命名型χ2匹配度檢驗χ2獨立性檢驗符號檢驗法χ2獨立性檢驗Φ相關后記心理統計學,只要弄清楚一般的特點和原理,知道什么情況下使用什么公式就足夠應付統考了。平時一定要多做些題目,不要光背不練,光背不練,就是白背了。統計,學起來就像筆版所說的,關鍵是要培養統計思想。有了這種思想再難的題咱也不怕了。最后一點就是要把統計和實驗心理學的實驗設計捆綁在一起以應對綜合題。

介紹

張厚粲現任北京師范大學心理系教授,博士生導師,校務委員,北京師范大學珠海分校教育學院首席教授,身兼國務院參事,全國政協委員,中國心理學會常務理事,全國教育科學規劃委員會學科評議組成員,教育考試研究會副會長和國際心理科學聯盟(IUPsyS)副主席等多種重要職務。主編了我國最早的《心理與教育統計學》教材,率先開設“心理測量”課程,并應用心理統計和心理測驗的理論是中國心理學界的領頭人之一,具有很高的學術水平及影響。學識淵博,學術思想活潑,富于開創精神,科研成果斐然。在振興中國心理科學,推動高等師范學校心理學科和建設上做出許多開創性的工作。目錄一、心理測量的根本理論 1〔一〕心理測量的根底 1〔二〕經典測量理論〔CTT〕 3〔三〕工程反響理論〔IRT〕 8〔四〕概化理論 9二、心理測驗及其應用 10〔一〕心理測驗的編制技術 10〔二〕心理測驗的實施 13〔三〕測驗常模 13〔四〕標準參照測驗〔同目標參照測驗〕 17〔五〕常用心理測驗〔務必要認真看,考的比擬細〕 19〔六〕心理測驗的應用 27《心理測量學》前言這門課占35分,結構一般是〔8個單項選擇+1個多項選擇+1個簡答〕,不過每年可能不一樣,分值權重相對統計來說會小一些,畢竟內容擺在那里。而且像工程反響理論和概化理論,那么難,考起來也沒幾人懂。所以一般都是對于根本的知識點進行考察。

心理測量估計是目前應用最為廣泛的一門學科。還記得你們一來到大學,輔導員就給你們做了份量表吧,以至于很多人認為心理測驗就是測你有沒有精神病的?還有一類人認為心理測驗就是我們平時買的時尚雜志中的“心理測驗”比方,測愛情指數,今日運勢等。有些姑且還有些道理,有些簡直十分荒謬,毫無信效度可言。當然,作為平時消遣還是可以的。另外,你們作為未來的研究生,一定要把普及心理學文化作為己任,因為人們對心理學的誤解太大了。如果真能一眼就把你給看穿了就好了!

其實,心理測量不限于我們平時所說的對于心理疾病診斷的測量〔MMPI〕,我們的很多考試,如公務員考試等,各種人才選拔,如航天員的選拔。其實也都是運用了心理測量的相關原理。

大家如果有興趣報考心理測量相關方向的專業,務必要把這一門學好。

這局部參考書目如下:

《心理學專業根底綜合考試大綱》〔2011年版〕教育部考試中心

《心理學專業根底綜合考試大綱解析》〔2011年版〕高教

《心理與教育測量》戴海琦等暨南大學出版社〔2007年修訂本〕

《心理測量學》鄭日昌人民教育出版社〔1999年版〕

《心理學統考重難點手冊》2011第三版

《MJ心理大綱詳解》〔小白修訂版〕白云子開始一、心理測量的根本理論〔一〕心理測量的根底1、心理測量的根本概念

要搞清楚心理測量,先要知道什么是測量

測量:就是依據一定的法那么使用量具對事物的特征進行定量描述的過程。

例:考研成績就是依據考研答案使用閱卷老師和計算機對你的試卷答案進行打分的過程

〔可能不是很準確,差不多就是這么個意思〕

所以心理測量就是依據心理學原理使用量表對心理活動的特征進行定量描述的過程。

測量的兩大根本要素:參照點〔有絕對零和沒有絕對零〕和單位〔有確定意義和相等價值〕

構成了下面四種量表:〔來源于小白修訂MJ大綱解析,我加了個例子〕量表類型稱名量表順序量表等距量表比率量表單位和零點無〔名字〕無〔名次〕有相等單位〔溫度〕有相等單位,絕對零點〔時間〕四那么運算無無加減加減乘除統計方法百分比、次數、眾數、卡方檢驗中位數、百分位數均數、標準差、積差相關、t檢驗等幾何平均數、變異系數例子職業名次溫度重量

注意:高級量表可以向下兼容,但低級量表不能向上兼容。

心理測量的理論依據:

桑代克〔1918〕:凡客觀存在的事物都有其數量

麥柯爾〔1939〕:但凡其數量的事物都可以測量

心理量表:本質上屬于順序量表。因為參照點是相對參照點。測量單位的意義也不明確,往往達不到等距量表。但是很多都通過統計方法轉換成了等距量表

心理測驗定義〔阿納斯塔西的〕:她認為心理測驗實質上是對行為樣本的客觀的和標準化的測驗應具備4個根本條件

行為樣本:測量外部行為來推測心理特質〔間接測量〕

標準化:〔內容,施測條件,評分規那么,常模的標準化〕【常模是用來彌補心理測驗沒有絕對參照點的缺陷】

難度或應答率〔難度適中,應答率符合統計計算〕

信度和效度〔結果一致且可靠〕

2、心理測量的特征與分類

心理測量的特征

間接性:心理屬性是內在的不可直接測量到的特質,但可表現為一系列具有內在聯系的外顯行為,測量者可以通過一定的方法測量這些外顯行為,并由這些行為判別特質的性質。

相對性:對人的行為進行比擬,沒有絕對的標準,亦即沒有絕對零點,有的只是一個連續的行為序列。所有的心理測量都是看每個人處在這個序列的什么位置上,也就是只有順序量表的特征。

客觀性:實際上就是測驗的標準化問題。測驗用的工程,說明、言語、態度、評分、分數轉換、解釋都需要標準化。

心理測量的分類

1、按測量對象

智力測驗:一般認知能力〔斯坦福-比內,韋克斯勒智力量表,瑞文推理屬此類〕

能力傾向測驗:預測能力開展方向〔一般能力傾向測驗,特殊能力傾向測驗〕

成就測驗:個人在接受教育后的學業成就〔學科成就測驗,綜合成就測驗〕

人格測驗:16PF,EPQ,MMPI

2、按測量方式

個別測驗:同一時間只能測量一個被試,智力測驗〔斯坦福-比內,韋氏〕和投射測驗

團體測驗:同一時間能夠測試許多被試,絕大多數自陳式人格問卷

3、按內容的形式

文字〔紙筆〕測驗:通過文字形式表現出來的。

非文字〔操作〕測驗:通過指認、手工操作表現出來。

4、按測驗功能所作的分類

成就測驗與預測測驗

難度測驗與速度測驗

描述測驗與診斷測驗

5、按評價所參照的標準分類

1、常模參照測驗〔被試與常模比擬,以評價被試在團體中的相對位置〕

2、目標參照測驗〔被試與絕對標準相比擬,以評價被試有無到達該標準為目的〕

3、潛力參照測驗〔被試水平與自身潛力相比擬,以評價被試有無充分發揮自身潛力為目的

歷史人物

孔子將人的智力分成三個等級,中之上人、中人和中下之人

三國時期劉邵《人物志》是一部研究能力的著作

高爾頓第一個大規模系統測量人的個別差異,還是評定量表、問卷法及自由聯想法的先驅

卡特爾在《心理測驗與測量》這篇論文中,首次提出了“心理測驗”

1904年比內與其助手合作完成了世界上第一個智力量表〔比內-西蒙量表〕〔二〕經典測量理論〔CTT〕1、經典測量理論模型

真分數〔T分數〕:反映心理特質的真正水平的那個值

觀測分數〔X分數〕:實際測量到的那個值

于是乎,經典測量理論就假定,觀察分數和真分數之間是一種線性關系,并只相差一個隨機誤差即

X=T+E〔經典測量理論的數學模型〕

根據這一模型,我們可以引申出3個假設公理

〔1〕假設經過平行測驗反復測量足夠屢次,那么觀察分數的平均值會接近于真分數

E(X)=T或E(E)=0〔換句話說就是測量足夠多的話,隨機誤差就趨近于0了,誤差服從均值為0的正態分布,所以就被抵消了〕

〔2〕真分數和誤差分數之間的相關為零

ρ(T,E)=0〔說明真值和隨機誤差是獨立的〕

〔3〕各平行測驗上的誤差分數之間的相關為零

ρ〔E1,E2〕=0〔平行測驗造成的隨機誤差之間無關,誤差無從均值為0的正態分布〕

平行測驗是測量特質不同,但題目不同的測驗〔高考的A,B卷〕

事實上,我們在實際運作時,并不是許多平行測驗來反復測查同一批被試,而是用一個測驗來同時測查許多被試。

根據模型,我們可得

(觀察分數的方差=真分數方差+誤差分數方差)

系統誤差的變異包含在真分數的變異之中,所以真分數還可以分成兩局部:與測量目的有關的變異和與測量目的無關的變異

〔真分數的方差=有關方差+無關方差〕

最后:觀測分數的變異=測量目的有關的變異數〔有效變異〕+穩定的但出自無關來源的變異數+測量誤差變異

其實就是觀測變異=有效變異〔心理真值,我們要的〕+系統誤差變異〔朝一個方向偏〕+隨機誤差變異〔朝各個方向偏〕

2、測量的信度與效度信度的定義

信度就是測量結果的穩定性程度。也就是用同一測量工具反復測量的一致性程度。就是打靶能不能每次打在同一個位置,也叫可靠性。

信度有三種等價定義:

信度乃是真分數變異與觀測分數之比

信度乃是真分數與觀測分數的相關系數的平方

信度乃是兩個平行測驗間的相關系數

信度的作用

信度是隨機誤差的反響〔與系統誤差無關〕

信度可以解釋個人測驗分數的意義

信度可以幫助進行不同測驗分數的比擬〔Z檢驗〕

信度的估計

重測信度

同一個量表對同一組被試施測兩次所得結果的一致性程度。〔相對穩定性〕

使用條件:所測量的心理特性必須是穩定的;遺忘和練習的效果根本上相互抵消〔智力測驗間隔6個月左右〕;兩次施測之間,被試在所要測查的心理特質方面沒有獲得更多的學習和訓練。

計算方法:皮爾遜積差相關

復本信度

兩個平行的測驗測量同一批被試所得結果的一致性程度。

使用條件:構造出兩份及以上平行測驗〔A、B卷〕;盡量縮短間隔時間,排除記憶和練習的干擾

缺點:嚴格的平行測驗很難造出來;容易受到練習,記憶和遷移的影響

計算:兩個復本測驗上所得分數的皮爾遜積差相關。

分半信度

將一個測驗分成對等的兩半后,所以被試在這兩半上所得分數的一致性程度。

使用條件:通常在只能施測一次或沒有復本的情況下使用;當一個測驗無法對等分半時,不能用;〔可以按奇偶分半,題目難度分半,題目內容分半〕

計算:可以看成是短時距內實施的兩個平行測驗。和復本信度一樣,但是由于算出來只有半個信度,多以應該用斯皮爾曼-布朗公式加以矯正。

〔rhh兩半分數間的相關系數,rxx為整個測驗的信度值〕

兩個測驗的方差相等時才能使用,否那么應該用弗朗那根公式或盧侖公式。

同質性信度

內部所有題目的一致性程度。就是一個測驗所測內容或特質的相同程度

計算方法:克龍巴赫α系數:

結果解釋:一致性高,說明所測的都是同一心理特質,而且題目得分之間也有高的正相關

特質單一,同質性信度不一定高,但同質性信度高,特質一定單一

評分者信度

多個評分者給同一批人的答卷進行評分的一致性程度

計算:評分者2人用積差相關或等級相關,評分者多于兩人時用肯德爾和諧系數〔W系數〕來算,但被評對象多于7個,可以用卡方檢驗。

信度的影響因素與改良

影響信度的主要因素有:

1、被試方面

個體而言是,被試的心理特質水平的穩定性

團體而言是,離散程度和團體的平均水平都會影響

2主試方面

施測人員不按規定施測,成心制造緊張氣氛,或給考生一定的暗示,協助等,那么測量信度會大大降低

3、施測情境方面

考場是否安靜、光線和通風是否良好、設備是否齊全、桌面是否符合要求

4、測量工具方面

測量工具是否穩定,試題取樣、試題之間的同質性程度、試題難度等

5、兩次施測的時間間隔

重測信度,越短越好

提高測量信度的常用方法:

1、適當增加測驗長度〔工程同質,數量適宜〕【看病時,醫生只問你一兩個問題就做出診斷,你信嗎?】

2、難度適中,分布正態

3、提高區分度

4、選取恰當的被試團體

5、主試嚴格執行實測程序,評分者嚴格按標準給分,場地按要求布置

效度的定義

效度是指一個測驗或量表實際能測出其所要測的心理特質的程度。也就是能不能打中靶心。是隨機誤差和系統誤差的綜合反映,判斷是否有效要從多方面搜集證據

效度的數學定義:效度=有效變異除以總變異,由觀測變異=隨機誤差變異+系統誤差變異+有效變異可知,信度高效度不一定高,效度高信度一定高,測驗效度受信度制約。

內容效度

一個測驗實際測到的內容與所要測量的內容之間的吻合程度。〔考研時全是超綱題,內容效度就低〕

用途:成就測驗,職業測驗〔選拔和分類〕。不適用于能力傾向測驗和人格測驗

與外表效度區分開來,外表效度是外行人認為高就高

結構效度

一個測驗實際測到所要測量的理論結構或特質的程度,也就是說能夠說明心理學理論的某種結構或特質的程度。〔卡特爾根據他的人格理論制作了16pf,結構效度應該是高的〕

特點:結構效度大小首先取決于心理特質理論;實測資料無法證實理論時,并不一定結構效度不高;結構效度是通過測量的內容的選擇積累起來以確定的。

確定方法:1、提出理論假設并分成細小的綱目,以解釋被試測驗上的表現。2、依據理論框架,推演出有關測驗成績的假設。3、用邏輯的和實證的方法來驗證假設

用途:智力測驗,人格測驗

實證效度〔效標關聯效度〕

一個測驗對處于特定情境中的個體的行為進行估計的有效性。說明應該以實踐的效果來作為檢驗標準〔研究生考試選拔的人才,具備高的科研能力,說明實證效度高〕

效標指被估計的行為是檢驗效度的標準,簡而言之就是衡量一個測驗是否有效的外在標準。〔就是你測定的行為,會不會在實踐中發生〕

常用效標:學業成就、等級評定、臨床診斷、專門的訓練成績、實際的工作表現、對團體的區分能力以及其它現成的有效測驗。

效度的估計

實證效度確定的步驟:明確觀念效標,確定效標測量,考察測驗分數與效標測量關系

實證效度的估計方法:

相關法:計算測驗分數〔瑞文推理〕與效標測量〔高考〕的相關系數

區分法:接受測驗后,先工作一段時間,根據工作成績〔效標測量〕分成好壞兩組。在回過頭來分析兩組被試原先接受測驗的分數差異,假設這兩組人的測驗分數差異顯著,那么說明該測驗有較高的效度

命中率:

總命中率,測驗選出且工作合格和測驗淘汰且工作不合格的人數與總人數之比

正命中率,測驗選出且工作合格與總人數之比

效度的影響因素與改良

影響因素

測驗的構成〔樣本對預測內容和結構的代表性,難度,指導語,題目編制,測驗長度〕

測驗的實施過程〔不遵守指導語,或出現意外干擾,計分出錯〕

被試情況:個體:身心狀態;團體:是否同質〔大學生測驗混進幾個小學生〕

所選效標的性質:不同測驗選擇不同效標,效標與測驗分數間必須符合線性關系。

測量的信度:測驗效度受信度制約

提高方法:

精心編制測驗量表,防止出現較大的系統誤差

妥善組織測驗,控制隨機誤差

創設標準的應試情景,讓每個被試都能發揮正常的水平

選擇正確的效標、定好恰當的效標測量,正確地使用有關公式

信度和效度的關系

信度是隨機誤差的反映;效度是系統誤差和隨機誤差的綜合反映

信度高是效度高的必要非充分條件,信度高效度不一定高,效度高信度一定高。

信度是關于打靶總打同一個點,說明隨機誤差小。

效度是打到靶心,說明系統誤差小,隨機誤差也小。

3、心理測量的誤差

測量誤差的定義

測量誤差是指在測量過程中由那些與測量目的無關的變化因素所產生的一種不確定或不一致的測量效應。

隨機誤差就是那種與測量目的無關的,偶然因素引起的而又不易控制的誤差〔不確定朝哪里偏〕

系統誤差是指那種由與測量目的的無關變量的變因引起的一種恒定而有規律的效應。〔穩定的朝一個地方偏〕

測量誤差的來源及控制

測量工具〔樣本太小或有偏。樣本小,不穩定,樣本偏,不準確〕

被測對象〔身心狀態,如過渡焦慮和緊張會低于正常成績出現測量誤差〕

施測過程〔物理環境,外面突然放鞭炮,估計····,意外事件,考場停電〕

主試方面〔主試的年齡,性別,外表,言談舉止,表情動作,是否按規定實驗〕

測量誤差的估計

4、心理測驗的工程分析

難度

難度是指測驗工程的難易程度。大局部人答對,難度小。大局部人都答錯,難度大。

難度的計算〔計分方法不同,工程難度的計算方法也不同〕

二分法計分工程的難度〔客觀題,只有答對答錯兩種〕

通過率〔不考慮被試作答是猜想成功的機遇〕

計算方法:答對人數的百分比〔與我們通常的理解相反〕

其中代表工程難度;為全體被試數;為答對通過該工程的人數

極端分組法〔被試人數較多時〕

先按總分從高到低排列,分成三組,總分最高的27%作為高分組,總分最低的27%作為低分組,分別計算高分組和低分組的通過率,然后求工程的難度。

其中和分別代表高分組合低分組的通過率

非二分法計分工程的難度〔主觀題,從總分值到零分的多種可能結果〕

其中為被試在某工程上的平均分;為該工程的總分值

測驗難度水平確實定

測驗的目的是為了了解被試在某方面知識技能的掌握情況,可以不必過多的考慮難度,內容適宜即可〔目標參照測驗〕

測驗的目的是用于選拔、錄用人員,就應該將難度控制在錄取率附近〔常模參照測驗〕

難度的等距變換

由于難度是順序變量,不能指出差異的大小和代數運算,所以一般都轉換成等距量表。樣本很大時,近似正態,可以轉換成標準分數。但是轉換后往往會有小數和符號,所以可以采用美國教育測驗效勞中心的難度指標(Z是P值轉換得來的難度指標)

難度對測驗的影響

分布形態:難度過大,分數集中在低分端,呈正偏態分布;難度過小,分數普遍較高,集中在高分端,呈負偏態分布

離散程度:難度集中在0.5附近時,分數分布廣,方差大。難度集中在兩端時,過易或過難,分數分布范圍最小。

對信度的影響:分數分布廣,信度高,反之信度低。

對區分度的影響:分布分布廣,區分度高

區分度

區分度〔D〕是指測驗工程對被試心理品質水平差異的區分能力。〔水平高的得分高,水平低的得分低,區分度就好〕,取值范圍[0,1],區分度的效標分數更多是測驗總分。

區分度的計算

1、工程鑒別指數法〔適用于二分法記分的測試工程〕

其中和分別代表高分組合低分組的通過率。〔兩端各選27%的被試〕

正態分布時,很有效,如果團體人數過少時,應該加大選擇的比率。

2、相關法

以工程分數與效標分數或測驗總分的相關作為工程區分度的指標。比工程鑒別指數法有更高的精度。常用的計算方法:點二列相關,二列相關,Φ相關,積差相關

難度和區分度的關系

難度接近0.5時,工程潛在的區分度越大,而難度D越接近1或0時,工程潛在的區分度就越小。所以一般保持中等難度

區分度的相對性

不同的計算方法,所得區分值不同

樣本容量大小影響相關法區分度值的大小〔樣本越大越靠譜〕

分組標準影響鑒別指數〔D〕〔分組越極端,區分度越大,一般取前后27%〕

被試樣本的同質性程度〔水平接近區分度小〕

工程的綜合分析與篩選

1、根據難度挑選工程〔一般難度在0.35-0.65,平均難度那么要0.5左右〕

2、根據區分度挑選工程〔區分度在0.3以上比擬理想,有些在0.2-0.3的也可以〕

3、由于分布廣,信度高,所以盡量使成績分布均勻,難度梯度應該大些,最好呈正態分〔三〕工程反響理論〔IRT〕首先,前面的經典理論是有缺乏的〔真分數與觀測分數存在線性關系的假設不合理,平行測驗也難以成立〕,于是為了彌補它的缺陷,工程反響理論和概化理論應運而生了。

簡單的說,IRT在處理微觀問題〔被試水平與答題目之間的實質性關系〕優勢明顯,CTT在處理中觀問題〔常見的標準化考試〕時更方便易懂,GT那么在處理宏觀問題〔如對結果做出推斷〕時更顯出色。

工程反響理論是為了克服CTT理論的局限而提出來的,從測驗的內部入手,采取數學建模和統計調整的方式,重點討論被試能力與測驗工程之間的實質性關系,測驗的每一個工程都有自己的工程特征曲線,描述了每一個特定能力水平的被試答對或答錯該工程的概率。

潛在特質理論〔和經典理論一樣,認為潛在特質不能觀測和測量,只能借助于行為〕

潛在特質:制約人的行為的心理特征

潛在特質空間:對于某一特殊行為的開展起作用的所有潛在特質的集合,潛在特質空間可能是多維的也可能是單維的〔和人格特質理論的維度差不多〕

【你的行為是由潛在特質決定的,查明了潛在特質空間的維度,以及各維度在決定你行為時所作奉獻的大小,建立了維度模型后,只要找到你在維度模型上的位置,就知道你的開展方向和水平了】

1、單維性假設與工程特征曲線

單維性假設:單維性是指測驗測量的是單一特質而非多元特質,即被試對測驗中任一工程的反響是其單一特質的函數。

工程特征曲線:IRT假設正確反響率與特質變量之間存在規律性變化關系,這種關系可以用一個數學函數形式表示出來〔回歸方程〕,這一函數稱為工程特征函數,這一曲線稱為工程特征曲線。

2、單參數模型、雙參數模型和三參數模型〔正態卵形模型,很有喜感的名字〕

正態卵形模型將前面的工程特征曲線視為一條S形的正態積累函數曲線,除了含有被試特質參數外,均還含有三個位置參數a、b、c,這三個參數決定曲線走向和形態的參數。

單參數模型:難度參數,答對題目的概率,除了個自己有關還和難度有關

雙參數模型:難度參數和區分度參數,答對題目的概率,除了個自己有關還和難度和區分度有關

三參數模型:難度參數和區分度參數和猜想參數。答對題目的概率,除了個自己有關還和難度和區分度和猜想有關。

3、工程信息函數與測驗信息函數

工程信息函數:反響了每個工程對每個被試進行評價時所提供信息的大小。用工程信息函數計算出來的值叫工程信息量。工程信息量越大,說明進行評價時所提供的信息量越大。,測量誤差越小。雙參數模型時,特質參數與難度參數相等時,誤差最小。說明題目要與能力相匹配。

測驗信息函數:把一個測驗中所有的工程信息函數都累加起來,就得到了測驗信息函數。測驗提供的信息量越大,那么該測驗在評價該被試的特質水平時就越準確。〔四〕概化理論CTT理論僅以一個E就概括了所有誤差,并不能指明哪種誤差或在總體中各種誤差的相對大小如何。針對性不強,所以克倫巴赫等人提出了概化理論。

概化理論的根本思想是:任何測量都處在一定的情境關系之中,應該從測量的情境關系中具體地考察測量工作,提出了多種真分數與多種不同的信度系數的觀念,并設計了一套方法去系統辨明與實驗性研究多種誤差方差的來源。

1、方差分量的估計

測量的總方差可以分解為代表目標測量的方差成分〔要測的心理特質,如閱讀能力〕和構成誤差的種種方差成分〔測量側面即構成測量條件與具體情境關系的因素,如指導語,試題水平〕。因此,對測驗進行標準化對是對測量側面進行固定,比方把閱讀內容定位科技文,這時所測的特質就變成了科技文的閱讀能力。測量目標在具體關系條件下的分數叫全域分數〔就是真分數〕。同一測驗資料有多種全域分數。

2、概化系數與可靠性指數

概化系數G和可靠性指數Ψ,這兩個指數相當于CCT理論中的信度

概化系數G=測量目標方差/〔測量目標方差+相對誤差方差〕

可靠性指數Ψ=測量目標方差/〔測量目標方差+絕對誤差方差〕

相對誤差方差是所有與測量目標有關的交互效應方差之和,絕對誤差方差是出了目標主效應以外的所有效應方差之和

3、G研究與D研究

概化理論分析的具體過程〔以雙側面交叉設計模型為例〕【例子是一種情境關系】

一個有幾個元素的測驗目標;兩個測驗側面,以及它們的假設干個水平。交叉設計是指,測驗目標的每一個元素都要接受所有水平組合的處理。〔運用方差分析〕

第一步:G研究〔估計出各種效應的期望均方就可以了〕【就是找到各種潛在的誤差來源,算出方差分量】

第二部:D研究〔根據G研究的結果做出決策〕【利用G研究的資料,對各種調整了測驗情境的關系進行分析,優選測驗方案】

目前概化理論在我國還處于實驗研究階段,在面試、考核等主觀性測評中有一些應用。后記大家看到這里根本上已經接近尾聲了,測量的內容很雜,大家最好對著書看,記得10的一道題目坑了不少人,估計最后很多人考完連在哪里都不知道吧。

1937年,施瑞奧克(J.K.Shryock)將我國三國時期劉邵關于人的能力研究的著作翻譯成英文在美國出版。該著作是

A.《人物志》

B.《心書》

C.《呂氏春秋》

D.《學記》

介紹

克隆巴赫(1916—2001),美國心理學家、教育學家。他創立了一套常用的衡量心理或教育測驗可靠性的方法——“克隆巴赫系數”(Cronbach’scoefficientalpha),并在此根底上建立了一個用于確定測量誤差的統計模型。1957年中選為美國心理學會主席,1973年獲美國心理學會頒發的杰出科學奉獻獎,1974年中選為國家科學院院士。二、心理測驗及其應用〔一〕心理測驗的編制技術1、心理測驗編制的根本程序〔1〕確定測驗目的:明確測量對象〔明確測驗哪些個體或團體〕;確定測量目標〔測何種心理特質〕;明確測量用途〔用于心理診斷還是選拔人才〕;〔2〕制定編題方案〔編制測驗的總體構思〕第一,全面而具有代表性的測驗內容;第二,對各個內容點的相對重視程度,通常用百分比來表示〔3〕編輯測驗工程〔選定測驗題目〕:收集測驗資料〔豐富,普遍,有趣味〕;測驗工程形式〔書寫的,還是操作的〕;編寫測驗工程〔4〕預測與工程分析:預測〔小樣本施測〕,工程分析〔對預測結果進行統計分析,確定區分度和難度〕〔5〕合成測驗〔把預測后有價值的題目編排成測驗〕測驗工程的選擇〔根據,測驗的性質,難度和區分度來選〕測驗工程的編排〔并列直進式,混合螺旋式〕編制復本〔至少要有等值的兩份〕〔6〕測驗的標準化:測驗內容標準化;施測過程標準化;測驗評分標準化;測驗分數的解釋標準化;〔7〕鑒定測驗:信度、效度、測驗量表及常模〔轉換成等距量表〕〔8〕編寫測驗說明書〔向測驗使用者說明如何使用該測驗以保證信度和效度2、測驗目標與命題雙向細目表測驗目標:測驗何種心理特質命題雙向細目表:列表形式的編制方案,它指出了測驗所包含的內容所要測定的各種技能,以及對每一個內容、技能的相對重視程度。編制命題雙向細目表有兩個用途:〔1〕在編題階段,命題雙向細目表指出應該編制多少和編制哪些種類的題目。題目編號后可將題目的實際分布情況與命題雙向細目表對照,以確定測驗題目是否恰當地代表了所要測量的領域與核對重要方面的內容是否有遺漏。〔2〕在計分時,可按表中的百分比確定每類題目的分數。3、題目編制技術題目編制的一般原那么如下:〔1〕測試題要符合測驗目的〔2〕內容取樣要有代表性〔3〕題目格式不要使被試產生誤解〔4〕文句簡明扼要,要防止使用晦澀難懂的字詞〔5〕應有不至引起爭論的答案〔創造力測驗、人格測驗除外〕〔6〕各個題目必須彼此獨立〔7〕題目中不可含有暗示此題或其他題答案的線索〔8〕題目內容不要超出受測團體的知識和能力〔9〕所提問題應防止涉及社會禁忌與個人隱私〔10〕施測與評分省時4、測驗標準化是指對影響測驗目的的無關變量的控制過程,具體包括四個方面:〔1〕內容標準化有兩層含義:其一,測驗題目必須能測量所要測量的目標,題目內容應是總體的代表性取樣;其二,對所有的被試必須實施相同的或等值的測驗。〔2〕施測標準化是指讓所有的被試都在相同的情

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論