心理測量學知識-教材()_第1頁
心理測量學知識-教材()_第2頁
心理測量學知識-教材()_第3頁
心理測量學知識-教材()_第4頁
心理測量學知識-教材()_第5頁
已閱讀5頁,還剩194頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章心理測量學知識國家職業資格培訓-心理咨詢師云南大學解亞寧小測驗1、知識分測驗分為16算術分測驗分為7數字符號分測驗分為4積木圖案分測驗分為7這是什么測驗的結果?此結果是如何得到的?如何分析和報告此結果?小測驗2、N維度T分為60E維度T分為40P維度T分為50L維度T分為65這是什么測驗的結果?如何分析和報告此結果?小測驗3、SCL90總平均分為1.2SCL90抑郁因子分為3.3SCL90焦慮因子分為2.3SCL90其余因子分在0-1之間這是什么測驗的結果?此結果是如何得到的?如何分析和報告此結果?心理咨詢師國家職業標準

國家職業資格三級

—心理咨詢員心理咨詢師國家職業標準

國家職業資格三級

—心理咨詢員心理咨詢師國家職業標準

國家職業資格三級

—心理咨詢員心理咨詢師國家職業標準

國家職業資格三級

—心理咨詢員心理咨詢師國家職業標準

國家職業資格三級

—心理咨詢員相關知識心理咨詢師國家職業標準

國家職業資格二級

—心理咨詢師心理咨詢師國家職業標準

國家職業資格二級

—心理咨詢師心理咨詢師國家職業標準

國家職業資格二級

—心理咨詢師學習內容

〔05年版教材324-392〕第一節概述第二節測驗的常模第三節測驗的信度第四節測驗的效度第五節工程分析第六節測驗編制的一般程序第七節心理測驗的使用第一節概述第一單元測量與測量量表定義3元素:事物、數字、法那么測量2要素:參照點、單位分類4量表:命名、順序、等距、等比一、什么是測量?“測量〞——是依據一定法那么用數字對事物加以確定。測量構成的3個根本元素事物:能力、人格、外顯行為。數字:有區分性、系列或等級性、可加性法那么:規那么、方法,理論依據和指標。

二、測量要素參照點事物的起點絕對零點和參照零點單位有確定定義有相同價值三、測量量表

斯蒂文思〔S.S.Stevens)將測量從低級到高級劃分成四種水平命名量表只是用數字來代表事物或把事物歸類。順序量表分等或排出順序。無相等單位,無絕對零點。等距量表有大小關系,有相等單位,無絕對零點。等比量表有相等單位,有絕對零點。第一節概述第一單元測量與測量量表第二單元心理測驗的根本概念心理測驗定義四特點心理測驗性質三特性心理測驗定義有四個特點工具特點:測驗是引起某種行為的工具。行為樣本特點:測驗是通過行為樣本間接地推知被試者的心理特征。標準化特點:是指測驗編制、實施、計分和測驗分數解釋的一致性,即對所有被試來說施測的條件都相同。常模特點:一組有代表性的被試群體的測驗分數。測驗分數只有與他人的成績或常模比較才具有意義。二、心理測驗的性質間接性根據對測驗工程的反響推論心理特質;相對性結果是與團體行為進行比較而言;客觀性工程、實施與評分和解釋標準化;第一節概述第一單元測量與測量量表第二單元心理測驗的根本概念第三單元心理測驗分類5種分類:功能分類性質分類嚴謹程度分類測驗方式分類測驗要求分類第三單元心理測驗的分類一、按測驗功能分類

智力測驗特殊能力測驗人格測驗二、按測驗的材料分類

文字測驗操作測驗三、按測驗材料的嚴謹程度分類

客觀測驗投射測驗四、按測驗的方式分類

個別測驗團體測驗五、按測驗的要求分類

最高行為測驗典型行為測驗一、按測驗的功能分類智力測驗Binet-Simon智力測驗、Stanford-Binet智力量表、Wechsler兒童和成人智力量表等。特殊能力測驗職業性向測驗、音樂、繪畫能力測驗等人格測驗問卷法——MMPI、16PF、EPQ等;投射法——羅夏墨跡測驗、主體統覺測驗〔TAT〕二、按測驗材料的性質分類文字測驗Binet-Simon智力測驗、Stanford-Binet智力量表、Wechsler兒童、成人智力量表中的言語量表、MMPI、16PF、EPQ等。非文字測驗羅夏墨跡測驗、主體統覺測驗〔TAT〕、Wechsler兒童、成人智力量表中的操作量表、Raven測驗等。三、按測驗材料的嚴謹程度分類客觀測驗Binet-Simon智力測驗、Stanford-Binet智力量表、Wechsler兒童、成人智力量表MMPI、16PF、EPQ等。投射測驗羅夏墨跡測驗、主體統覺測驗〔TAT〕、自由聯想測驗、句子完成測驗。四、按測驗的方式分類個別測驗Binet-Simon智力測驗、Stanford-Binet智力量表、Wechsler兒童、成人智力量表羅夏墨跡測驗、主體統覺測驗〔TAT〕等。團體測驗MMPI、16PF、EPQ。五、按測驗的要求分類最高作為測驗

Binet-Simon智力測驗、Stanford-Binet智力量表、Wechsler兒童、成人智力量表、Raven測驗等。典型行為測驗MMPI、16PF、EPQ。第一節概述第一單元測量與測量量表第二單元心理測驗的根本概念第三單元心理測驗分類第四單元錯誤與正確的測驗觀3個錯誤觀2個正確觀一、測驗的錯誤觀測驗萬能論測驗解決一切問題,分數絕對化。測驗無用論測驗侵犯個人隱私、違背民主原那么。為宿命論和種族歧視提供依據。測驗單一論心理測驗等于智力測驗二、正確的測驗觀測驗是重要心理學研究方法、決策輔助工具;測驗作為研究方法和工具尚不完善;第一節概述第一單元測量與測量量表第二單元心理測驗的根本概念第三單元心理測驗分類第四單元錯誤與正確的測驗觀第五單元咨詢中常用測驗及其應用智力測驗人格測驗評定量表咨詢中常用的三類測驗及其應用智力測驗中國比內測驗、韋氏量表、Raven測驗等;求助者有特殊要求及有可疑智力障礙時使用。人格測驗EPQ、16PF、MMPI等;了解求助者人格及是否有精神異常。評定量表精神病評定量表、病癥評定量表等;了解心理障礙存在與否、程度及病情演變。第一節概述第一單元測量與測量量表(2,3,4)第二單元心理測驗的根本概念(3,4)第三單元心理測驗分類(5)第四單元錯誤與正確的測驗觀(2,3)第五單元咨詢中常用測驗及其應用(3)第六單元心理測驗開展史三個十年四個開展方面第二節測驗的常模第一單元常模團體3W,1H什么是常模團體常模團體的條件常模團體的取樣方法常模團體的分數表達形式一、常模團體的性質〔What〕什么是常模團體:是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。常模團體的組成:確定一般總體--確定目標總體--確定樣本。例:大學生價值觀研究一般總體-大學生目標總體-各大學的學生樣本-不同性別、年齡和專業的大學生群體常模團體的標準:性別、年齡、年級、教育水平、職業、社會經濟地位、種族二、常模團體的條件〔Who〕常模團體的構成必須要明確界定必須由具有共同特征的人組成的群體(性別、年齡、年級、教育水平、職業、社會經濟地位、種族);常模團體的獲取必須具有代表性隨機取樣、分層抽樣。樣本大小要適當總體只有幾十個人,那么需要100%的樣本;總體數目大的樣本,最低不少于30-100人;全國常模應有2000-3000人。常模團體會隨時空的變化而變化常模要定期修訂;要選擇時空較為接近的常模。三、常模團體的取樣方法〔How〕簡單隨機抽樣在簡單隨機抽樣中,每個人或抽樣單位都有相同的時機作為常模中的一局部。系統抽樣有時在總體數目為N的情況下,假設要選擇K分之一的被試作為樣本,那么可以在抽樣范圍內選擇每個第K個人來構成樣本。分組抽樣有時總體數目較大,無法進行編號,而且群體又有多樣性,這時可以先將群體進行分組,再在組內進行隨機取樣。分層抽樣它是先將目標總體按某種變量〔如年齡〕分成假設干層次,再從各層次中隨機抽取假設干被試,最后把各層的被試組合成常模樣本。包括分層比例抽樣和分層非比例抽樣四、常模團體的分數表達形式〔What〕常模分數由常模樣本的測驗原始分數按一定的規那么轉換出來的導出分數。它有參照點和單位。例:IQ、韋氏智力量表的分測驗量表分、T分數等。常模指常模分數構成的分布。如心理測量手冊中的原始分數與導出分數的轉換表。解釋測驗分數的根底。一般常模特殊常模第二節測驗的常模第一單元常模團體第二單元常模類型開展常模百分位常模標準分常模智商一、開展常模許多心理特質是隨時間〔年齡〕變化而開展的。將被測者的成績與各種開展水平人群平均表現相比較,這種常模即開展常模,該量表亦稱年齡量表。開展順序量表測驗條目〔能力或行為〕按出現的早晚排列,完成該條目說明到達相應的年齡水平。葛塞爾嬰幼兒發育量表:包括運動水平、適應性、語言、社會性四個方面。一個人在采用年齡量表方式編制的智力測驗上得到的分數,簡稱智齡。計算方法每個條目代表一定的年〔月〕齡,將所通過的條目折算出月齡,然后相加計算出智力年齡。如比內量表。以標準化樣本每個年齡組平均原始分數作為常模,被試者從測驗中得到原始分數與其比較,從而確定智齡。智力年齡心理年齡的分數計算確定根底年齡全部題目都通過的那組題目所代表的年齡確定心理年齡將在所有更高年齡水平上通過的題目,用月份計算,加在根底年齡上例:某兒童6歲組題目全部通過,7歲組通過4題,8歲組通過3題,9歲組通過2題。〔1936年陸志韋修訂版〕智齡:6+〔4×2+3×2+2×2〕/12=7歲6個月一、開展常模年級當量〔年級量表〕即年級水平,指各年級常模樣本的平均原始得分。〔參看教材340頁例〕二、百分位常模百分位常模包括百分等級、百分點、四分位數和十分位數。

百分位常模分數的計算及解釋百分等級百分等級是應用最廣泛的表示測驗分數的方法,百分等級指出的是個體在常模團體中所處的位置百分等級的計算未分組資料

PR=100-(100R-50)/N

R指某人原始分排列的順序數N指樣本總人數舉例:小東在30名同學中語文成績是80分,排列第5名,其百分等級多少?

PR=100-(100×5-50)/30=85正態分布與標準分關系百分點百分點用于計算處于某一百分比例的人相對應的測驗分數是多少,因而在分數量表上,相對于某一百分等級的分數點就叫百分點或百分位數計算方法〔直線內插法〕舉例:高考的最高分為695,其百分等級為100,最低分為103分,百分等級為1,求百分等級80所對應的分數是多少?公式:C指上限百分等級SC上限百分等級對應的分數F指下限百分等級SF下限百分等級對應的分數X百分等級PP根據百分等級,要求的對應分數PP=575.420/(695-PP)=79/(PP-103)79(695-PP)=20(PP-103)〔等號兩側交叉相乘〕54905-79PP=20PP-206054905+2060=20PP+79PP56965=99PPPP=56965/99PP=575.4百分點例題計算部驟〔因式分解〕四分位數

百分位數的變式,將量表分4等份,1~25%、26~50%、51~75%和76~100%四段。十分位數

百分位數的變式,將量表分成10份,1~10%為第一段,91~100%為第十段。三、標準分數常模標準分數是將原始分數與平均數的距離以標準差為單位表示出來的量表。因為它的根本單位是標準差,所以叫標準分數。1.線性轉換的標準分數根本公式為:常見的標準分數有z分數、Z分數〔Z=A+BZ〕、T分數、標準九分數、離差智商〔IQ〕等。2.非線性轉換的標準分數z’分數對每個原始分數值計算累積百分比;在常態曲線面積表中,求出對于該百分比的標準〔z’〕分數。線性轉換的標準分:

Z=A+Bz非線性轉換的標準分:原始分百分等級常態分布的離均值〔查常態曲線面積表〕

求出對應的z分數常見的標準分形式根本形式z分:z=(X–X)/SDX為任一原始分X為樣本平均數SD為樣本標準差常用標準分Z分數Z=A+BzA為量表的平均數〔根據需要指定的常數〕B為量表的標準差〔根據需要指定的常數〕z為根本形式的z分舉例:韋氏智力量表智商的平均值為100(A),標準差為15(B)。某人的全量表分高于常模1個標準差,問其FIQ應為多少?115(IQ)=100+15×1T分數T分數由麥克爾于1939年提出,有紀念推孟和桑代克之意T分數目前表示任何常態化和非常態化的轉換標準系統,量表分平均值固定為50,量表分標準差固定為10。許多人格問卷均采用T分量表,如MMPI、EPQT=50+10(X–X)/SD或T=50+10z50(A)為T分數〔量表分〕的平均值10(B)為T分數〔量表分〕的標準差標準九分1~9分的九級分數量表,平均值為5、標準差為2。標準9分=5+2(X–X)/SD或標準9分=5+2z標準十分 1~10分的十級分數量表,平均值為5、標準差為1.5。卡特爾16PF標準10分=5+1.5(X–X)/SD或標準10分=5+1.5z舉例:〔16PF〕30歲女性被試樂群性得分為15分,常模平均值為10.90、標準差3.23,其量表分是多少?標準二十分1~19分的分數量表,平均值為10、標準差為3。韋氏智力量表標準20分=10+3(X–X)/SD或標準20分=10+3z舉例:〔WAIS-RC〕16歲被試算術分測驗得分為15分,常模平均值為12.73、標準差3.55,其量表分是多少?四、智商及其意義比率智商

離差智商智商的計算及其意義最早的比內–西蒙量表用心理年齡來表示智力的上下測驗題目的安排完全按難度排列,某條目在某年齡組中50%能通過,該條目就被當成該年齡組的題目。比率智商比率IQ=MA〔心理年齡〕/CA〔實足年齡〕×100比率智商的缺乏之處個體智力的增長與年齡的關系并非一直呈直線關系,因此不適合于成人。比率智商的分數在不同年齡組具有不同的意義。離差智商是一種以年齡組為樣本計算而得的標準分數,為了使其與傳統的比率智商根本一致,一般研究者將離差智商的平均值定為100。韋克斯勒智力量表的標準差定在15IQ=100+15(X–X)/SD或IQ=100+15z斯坦福-比內量表的標準差定在16IQ=100+16(X–X)/SD或IQ=100+16z常模標準分轉換表在實際工作中,測驗編制者會采用某種標準分公式計算出與原始分相對應的標準分,并編制成原始分轉換標準分等值表,附在手冊上方便使用。每個測驗采用何種標準分,以及量表分的平均值和標準差均可從測驗手冊中查到。舉例〔C-WYCSI〕4歲城市兒童,言語分量表得分42分,常模平均值為49.94、標準差11.58,其言語IQ是多少?第二節測驗的常模第一單元常模團體第二單元常模類型第三單元常模分數表示方法轉換表法剖面圖法2種常模分數表示方法轉換表或常模表又稱常模表,最簡單、根本的表示方法。將測驗的原始分轉換成相對應的常模分數〔如百分位、標準分、T分等〕〔P346〕剖面圖將測驗分數的轉換關系用圖形表示出來,如韋氏智力量表剖面圖(P346)。剖面圖能直觀地表示出被試在各分測驗上的表現及相對位置。第三節測驗的信度第一單元信度的概念2種定義3個指標一、信度的定義1、通俗的定義即測量的可靠性、一致性或穩定性,指對同一被試者在不同時間內用同一測驗重復測量,所得結果的一致性程度。2、測量學定義——理論定義信度為一組測量分數的真分數方差〔變異數〕和總方差〔實得分數的方差〕的比率。

2、測量學定義——操作定義X=T+E二、信度的指標

1、信度系數——常用相關系數來表示,通常是同一被試樣本所得的兩組資料的相關。它表示實得分數的變異數中有多少比例是由真分數的變異決定的,例如rXX=0.9意指變異的90%來自真分數的差異。

相關系數:表示相關程度的統計學指標相關系數取值于–1.00~+1.00之間。負值表示負相關,正值表示正相關。“0〞表示兩個變量之間完全沒有關系,“1〞表示兩個變量之間呈現一對一的關系。相關系數不是等距的度量值,因此在比較時只能說絕對值大者比絕對值小者相關更密切一些。相關系數與其他統計量一樣也存在抽樣誤差,因此其統計學意義也應進行顯著性檢驗。相關分析計算兩種具有相關關系的不同現象之間關系程度的統計學方法,結果用相關系數表示。二、信度的指標

信度系數相關系數信度指數信度系數的根底,是真分數標準差與實得分數標準差的比值。二、信度的指標測量標準誤——測驗分數的變異量,信度越高,標準誤越小;信度越低,標準誤越大。第三節測驗的信度第一單元信度的概念第二單元信度評估方法4種方法:重測信度復本信度內部一致性信度評分者信度

重測信度——同一測驗、同一組被試,前后兩次施測,求兩次測驗分數的相關系數。舉例:10名學生兩次測驗的成績如下,求它們之間的相關?第1次成績:86587964885855823275第2次成績:88568976856847764575思考題:

1、如何進行重測信度檢驗獲得相應的相關系數?2、重測方法的優點、缺點?一、重測信度〔test-retestreliability〕復本信度——等值平行的測驗叫復本,計算同一組被試在兩個復本測驗上得分的相關系數,這個系數就是復本信度系數。思考題:1、如何進行復本信度檢驗并獲得相應的相關系數?2、復本信度的優點、缺點?二、復本信度〔alternate-formrelaibility〕1、要有兩份或以上真正平行的測驗,即在題目內容、數量、形式、難度、區分度、指導語、時限以及所用例題、公式和測驗等其他方面都相同或相似。2、被試有條件接受兩個測驗。復本信度使用前提條件:〔一〕分半信度〔split-halfreliability〕將測驗題目對等分開,計算兩半測驗分數的相關。注意:所用的公式仍然可以采用積差相關公式,但由于分半后題量地方減少會導致信度被低估,因此,要對信度系數加以修訂。常用斯皮爾曼—布朗的公式三、內部一致性信度舉例〔例3〕:

10名被試者在一個有10個條目的測驗中得分如下,求該測驗的分半信度?被試測驗題目得分單號得分雙號得分單雙之差1234567891012221221001761221121001004403222212111178-1410010000001105120100000013-2622122111107617221211000045-18222201101065192222211000752102211211001651合計18171315119633350482信度系數修訂方法:1、斯皮爾曼-布郎公式校正公式rxx=2rhh/〔1+rhh〕rhh——兩半分數的相關系數,rxx——測驗在原長度時的信度估計。缺陷:該公式假設兩半測驗分數的變異相等,如兩半測驗分數的變異不等值時可采用以下公式:2、弗郎那根〔Flanagan〕公式:

rxx=2[1-〔Sa2+Sb2)/Sx2]

Sa2、Sb2——兩半測驗分數的變異數,Sx2——測驗總分的變異數。3、盧倫〔Lulon〕公式:rxx=1-Sd2/Sx2Sd2——兩半測驗分數之差的變異數,Sx2——整個測驗分數的變異數。同質信度——測驗內部所有題目間分數的一致性。

〔二〕同質信度〔homogeneityreliability〕1、庫德〔G.K.Kuder〕—理查遜〔M.W.Richardson〕公式〔1〕K-R20公式:rkk=[K/〔K-1〕][1-(∑piqi)/Sx2]K——題目數Pi——通過第i個題目的人數比例qi——未通過第i個題目的人數比例Sx2——為測驗總分的變異數。注:適用答對一題得一分,答錯無分的測驗。同質信度的計算方法:〔2〕K-R21公式:

pi——題目的平均通過率qi——1-piK——題目數Sx2為測驗總分的變異數注:適用各題難度相近的情況;當題目難度相差大時,所求信度系數有低估傾向。2、克倫巴赫α系數

α=[K/〔K-1〕][1-〔∑Si2〕/Sx2]Si2——某工程分數的變異數;其它字母意義同k-R20公式,當題目以二分法記分時,∑Si2=∑Piqi,所以K-R20公式為α系數的特例。注:1、適用多重記分的測驗;上述公式不適用速度測驗。2、庫德-理查遜公式和克倫巴赫α系數所求得的信度通常比分半信度低。評定者信度——兩個或多個評分者之間評分的一致性。計算方法:

1、兩個評分者的一致性的計算計算每份試卷兩個評閱人打出分數的相關系數,一般要求在0.9以上,才被認為是客觀的。四、評定者信度2、多個評分者時的一致性計算方法——肯德爾和諧系數

當多評分者、多對象并以等級法記分時,用肯德爾和諧系數計算。

K——評分者的人數;N——被評的對象數;Ri——第i個被評對象的被評等級之和。當K為3~20人,N為3~7人時,可通過直接查W表檢驗,當實際計算的W值大于表中的相應數值時,說明評分所得信度較高。當N大于7時,可計算x2值,作x2檢驗x2=K〔N-1〕W,查df=N-1時的x2值表,如到達顯著水平,W也算到達顯著水平。評分中如果有相同等級出現時,可用下公式:W=12[∑Ri2-(∑Ri)2/N]/[K2(N2-N)-K∑∑(n3-n)/12)]n——相同等級的個數,其他與前面公式相同。

123456A253027202832B222621202530C152018142122舉例:

設有A、B、C三位教師給6篇作文評分,結果如下,試求評分者信度。

123456A524631B425631

C534621Ri147131883〔1〕將所評分數轉化為得分等級,并求出每一篇文章所得等級之和;K=3,N=6∑Ri=14+7+13+18+8+3=63(2)帶入公式計算后,W≈0.95,經查表小于103.9,在.05水平不顯著,由此認定評分者的一直性程度低.各種信度系數相應誤差變異的來源信度系數類型誤差變異來源再測信度時間取樣復本信度〔連續施測〕內容取樣復本信度〔間隔施測〕時間內容取樣分半信度內容取樣同質信度內容異質性評分者信度評分者間差異第三節測驗的信度第一單元信度的概念第二單元信度評估方法第三單元信度與測驗分數的解釋四個方面一、解釋真實分數與實得分數的相關信度系數可以解釋在總的方差中有多少比例是由真實分數的方差決定的;信度系數也同樣說明了測量的誤差比例是多少;信度系數的分布為0.00~1.00范圍,代表了從缺乏信度到完全可信的所有狀況。二、確定信度可以接受的水平當rxx<0.7時,測驗不能用于對個人做出評價或預測,而且不能做團體比較;當0.70≤rxx<0.85時,可用于團體比較;當rxx≥0.85時,可用來鑒別或預測個人的成績或作為。新編的測驗信度應高于原有的同類測驗或相似測驗。參見教材P352的幾種心理測驗的信度系數幾種心理測驗的信度系數測驗類型信度低中高成套成就測驗0.660.920.98學術能力測驗0.560.900.97成套傾向性測驗0.460.880.96客觀人格測驗0.460.850.97興趣測驗0.420.840.93態度量表0.470.790.98三、解釋個人分數的意義測量標準誤的應用意義估計真實分數的范圍;了解實得分數再測時可能變化情形。SE—測量的標準誤;Sx—所得分數的標準差;rxx—測驗的信度。注:該方法只能用同質性信度來計算。在95%或然水平上真分數的置信區間:X-1.96SE<XT≤X+1.96SE說明大約有95%是可能性說明,真分數落在所得分數的±1.96SE的范圍內。例題:某被試的IQ為100,這是否反映了他的真實水平?如果再測一次,他的分數將改變多少?該測驗的標準差為15,信度系數為0.84,其被試的IQ的可能范圍是多少?〔答案見教材P353〕四、比較不同測驗分數的差異差異分數標準誤:可比較兩個人不同分數的差異或同一個人在兩個測驗上的差異。

SEd—差異的標準誤;S—兩個測驗使用的標準差,要求相同。例題:〔見教材P353〕。第三節測驗的信度第一單元信度的概念第二單元信度評估方法第三單元信度對測驗分數的解釋第四單元影響信度的因素四個方面第四單元影響信度的因素一、樣本的影響樣本團體異質性的影響同質易得低相關,易低估;異質易得高相關,易高估。樣本團體平均能力水平的影響能力水平低的團體信度相對低。二、測驗長度同質性題目的增加,可提高測驗信度;測驗越長,內容取樣越具有代表性;測驗越長,被試的猜測影響因素就越小。確定測驗長度所遵循的原那么:增加測驗長度的效果應遵循報酬遞減率原那么。測題數目的計算斯皮爾曼-布朗公式的導出公式:K—改變后的長度與原長度之比;γxx——原測驗的信度;γkk—測驗長度是原來K倍時的信度估計;例題:〔見教材P355〕第四單元影響信度的因素三、測驗難度只存在某些測驗中,如智力測驗、成就測驗等,對人格測驗、興趣測驗等沒有難度問題。從理論上說,只有平均難度水平為0.50時,測驗分數分布的范圍最大,求得的信度也最高。太難或太易時信度減低。洛得〔Lord〕提出的各類選擇題的理想平均難度:五擇一題為0.70;四擇一題為0.74;三擇一題為0.77;是非題為0.85。第四單元影響信度的因素四、時間間隔對重測信度和重測復本信度有影響;兩次測驗間隔時間越短,信度系數越大;間隔時間越長,信度系數越小。第四節測驗的效度第一單元效度的概念2種定義2種性質問題:什么是效度?檢驗效度的方法有那些?效度檢驗常用那些統計分析方法?如何進行效度檢驗?1、通俗的定義效度指的是測量的準確性,即一個測驗或量具能夠測量出其所要測量的東西的程度。效度是科學測量工具最重要的必備條件,一個測驗假設無效度,那么無論其具有任何優點,一律無法發揮其真正的功能。一、效度的定義2、測量學的定義〔1〕理論定義——效度是指在一個測量中,與測量目的有關的真實方差〔變異、變化〕與總方差〔變異、變化〕的比率,〔2〕操作定義——用公式表示,即:rxy2=SV2/SX2SV2代表有效方差,SX2代表總方差,rxy2代表測量的效度系數。Sx2=SV2+SI2+SE2ST2=SV2+SI2一個測驗的效度說明,在一組測驗分數中,有多少比例的方差〔變異數、變化〕是由測驗所要測量的變因引起的,其結果用效度系數表示。二、效度的性質效度具有相對性相對某一目標的有效性效度具有連續性反映有效性程度上下第四節測驗的效度第一單元效度的概念第二單元效度評估的方法3類方法:內容效度設想效度效標效度一、內容效度〔一〕什么是內容效度內容效度指的是測驗題目對有關內容或行為范圍取樣的適當性。由于這種測驗的效度主要同測驗的內容有關,所以叫內容效度。

〔二〕內容效度的評估方法1、專家判斷法

請有關專家對測驗題目與原定內容的符合性做出判斷,看測驗題目是否代表規定的內容。因為這是一個邏輯分析的過程,也叫邏輯效度。

1、專家判斷法——具體操作步驟①定義測驗總體范圍,描述相關知識與技能及所用材料的來源。②編制雙向細目表,確定各種內容所占比例,標出每個條目設計所測內容。③制定一個相應的評定量表來評價效度,如測驗包括的內容、技能、材料的重要程度、條目對內容的實用性等。請每位評定者對各方面進行評價,然后總合所有評定者的評價。〔二〕確定內容效度的方法1、專家判斷法2、統計分析法

復本分析法——內容效度可由一組被試在取自同樣內容范圍的兩個測驗復本上得分之相關來作數量估計。如果相關低,說明其中至少有一個缺乏內容效度。如果相關高,一般推論測驗有內容效度。當然也可能兩個測驗取樣有同樣或相似的偏差。評分者一致性分析再測分析——先將測驗施測于某個團體,該團體對測驗所包含的內容僅具有最少量的知識因而得分很低。讓這個團體參與有關材料的教學和培訓,結束后再進行測驗。如果成績提高,說明測驗測量的是課堂上所教的內容,推論測驗具有較高的內容效度。二、內容效度〔二〕確定內容效度的方法1、專家判斷法2、統計分析法3、經驗推測法例如,經驗說明測驗成績隨年齡提高,因此分析測驗成績或題目通過率與年齡大小的關系,如果測驗分和題目通過率隨年齡而提高,那么說明測驗內容有效。二、內容效度〔三〕內容效度的特點1、外表效度與內容效度外表效度是由外行對測驗作外表上的檢查所確定的;內容效度是由夠資格的專家詳盡地、系統地對測驗作評價而建立的。前者只考慮題目與測量目的之間明顯的、直接的關系;后者那么同時考慮題目與測量目的和內容總體之間邏輯的微妙關系。2、內容效度的應用最高行為測驗〔如能力測驗〕要求有較高的外表效度,以使受測驗者具有較強的動機,盡最大的努力完成。典型行為測驗〔如人格測驗〕卻要求較低的外表效度,如果受試者很容易就從題目上看出測題的目的,就可能作出假的反響。二、設想效度〔一〕什么是設想效度設想效度就是測驗對某一理論概念或特質測量的程度,即測驗的結果能否證實或解釋某一理論的假設、術語或設想,解釋的程度如何,也稱結構效度。確定設想效度的根本步驟先從某一設想的理論出發,提出各項心理功能或行為的根本假設。據此設計和編制測驗,實施測驗,對結果采用相關和因素分析等方法,檢驗測驗結果是否符合理論假設。例:智力測驗的結構效度確實定〔1〕從一般智力理論,提出下面假設:智力隨年齡增長;智力與學業成就有密切的關系;〔2〕根據上面的假設編制智力測驗,對測量數據進行以下分析:測試者的分數隨年齡的相關;智力與學業的相關。〔二〕確定設想效度的方法

1、對測驗本身的分析〔1〕測驗內容效度有時可以作為測驗的結構效度的證據。比方編制語文能力測驗時,對內容范圍的界定描述為:對詞匯下定義對語言作類比推理在句子中正確運用文字的能力。這實際上就是對“語文能力〞的設想下了定義。〔二〕確定設想效度的方法

1、對測驗本身的分析〔2〕考察測驗的同質性通過計算被試在每個題目上的反響與測驗總分的相關或分測驗分數與總分的相關,以及α系數、庫德-理查遜系數等內部一致性的指標,可以推估測驗是測單一特質還是測多種特質,從而確定測驗的設想效度的上下。〔二〕確定設想效度的方法

1、對測驗本身的分析〔3〕分析被試對題目作反響的過程通過被試的操作,詢問他如何處理題目,通過必要的統計處理分析,發現有些什么樣的變量影響反響,因而可確定測驗是否測量了所要測的特質。比方,人格測驗有這樣的題目——“我總是防止批評別人的言行。〞通過分析,發現對這類題目的反響受道德觀念的影響,不單純是人格特質內容,設想效度會降低。〔二〕確定設想效度的方法1、對測驗本身的分析2、測驗間相互比較〔1〕相容效度計算與另一個效度的同類測驗的相關。思考:如何進行?〔二〕確定設想效度的方法1、對測驗本身的分析2、測驗間相互比較〔1〕相容效度〔2〕區分效度一個測驗不僅應與其他測量同樣設想的測驗相關,而且還必須與測量不同設想的測驗無相關。測驗要有效,必須測量與其他變量無關的獨立設想。用這種方法確定的效度叫區分效度。相關越低,區分度越大。〔二〕確定設想效度的方法1、對測驗本身的分析2、測驗間相互比較〔1〕相容效度〔2〕區分效度〔3〕因素分析法建立設想效度的常用方法是因素分析。通過對一組測驗進行因素分析,可以找到影響測驗分數的共同因素,每個因素在共同因素上的負荷量,稱為設想效度的指標。思考題:如何進行因素分析?〔二〕確定設想效度的方法1、對測驗本身的分析2、測驗間相互比較3、效標效度的研究證明

〔1〕根據效標〔如學習成績、診斷標準〕選取不同的被試,形成相對照的兩組,再比較兩組被試的測驗成績,假設測驗分數很好地將兩組分開,那么說明其設想效度不錯。〔2〕將被試分成高分組和低分組〔例如按學習成績分組〕,檢查被試行為特點是否與理論構思〔例如智力水平上下〕相吻合,如果吻合,說明該測驗的構思效度不錯。〔3〕根據心理的開展變化特點驗證構思效度〔例如智力的年齡變化特點〕。〔二〕確定設想效度的方法1、對測驗本身的分析2、測驗間相互比較3、效標效度的研究證明4、實驗法和觀察法證實

觀察實驗前和實驗后分數的差異,也是驗證設想效度的方法〔例如學習訓練對學業成就成績的影響〕。某考試焦慮測驗及其設想——考試焦慮是當考試結果對個人有重大意義時的一種害怕失敗的緊張情緒。有效的考試焦慮測驗應當能反映出這種情緒變化。考察這測驗是否有設想效度。設計幾種實驗情境〔見下頁〕設想效度檢驗例:設計1:比較不同重要性考試時該測驗的分數按照設想,重要考試時焦慮分數高平時考試前實施此焦慮測驗重要考試之前實施該焦慮測驗比較兩次分數,如重要考試前的焦慮分數顯著提高,就說明這個測驗對測量考試焦慮是有效的。設計2:兩場考試的測驗分數的比較舉行兩場考試,使被試相信一場考試關系重大,一場考試無關要緊。挑選兩組被試,高焦慮組和低焦慮組。比較考試成績,出現下述情況,說明測驗有設想效度:焦慮分數高組學生,如在第一場考試中成績比平時有所下降,在第二場考試中卻能正常發揮。焦慮分數低組學生,無論在哪場考試都發揮正常。設計3:收集相關事件證據為測驗分數的比較指標收集被試在經歷一場重大考試時的生理心理參數作為焦慮的指標將其同焦慮測驗分數比較相關高證明焦慮測驗測量了焦慮這個特質。收集某些變異上的證據假設一個特質被定義為隨學習或成熟而改變,那么測量該特質的測驗分數應該隨著年齡的增長而遞增。由此,我們根據分數的變異便可知道一個測驗是否具有設想效度。〔三〕對設想效度的評價優點:設想效度這一概念提出的最大奉獻是把著眼點放在提出假設、檢驗假設上,因此使心理測驗不再只是作實際決定的輔助工具,同時還成為開展心理學理論的重要工具。缺點:有些設想概念模糊,缺乏一致的定義。同樣的設想可能有不同名稱;同樣的概念可能有不同解釋理解。確定效度時沒有明確的操作步驟與程序。沒有單一的數量指標來描述有效程度。三、效標效度〔實證效度〕〔一〕什么是效標效度指一個測驗對處于特定情境中的個體的行為進行預測時的有效性。被預測的行為是檢驗測驗效度的標準,簡稱效標。所以實證效度也叫效標效度。例如:用大學入學成績預測大學生的學習成績用職業測驗預測工作能力用人格測驗預測哪種人容易得精神病等。效標與效標測量

1、效標——所謂效標就是衡量測驗有效性的參照標準,指的是可以直接、獨立測量的我們所感興趣的行為。

常見的效標有:學業成就:如在校成績、學業測驗分數、學歷等可以作為智力和學習能力測驗的效標。等級評定:如對學習成績、智力、人格、工作等表現可以通過判斷評定一個量數,用來作為各有關測驗的效標。臨床診斷:臨床觀察診斷的結果可以作為智力、人格等測驗的效標。效標與效標測量2、效標測量——將觀念上的效標用可操作的測量確定下來。例如:對于大學入學測驗來說,我們感興趣的或要預測的行為是“大學的成功〞,即入大學后能否學得好。“大學的成功〞就是觀念效標,我們必須要數量化或操作化。比方大學的成績常常就用來作為對“大學的成功〞的測量,所以,大學成就就是效標測量。一個好的效標必須具備的條件:效標必須能最有效地反映測驗的目標;效標穩定、可靠,具有較高的信度;效標可以客觀地加以測量,可用數據或等級來表示;效標測量的方法簡單,經濟實用。

效標效度是通過考察測驗分數與效標的經驗關系確定的,一般都可以通過統計分析得到一個數量指標,所以也叫統計效度。

常用統計方法有:相關法、分組法、預期表法、命中率法、功利率法等。〔二〕確定效標效度的方法1、相關法最常用來建立實證效度的方法是求測驗分數與效標測量之間的相關,所得到的數量指標稱為效度系數。測驗成績或分數同效標都是連續變量時,使用積差相關法。當測驗分數是連續變量,而效標是等級評定時,可用賈斯朋〔Juspen〕多系列相關公式計算。當測驗分數是連續變量,而效標是二分變量時,可用點二列相關或二列相關公式計算。當測驗與效標都是二分變量時,可用皮爾遜余弦π法計算四分相關。以上幾種方法的運算公式可參考?心理與教育統計?〔張厚燦粲、孟慶茂〕。相關法求效度的優缺點:優點:提供一個統計指標以總結預測源與效標間的關系。可利用回歸方程式來預測每個人的期望效標成績。效度系數為大家廣泛接受,便于比較研究。缺點:假設預測源與效標的關系不是直線的,那么必須采用特殊的相關法。測驗結果不能提供有關取舍正確性的指標。2、區分法檢驗測驗分數能否有效地區分由效標所定義的團體的一種方法。檢驗平均數測驗錄取一批工人,工作一段后,根據工作成績〔產品數量、質量〕分成稱職和不稱職兩組,然后再檢查當初的測驗分數,用t檢驗看兩組在測驗的平均分數上有無顯著的差異,如果有,說明測驗有預測作用,否那么就沒效。2、區分法檢驗平均數時應注意當團體數量大時,很小的一點平均數的差異都會有顯著意義,此時測驗區分這些團體的實際價值就很小。為了防止上述問題,必須把兩組的平均分數、標準差、重疊量以及平均分數的差異在統計學上的顯著性一并報告。3、命中率當測驗用來作取舍的根據時,其有效性的指標就是正確決定的比例。預測源分數確定一個臨界分數〔分數線〕,高于分數線者接受,低于分數線拒絕。在效標方面根據情況確定一個標準,高于標準為成功,低于標準為失敗。此時可以得到預測命中表。具體內容詳見教材P364。第四節測驗的效度第一單元效度度的概念〔2種定義、2種性質〕第二單元效度評估的方法〔3類方法〕第三單元效度的功能3種功能:預測誤差預測效標分數預測效率指數一、預測誤差效度系數的實際意義常用決定性系數來表示,即相關系數的平方,它表示正確預測或解釋的效標方差占總方差的比例。例如,測驗的效度是0.80,意味著測驗的總方差中有64%的方差是測驗分數的方差,即測驗分數正確預測的比例是64%。一、預測誤差標準誤表達法Sest—標準誤Sy—效標成績的標準差rxy—效標系數標準誤的解釋:真正效標分數落在預測效標分數±1Sest的范圍內,有68%的可能性;落在預測效標分數±1.96Sest的范圍內,有95%的可能性;落在預測效標分數±2.58Sest的范圍內,有99%的可能性。二、預測效標分數最常用的是Y對X的回歸方程:

Y—預測的效標分數a—縱軸的截距,用來糾正平均數的差異;bxy—斜率,Y向X回歸的系數;X—測驗的分數三、預測效率指數預測效率指數用E表示,它說明使用測驗比盲目猜測能減少多少誤差。例如,E=40,意為預測誤差僅為隨機猜測所產生誤差的60%,即在估計效標分數時減少了40%的誤差。E=100〔1-K〕K為無關系數,說明預測源分數與效標分數無關的程度。

第四節測驗的效度第一單元效度度的概念〔2種定義、2種性質〕第二單元效度評估的方法〔3類方法〕第三單元效度的功能〔3種功能〕第四單元影響效度的因素4類因素:第四單元影響效度的因素

一、測驗本身的因素〔材料、題型、難度、長度、排列〕二、測驗實施中的干擾因素〔主試、被試〕三、樣本團體的性質1、樣本團體的異質性2、干預變量四、效標的性質第五節工程分析第一單元工程的難度一、難度的定義

二、計算方法

三、難度水平確實定第二單元工程的區分度

一、區分度的定義

二、計算方法三、區分度與難度的關系工程分析測驗的工程分析包括定性分析和定量分析定性分析:測驗的內容效度、題目編寫的恰當性和有效性定量分析:對題目的難度和區分度進行分析工程分析的目的通過選擇和修改測驗題目,提高測驗的信度和效度。第一單元工程的難度一、定義難度〔difficulty〕,指工程的難易程度,能力測驗中一個重要的指標。在人格測驗中,類似的指標是“通俗性〞。即取自相同總體樣本中,能在答案方向上答復該題的人數。兩種指標的計算方法是相同的難度的指標通常以通過率表示易度?P值大時,難度?P值小時,難度?

一、工程的難度一、定義二、計算方法二分法記分的工程〔1、0記分〕-直接計算法公式〔通過率〕:P=R/N×100%P指工程的難度〔通過率〕R答對或通過該工程的人數N全體被試人數舉例:答復某題時,10名被試中8人答對,其難度為:P=8/10×100%=80%

二分法記分的工程〔1、0記分〕

樣本例數較大時的計算方法根據測驗總成績將被試分為三組高分組〔NH〕:分數最高的27%中間組:分數居中的46%低分組〔NL〕:分數最低的27%計算高分和低分組的通過率計算兩組平均通過率作為難度指標公式:P=(PH+PL)/2P指難度〔通過率〕PH指高分組通過率PL指低分組通過率舉例:某測驗條目高分組通過率為85%,中間組通過率為52%,低分組通過率為35%,問平均通過率是多少?吉爾福特難度矯正公式〔因為選擇題易受到猜測的影響,備選答案越少,機遇的作用越大,越不能反映真實難度,吉爾福特的校正公式用于對此進行校正。〕CP—矯正后的通過率P—實際得到的通過率K—備選答案的數目非二分法計分工程的平均分計算法X為全體受試者在該題目上的平均分數,Xmax為該題的總分值。

舉例:計算難度〔通過率〕某題平均得分1.8分,最高分2分,通過率:P=1.8/2.0×100%=90三、難度水平確實定〔一〕工程的難度P值越接近0.50,區別力越高;試題的平均難度應接近0.50,各題難度分布應該在0.50±0.20之間;測驗用于選拔或診斷時,應較多項選擇擇難度值接近錄取率的工程;例:錄取率20%時,難度20%。對于選擇題來說,P值一般應大于概率水平〔P值等于概率,說明題目過難或不清;P值小于概率,說明題目有問題〕。〔二〕測驗的難度〔與分數分布的關系〕測驗的難度取決于組成測驗工程的難度通過觀察測驗分數的分布,可以進行直觀檢驗。如果測驗難度適中,分數的分布應當接近常態分布;如果測驗偏難,分布呈正偏態〔圖5-4,A〕如果測驗偏容易,分布呈負偏態〔圖5-4,B〕測驗偏難或容易時,可以通過增加或減少不同難易程度的條目來解決。某些測驗〔如標準參照測驗〕允許測驗分數呈偏態分布。正偏負偏第二單元工程的區分度一、定義指測驗工程對所測量的心理特性的區分程度或鑒別能力。區分度取值在-1~+1之間;工程得分與實際能力水平之間相關系數越大,區分度越高。區分度低意味工程不能區分受試水平,影響效度。確定區分度的方法包括鑒別指數法和相關法。〔一〕鑒別指數法當效標測量是一個連續變量時,可從分布的兩端〔各占27%〕選出高分組〔H〕和低分組〔L〕,然后計算高分組和低分組在該工程的通過率,這兩個百分數之間的差異就提供了題目區分度的指標。D=PH-PLD為鑒別指數PH為高分組某工程通過人數百分比PL低分組某工程通過人數百分比。D值越大,工程區分度越高,工程越有效。二、計算方法例:32名被試在4個題目的得分被試題1題2題3題4總分被試題1題2題3題4總分11111417110022111141810102311114191100241111420011025101132111002611103221000171110323010018110132410001911103250100110110132600101111110327100011211002280100113101022900000141001230000001511002310000016011023200000計算鑒別指數按總分排序確定高、低分組分組人數=32×0.27≈9人高分組:1~9號低分組:24~32號分別計算高、低分組在各題的通過率P1H=9÷9=1.00P1L=2÷9=0.22P2H=8÷9=0.89P2L=2÷9=0.22P3H=8÷9=0.89P3L=1÷9=0.11P4H=6÷9=0.67P4L=0÷9=0.00分別計算各題鑒別指數D1=1.00-0.22=0.78D2=0.89-0.22=0.67D3=0.89-0.11=0.78D4=0.67-0.00=0.67鑒別指數〔D〕題目評價0.40非常優良0.30~0.39良好,如能改進更佳0.20~0.29尚可,仍須修改0.19以下劣等,必須淘汰L.Ebel提出的鑒別指數標準〔二〕相關法計算區分度常用的方法是相關法,即以某一條目得分與效標成績或測驗總分進行相關運算。相關系數越高,說明該條目越具有區分功能。常用于工程分析的相關方法點二列相關二列相關Ф相關1、點二列相關〔1〕適用性:適用于一個變量是連續變量,另一個是二分變量的資料。例如,某工程答對記1分,答錯記0分,那么此工程為二分變量,而總分為連續變量。〔2〕計算公式:

2、二列相關適用于兩個連續測量的變量,但其中有一個變量由于某種原因被分成兩個類別。〔1〕工程分數連續,效標或測驗總分為上下或及格與不及格兩類。〔2〕效標連續,工程分數分為對、錯或通過、不通過兩類。二列相關公式:Xp—通過該工程被試的平均效標分數Xq—未通過該工程被試的平均效標分數P—通過該工程的人數百分比q—未通過該工程的人數百分比St—全體被試效標分數的標準差y—正態分布下p與q分割點正態曲線的高度例子:15名被試在某測驗第1題上的作答情況〔通過1分,未通過0分〕與效標分數見下表:學生序號123456789101112131415效標分數657031498050351681697855779042第1題得分010110100110110P=8/15=0.5333q=1-p=0.4667Xp=548/8=68.5Xq=334/7=47.71Z0.000.05...0.080.391.02.03.0p0.000.0190.03180.150.34130.47720.4986y0.39890.39840.397670.37040.24190.05390.00433、φ相關(1〕適用性:適用兩個變量都是二分變量。一些連續變量也可以用此方法計算相關系數。φ相關不要求變量呈正態分布。用該系數作為區分度指標時,要求題目反響和效標量都是二分變量。〔2〕公式:45名考生考取大學的人數和在某題上通過的人數見下表:升學情況題考取未考取合計目通過13〔A〕7〔B〕20反未通過5〔C〕20〔D〕25應合計182745例題:三、區分度與難度的關系工程通過率P鑒別指數D1.000.00.90.20.70.60.501.00.30.60.10.200.00.00三、區分度與難度的關系區分度與難度的關系區分度與難度有密切的關系難度為0.5時,區分度最高難度較高或較低時,區分度中等非常高或非常低的難度時,區分度也很低不同水平被試中區分度與難度的關系較難的題目對高水平被試有較高的區分度中等難度的題目對中水平被試有較高的區分度較容易的題目對低水平被試有較高的區分度平均難度0.5左右,能保持整體較好的區分度。第六節測驗編制的一般程序第一單元測驗的目標分析第二單元測題的編寫第三單元測驗的編排和組織第一單元測驗的目標分析一、測驗的對象明確測量對象二、測驗的用途〔描述、診斷、選拔、預測〕顯示性測驗預測性測驗三、測驗的目標工作分析對特定概念下定義確定測驗的具體內容確定哪些

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論