心理測量學復習_第1頁
心理測量學復習_第2頁
心理測量學復習_第3頁
心理測量學復習_第4頁
心理測量學復習_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

測驗的項目分析項目分析的目的和任務項目分析是根據具有代表性的被試樣本的測驗數據,對每個題目進行質量分析。主要包括:項目的難度分析項目的區分度分析項目間的相關分析項目的答案選項分析目的和任務?對測驗題目進行篩選、修訂,保留質量較好的題目,刪除品質較差的題目,以保證測驗的效度、鑒別力和信度。測驗項目的難度分析(一) 什么是測驗項目的難度項目的難度(difficulty)是指測驗的項目(或試題)難易程度,通常用P表示。在能力測驗中,它就是指試題的難度水平。在非能力測驗(如個性、態度等測驗)中,難度被稱為“通俗性”、“流行性”水平,指被試樣本中所選答案的傾向性。(二) 項目難度的計算二級評分法題目的難度計算公式這類項目屬客觀題,一般是答對給1分,答錯給0分.難度計算公式:P=R/N[即:試題通過率]R為其中的答對人數N代表總體(或被試樣本)人數?練習:在一次200人參加的測驗中,第一道單項選擇題的答對人數為60人,第二道題目的答對人數為150人,兩道題目的難度系數分別是多少?多級評分項目的難度計算這類題目題目的評分有三個以上分值。-在能力測驗中,這類題目可以根據被試的答案與標準答案的接近程度,評定出多個分值。如:測驗中的名詞解釋、簡答、論述、案例分析、作文、列舉等題目-在非能力測驗中,這類項目一般有多個程度(或層次)不同的答案選項,根據選項的程度(或層次),評定相應的分值。例如:-我喜歡可以拆開的玩具:-A.完全符合、B.部分符合、C.完全不符合-我的思想似乎:A.走在了時代前面;B.一般;C.比較保守多級評分項目的難度計算公式:P=X/Xmax曲_被試總體(或代表性樣本)某題的平均得分即:P= 該題目滿分值?練習:在一次測驗中,某道論述題的滿分值為15分,90名學生的平均得分為10分。則對于這90名學生來說,該題的難度系數是多少?大規模測驗中題目的難度計算:極端分組法當測試人數非常多,而對難度的精確度要求不高時,可以采用面步驟和方法計算題目的難度系數:可將被試按總分高低排列,然后取得分最高的27%作為高分組,取得分最低的27%的被試作為低分組。分別計算題目對于兩組被試的難度系數:PH和PL根據下面公式,計算題目對于被試總體的難度系數:P=(PH+PL)/2凱利(Kelley)1939年的研究表明,取27%最精確。二級評分題目的難度校正能力測驗中,是非和單項選擇題作答有猜測的可能。答案備選項越少,猜測得分的可能性越大。為平衡猜測對難度系數的影響,可用下式校正:CP=(KP-1)/(K-1)CP為校正后的難度;K為備選答案數目;P為由題目得分直接計算出的難度(即通過率)。校正目的:比較答案選項數不同的題目的難度?練習:一個四選一題目的難度系數為0.60;一個是非判斷題的難度為0.70。哪個題目的難度大?CP=(4*0.60-1)/(4-1)=0.467CP=(2*0.70-1)/(2-1)=0.40測驗難度對測驗結果的影響測驗難度對測驗分數分布形態的影響如果測驗項目是同質的,項目間相關在0.25~0.70間,那么?題目難度在0.25~0.75間均勻分布,測驗難度適中時,測驗分數會出現什么情況?扁平的、近似正態的對稱分布,分數的離散程度較大。?題目難度大多在0.80以上,測驗難度較小時,測驗分數的分布會出現什么情況?負偏態分布:高分偏多且較接近,低分少且較分散?題目難度大多在0.20以下,測驗難度較大時,測驗分數的分布會出現什么情況?正偏態分布:低分偏多且較接近,高分少且較分散題目的難度分布對測驗分數分布的影響?入:題目難度在0.25~0.75間均勻分布扁平的對稱分布(多數測驗的追求)B:題目的難度大都>0.80負偏態分布。哪類測驗希望這樣?^題目的難度大都V0.20正偏態分布。哪類測驗希望這樣?。:題目間相關都很低,難度在0.50左右分數:尖峰的對稱分布(不希望的)£:題目間高度相關,題目難度相近,分數:雙峰或多峰分布(不希望的)測驗題目的難度分布對測驗信度的影響艾伯爾的研究表明,題目的難度分布影響測驗信度:?正確回答率(或得分率)在25%~75%之間的題目,對測驗信度有可能做出較大貢獻。?正確回答率(或得分率)在50%左右的題目,能對測驗的信度做出更大的貢獻。?正確回答率(或得分率)大于90%或小于10%的題目,對測驗的信度不可能做出多少貢獻。測驗的難度對測驗鑒別力的影響鑒別學生能力水平的高低,區分出他們之間的差異,是心理與教育測驗的主要功能。判斷測驗的鑒別和區分能力主要看的統計指標?測驗分數的分布形態、離散程度等。測驗題目的難度對測驗的鑒別能力有什么影響??練習:下面五套測驗測量的都是同一種心理屬性,題目數量一樣,記分方法一樣。從理論上講,下面哪套測驗的鑒別力最好?()-測驗入:題目的難度均在0.4~0.6之間-測驗壓題目的難度均勻地分布在0.2?0.8之間-測驗C:絕大數題目的難度都在0.2以下-測驗D:絕大數題目的難度都在0.8以上-測驗£:題目的難度集中在0.2與0.8兩端。(四)測驗題目難度分布的要求測驗題目的難度分布:是指各種難度的題目數量在題目總數中所占比率的情況。確定項目的難度分布,要考慮兩個重要因素:測驗目的和項目間的相關程度-測驗目的和任務不同,對題目的難度要求也不同;-項目間的相關越高,項目的難度分布范圍應越廣。不同類別測驗對題目難度的要求:-目標參照測驗-針對普通群體的常模參照測驗-選拔性測驗-針對少數特殊群體的標準化測驗目標參照測驗:測驗目的:判斷教學目標是否實現題目難度要求:以教學目標的要求為標準,即:教學計劃和目標要求學生形成什么樣的心理品質和行為表現、能解決什么樣的問題,就編制相應的問題情境、評定項目。針對普通群體的常模參照測驗:測驗目的:對大規模群體的個體水平進行區分和鑒別對于能力和特性水平測驗:?題目的難度分布應接近正態分布,-絕大多數題目的難度應在0.25~0.75之間;?平均難度在0.50左右對于個性、態度測驗:各個項目被選答案的評定等級的次數分布應接近正態分布。選拔性(或篩選)測驗:難度要求測驗目的:選拔或篩選出某方面能力水平較高(或較低)的少數人。測驗題目的難度:應向選拔率(篩選率)方向靠近。?思考與練習:如果要從2000人的總體中選拔出能力水平較高的100人,并進一步區分其能力水平高低,那么測驗題目的難度多大比較合適?選拔率:100/2000=0.05-題目難度系數:0.3或0.2以下-使測驗分數分布為:正偏態第一?章心理瀏輸的編制*圖2-1測瞼分數分布為謹偏態狀芹不是所有測驗都要求其分散分布為正態,例如.標準參照測驗的分數分布就常常是偏態的C二、項目的區分度區分度是指測驗項II對被試的心理特性的區分能力。區分度高的項目,能將不同水平的被試區分開來;區分度低的項目.則不能很好地繆別被試水平,水平高和水平低的被試得分差不多,計算區分度有多種方法,可以根據測驗的目的與數據資料的性質進行選擇:當然,有時也可以同肘用幾種方法相互驗讓:(-)鑒別指數法區分度分析的一種簡便方法是比較烈驗總分高和總分低的兩組被試在項目通過率上的差別:式中p“為高分組在某項目上的通過率,p,為低分組在該項目上的通過率。二者通過率之差為鑒別指數0。D值越大,項目的區分度越高,即項目越有效=1965年,美國測驗專家伊貝爾(LEbel)根據長期的經驗提出用鑒別指數評價項目性能的標準,如表2-2所示。(二)相關法計算區分度最常?用的方法是相關法,即以某一項目分數與效標分數或測驗總分的相關作為該項目區分度的指標。相關越高,

衰2-2項目鑒別指敷與評價標準項目評價0.40以t0.40以t0.30-0.390.20-0.29。,】9以下良好.修改后會更佳尚好,但需修改差,必須海汰聽該項目區分度越高。1.二列相關二列相關適用于兩個連續變量,但其中-個變果被人為分成兩類。例如,當一個測驗的題目分數是連續的,而效標分數或測驗總分被分為及格和不及格兩類時,就可以采用二列相關法;當效標或莉驗總分是連續的,而題目分數被分成通過、不通過兩類時,也可采用此法。其公式為:式中&為與二分變量通過組對應的連續變量的平均數.X.為與二分變單未通過組對應的連續變扭的平均數,咒為連續變量的平均數?S,為連續變量的標準差,p為通過組人數與總人數之比,9為未通過組人數與.枝人數之比。'為p與q交界處正態曲線的高度。在ft算二列相關時,要求二分變最的分布在連續測最時必須是正態分布”如果樣本分布不是正態,總體分布也應是正態>對于連續變敏的分布,雖不要求其是正態,但必須是單峰,而且要對稱。當兩個變量均為連續變量時,一般使用皮爾遜(K.Pearson)積差相關公式計算°(參看-般統汁學教科書)二列相關系數G的顯著性考驗可用下面的公式:gBl塑度2.點二列相關或二列相關適用于??個變仙為連續變另?個變量為二分變址(或雙峰分布)的數據資札例如.選擇題答對記I分,答錯記0分,這時題目分數為二分變量,而總分為連續變量:為了計算其區分度可采用點.?列相關,找公式為:[?-t。廣’y1-vp<?式中符號意義與二列相關公式所用符號意義相同,在葉算3時.只要求連續變是是單峰和對稱的分布,而二分咨虻不受正?態分布的限制,因此它比二列相關的用途更廣泛。例如:根據例1的資料,訂算選擇題的區分度。解:A>(86+72+65+83+80+75,76+62+91+74+81)N1=76.82.Y=(52+94+22+76+73-^474-88+62+58)^9=63.56,=11+20=0.55<7=1-0.55=0.45§二16.66京坦整空,竺,\/0:55^0.45=039610.00考驗點二列相關是否顯著q考驗枳差相關系數的顯著性相同,此外還可以用t檢驗的方法比較與二分變敏對偶的兩組連續變筮的平均數的差界是否顯著.如平均數的整異顯著,則相關系數也顯著,三、區分度與難度的關系區分度勺難度有密切關系〉假如,某項目的通過犁為].(X)或0,則說明高分組與低分組在通過率上不存在差異.因此,鑒別指數/>第.漳心埋瓣砌的編制皋為仇假如.項燈的通過率為0.50.卿可能是高分現的所有人都通過「,而低分組卻無人通過,這祥"的最大值可能達到1回。從上述分析中可以看出,難度越接近0.50,項日的潛在區分度越大,誰度越接近(.00或0時,項目的潛在區分度越?。ㄒ妶D2-3)。但是在實際編制測驗時,不能要求所有項目的難度均為0.50。由于一個測驗中的頊目大多趨向于有關的內容或技能而具有某種程度的相關,假如,所有的項目都完全相關(r=l),并且誰度均為0.5(),在-?個項目匕通過的人在其他各項上也會通過,在一個項目上失敗的人在其他各頊上也將失敗,那么,一半被試將通過每-個項目,另一半將全不通過。在這種情況下,測驗將只有兩種分數:滿分和零分.成U型分布。這樣.從整體來說,測驗所提供的信息便相對減少。事實上,如果測驗的所有項目都是中等誰度,只有項目的內在相關為尊時,整個測驗分數才能產生正態分布°考慮到一般測驗項目之間都具有某種相關,推度的分布廣一些,梯度多一麒,是合乎需要的。分布廣,才能把各種水平的人都區分開來;梯按多,才能區分得更細一,好比-?把尺子,全距越長,刻度越多,可應用的范圍便越大,測員也越精細。難度和區分度都是相對的,是針對一定團體而言的(絕對的玳度和區分度是不存在的)。--般說來,較難的項目對高水平的被試區分度高,較容易的項目對水平低的被試區分度高,中等難度的項目娜,心朝.學對中等水平的被試區分度高,這與中等難度的項目區分度最高的說法并不矛盾.因為對被試總體是較難或較易的項目,對水平高或水平低的被試便成「中等誰度:由于人的多數心理特征呈正態分布、所以當霄要把人作最大程度區分時,項目難度的分布也以正態為好.即特別難與特別容易的項目較少,越接近中等難度的項目越多.而所有項目的平均難度為0.50.四、項目分析的特殊問題(■0選擇題反應模式的分析對于選擇廄,除「分析其誰廈和區分度外,還要分析被試對每個備選答案的反應情況。-般主要做以下分析:'如果正確的務選答案被所有被試所選擇.則說明該題目太容易或者題目中洱能提供了某種暗示;如果某個錯誤答案沒有一個被試選擇,說明該選項不具■迷惑性,錯得過于明顯,-般說來,除非有2%以上的人選擇,否則這個備選答案就應該修改;,如果所有被試都選擇了同個錯誤答案,可能是編制測羚時把答案定錯了,也可能是在教學中發生了錯誤;如果高分組被試的選擇集中在兩個答案上,二者選擇率相近,說明郵可能有兩個正確答案或另一答案也有一定道理;如果高分組對正確答案的選擇與低分組相等或祇于后者,說明所考察的東西與水平無關;如果~個題目被試未答人數過多或選擇各個備選答案人數相等?則說明題目過難或題意不清,使得被試無法作答或憑猜測作答。仁)標準參照淵驗的項目分析以上討論的均是常模參照測驗的項目分析方法C標準參照測驗主要用于判斷被試是否掌握了某些知識技能,是否達到r一個弟先第二革心滸裾盼的編制*確定的標準,測蚣結果只與既定標準比較而不在被試之間作比較因此,調胎分數的變異杵不是彌準參照測驗的必要條件=所以.常模參照測I續的項H分析方法不完全適用于標準參照測撿難度分析標準參照測驗可以采用常模參照測驗的方法來計算琳度.但是在篩選項片時,對誰度水平的要求與常模參照測驗不同.、巾「?標準參照測驗的目的是為「考察被試對某方面的知識技能的掌握情況,因此,只要能反映教育口標或教育者認為糧要的內容,無論其難度為多少.耶可以編入測驗:例如,我們在教學開始之前,為了了解學生的準備狀態所進行的謝洲,多數題目將產生很低的通過率,但這些題目應該保留,因為它們表明r哪些東商需要學習“在進行,段教學之后.為r檢查學生的掌握情況所進行的后測.即使每個題目都有很高的通過率,這些題目也是可用的,因為它們反映了教學的效果,同一道題在教學前后對學生進行測驗,學生的得分如為fp模式(F為失敗,p為通過),則說明教學取得r較好的效果或題目較好;如為FF模式,說明教學效果太船或題月太難了;如為PP模式,說明題目過于容易了;如為PF模式.則說明這個題編制有錯誤或者教學上

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論