經(jīng)典測評理論的發(fā)展、技術(shù)和實(shí)際運(yùn)用_第1頁
經(jīng)典測評理論的發(fā)展、技術(shù)和實(shí)際運(yùn)用_第2頁
經(jīng)典測評理論的發(fā)展、技術(shù)和實(shí)際運(yùn)用_第3頁
經(jīng)典測評理論的發(fā)展、技術(shù)和實(shí)際運(yùn)用_第4頁
經(jīng)典測評理論的發(fā)展、技術(shù)和實(shí)際運(yùn)用_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、經(jīng)典測評理論的發(fā)展、技術(shù)和實(shí)際運(yùn)用呂國光生活小檔案山茶書主要內(nèi)容測評的含義及教育測評的歷史發(fā)展經(jīng)典測評理論實(shí)施的條件經(jīng)典測評理論的實(shí)施技術(shù)及在教育評價中的運(yùn)用測評的含義及教育測評的歷史發(fā)展測評的含義教育測評的歷史發(fā)展教育測評的含義和特點(diǎn)測評(Measurement):通常是指人們對客觀事物進(jìn)行某種數(shù)量化的測定。天平、秤、尺子、溫度計(jì)。教育測評(Educational Measurement):對學(xué)生的學(xué)習(xí)能力、學(xué)業(yè)成績、興趣愛好、思想品德以及教育措施上許多問題的數(shù)量化測定。主要用于對學(xué)生精神特性的測定。教育測評的含義和特點(diǎn)教育測評是困難的教育測評是可能的Thordike(1918)說:“凡是存

2、在的事物都有數(shù)量。”Mccall(1922)說“凡是有數(shù)量的都可以測量”測量中的誤差來源測量的儀器和設(shè)備所測量事物的一致性程度測量人的因素教育測評的含義和特點(diǎn)教育測評的特點(diǎn)教育測評一般是間接測評教育測評的度量單位是相對的教育測評是為實(shí)現(xiàn)教育目的服務(wù)的教育測評的歷史發(fā)展主觀經(jīng)驗(yàn)性考試階段(1864年以前)客觀標(biāo)準(zhǔn)化測驗(yàn)階段(1864-1940年)經(jīng)典測評理論成熟和深入發(fā)展階段(1940-)主觀經(jīng)驗(yàn)性考試階段西周:“古之教者,家有塾,黨有庠,術(shù)有序,國有學(xué)。比年入學(xué),中年考校。一年視離經(jīng)辨志,三年視敬業(yè)樂群,五年視博習(xí)親師,七年視論學(xué)取友,謂之小成;九年知類通達(dá),強(qiáng)立而不返,謂之大成。”(學(xué)記)隋

3、煬帝大業(yè)二年(606年)分科考試。局限:題目數(shù)量少;評價缺乏客觀的評分標(biāo)準(zhǔn)客觀標(biāo)準(zhǔn)化測驗(yàn)階段1864年英國教師George Fisher收集許多學(xué)生成績樣本,分別優(yōu)劣,匯集成量表集(Scale Book),作為度量學(xué)生各科成績的標(biāo)準(zhǔn)。1895年美國學(xué)者Rice主張用統(tǒng)一的測驗(yàn)考察、比較各校學(xué)生的成績,并編制了算術(shù)、語言等測驗(yàn)。1905年法國學(xué)者Binet和Simon制訂的第一個智力量表。經(jīng)典測評理論的成熟和深入發(fā)展1940年由美國學(xué)者Tyler主持的“八年研究”結(jié)束,標(biāo)志經(jīng)典測評理論(Classical Test Theory CTT)的成熟。1963年Cronbach發(fā)表了概化理論:信度理論

4、的豐富和發(fā)展標(biāo)志著概化理論(Generalizability Theory GT)的誕生。1952年美國學(xué)者Lord創(chuàng)立了項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)經(jīng)典測評理論實(shí)施的條件信度效度難度區(qū)分度一、信度(reliability)的意義概念:可靠性或可靠的程度信度指觀測值和真值相差的程度信度指統(tǒng)計(jì)量與參數(shù)之間的接近程度信度是指一種測驗(yàn)對相同被試再次測驗(yàn)時引起同樣反映的程度信度指觀測值和真值相差的程度X=T+EX表示觀測值,T表示真值,E表示誤差分?jǐn)?shù).在團(tuán)體測驗(yàn)中, T可以理解為許多人(理論上應(yīng)是無限多人)在相同條件下進(jìn)行同類測量所獲得的大量觀測值的平均數(shù).各人的真

5、值與觀測值之差仍稱測量誤差.E=X-T由于測量誤差是隨機(jī)產(chǎn)生的,與真值無關(guān).在理論上正的誤差分?jǐn)?shù)和負(fù)的誤差分?jǐn)?shù)相抵消,平均誤差為0.根據(jù)這一假設(shè),觀測值的方差應(yīng)等于真值的方差加上測量誤差的方差.即:x =t +e 于是,信度(用rxx表示)可定義為真值方差( t )與觀測值方差( x )的比率。即:rxx =t /x 此公式表明:真值的方差在觀測值方差中所占的比重越大,則信度就越高。計(jì)算信度的公式rxx =t /x (1)x =t +e (2)t =x -e (3)rxx =t /x = 1- e / x (4)信度系數(shù)的計(jì)算常用的信度系數(shù)有:穩(wěn)定性系數(shù)(coefficient of stab

6、ility)等值性系數(shù)(coefficient of equivalence)內(nèi)部一致性系數(shù)(coefficient of internal constancy)穩(wěn)定性系數(shù)穩(wěn)定性系數(shù)(coefficient of stability):用同一量表對相同被試在不同時間測驗(yàn)兩次的觀測分?jǐn)?shù)的相關(guān)系數(shù)。穩(wěn)定性系數(shù)的意義任何事物都在運(yùn)動變化著,但也具有一定的穩(wěn)定性,所以才能對事物進(jìn)行測量和研究。教育測量也是假定所測量的特性處于相對穩(wěn)定的狀態(tài),如果用同一種量表對相同的被試測量兩次,其結(jié)果應(yīng)相同或近似。換言之,測量結(jié)果應(yīng)具有穩(wěn)定性。例如,在一次測驗(yàn)中得高分的學(xué)生,在另一次測驗(yàn)中也有得高分的傾向,被試在兩次測

7、驗(yàn)中的相對地位也非常接近。這種穩(wěn)定性也就表明測驗(yàn)結(jié)果是可靠的或信度高的。使用穩(wěn)定性系數(shù)時要注意的問題 兩次測驗(yàn)的時間間隔要適宜;重測法適用于速度測驗(yàn)而不適用于難度測驗(yàn)。要注意提高被試的積極性。 等值性系數(shù)等值性系數(shù)(coefficient of equivalence)是以兩個等值(題型、題數(shù)、難度、區(qū)分度等)但具體內(nèi)容不同的量表,在最短時距內(nèi),對相同被試先后試測兩次所獲得的兩組對應(yīng)分?jǐn)?shù)的相關(guān)系數(shù)。等值性系數(shù)可采用復(fù)份法(equivalence forms reliability)使用等值性系數(shù)時要注意的問題復(fù)份法的關(guān)鍵是兩個量表必須等值。兩次測驗(yàn)的時間間隔要盡可能短。如果兩次測驗(yàn)緊接,應(yīng)注意

8、被試厭倦態(tài)度。標(biāo)準(zhǔn)化測驗(yàn)一般有復(fù)份,若沒有說明等值信度,或等值性系數(shù)較低,則使用復(fù)本時應(yīng)慎重。內(nèi)部一致性系數(shù)內(nèi)部一致性系數(shù)(coefficient of internal constancy):是同一測驗(yàn)量表的兩個部分得分的相關(guān)系數(shù)。計(jì)算內(nèi)部一致性系數(shù)的方法有兩種:(1)分半法(2)Cronbach 分半法將測驗(yàn)按題目的編號分為兩半:一半是奇數(shù)題,一半是偶數(shù)題。先計(jì)算每個人的奇數(shù)題和偶數(shù)題總分,然后求奇數(shù)題和偶數(shù)題總分的相關(guān)系數(shù)。最后用Spearman-Brown公式校正。求整個測驗(yàn)的信度系數(shù)。問題:為什么要進(jìn)行校正呢?Cronbach 系數(shù)使用最廣泛的信度系數(shù)計(jì)算公式:=n/(n-1)*(1

9、- i / x )其中,n為題目數(shù), i 為每題被試觀測分?jǐn)?shù)的方差之和, x 為所有被試觀測總分的方差。影響信度的因素測驗(yàn)的長度測驗(yàn)愈長,內(nèi)容愈具代表性,信度愈高變量的方差方差愈大,信度愈高rxx = 1 -e /x 信度 題目數(shù)和信度的關(guān)系測驗(yàn)的難度太難或太簡單均會降低信度測驗(yàn)的客觀性愈客觀,信度愈高 100 75 50 25 0 1 2 3分?jǐn)?shù)難度太小難度太大難度適當(dāng)平均數(shù)(M):85 21 60標(biāo)準(zhǔn)差() :信度(KR21):0.43 0.46 0.90 分?jǐn)?shù)之分散度和難度與信度之間的關(guān)系提高測驗(yàn)信度的方法延長測驗(yàn)長度新增加的題目與原有測驗(yàn)題目應(yīng)有相同的統(tǒng)計(jì)性質(zhì),同時,不影響被試回答問題

10、的方法。難度要適當(dāng)。經(jīng)驗(yàn)表明,難度在之間是合適的,也有人認(rèn)為.25-075都有利于提高測驗(yàn)信度。測驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì);測量時間要充分;測量的程序應(yīng)統(tǒng)一;評分要客觀。加大應(yīng)試者之間的差異效度的意義測驗(yàn)分?jǐn)?shù)的正確性,意即“有多正確的程度”效度的種類內(nèi)容效度(content validity)效標(biāo)關(guān)聯(lián)效度(criterion-related validity)建構(gòu)效度(construct validity)傳統(tǒng)上強(qiáng)調(diào)效度的概念有三種,而且是有所區(qū)別的內(nèi)容效度(content validity)意義:測驗(yàn)在邏輯上能測出所要測量的變量或特質(zhì)的程度;測驗(yàn)內(nèi)容的代表性或取樣的適切性;又稱為邏輯效度(logi

11、cal validity)或?qū)<倚Ф?expert validity)考驗(yàn)方法:由專家以邏輯判斷的方式來決定,測驗(yàn)內(nèi)容是否具有代表性以代表潛在的總體試題效標(biāo)關(guān)聯(lián)效度(criterion-related validity)意義:測驗(yàn)分?jǐn)?shù)與外在效標(biāo)間的關(guān)聯(lián)程度,效標(biāo)是指測驗(yàn)所要衡量或預(yù)測的某些特質(zhì)。又稱為統(tǒng)計(jì)效度(statistical validity)或?qū)嵶C效度(empirical validity)類型 同時效度(concurrent validity) 預(yù)測效度(predictive validity)考驗(yàn)方法:求測驗(yàn)分?jǐn)?shù)與其他測驗(yàn)成績之相關(guān)。其他測驗(yàn)成績?nèi)缭谕瑫r測量則為同時效度;如在往后

12、測量則為預(yù)測效度結(jié)構(gòu)效度(construct validity)的意義測驗(yàn)?zāi)軌驕y量到理論上的結(jié)構(gòu)或特質(zhì)的程度。(“結(jié)構(gòu)”是用來解釋人類行為的理論構(gòu)想或心理特質(zhì),它是觀察不到的,但心理學(xué)假設(shè)它是存在的,以便能解釋人類的行為,ex: 動機(jī)、性向、焦慮等。構(gòu)念有其理論基礎(chǔ),因此依據(jù)理論可以預(yù)測人類的行為)結(jié)構(gòu)效度的考查方法評分標(biāo)準(zhǔn)及規(guī)則能夠合理反映構(gòu)念所指稱的特質(zhì)之結(jié)構(gòu)方法:因素分析(factor analysis)將看似復(fù)雜的因素或特質(zhì),歸納成幾個共同的因素,用以解析評分項(xiàng)目的結(jié)構(gòu)并與理論中的構(gòu)念結(jié)構(gòu)相互參照難度難度(Difficulty)的意義難度指測驗(yàn)的難易程度。在教育測量中一般用通過率作為指標(biāo)。若用公式表示,即:P=R/N 以 (0,1)為記分方式P=X/K以 (0,K)為記分方式Q=1-P 整個測驗(yàn)的難度等于全部被試測驗(yàn)總分的平均數(shù)對于測驗(yàn)滿分值之比.測驗(yàn)的難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài)測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的離散程度(Ebel的實(shí)驗(yàn))測驗(yàn)難度影響測驗(yàn)的鑒別能力 難度對測驗(yàn)的影響測驗(yàn)的適宜難度.50區(qū)分度區(qū)分度(Discrimination)是指測驗(yàn)對被試實(shí)際水平的區(qū)分程度.區(qū)分度的計(jì)算方法客觀題(1)D=Ph-Pl其中, D為區(qū)分度符號,Ph為高分組通過試題的人數(shù)比例,Pl為低分組通過試題的人數(shù)比例。(27%)經(jīng)典測評理論的實(shí)施技術(shù)及在教育評價中的運(yùn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論