心理測量學課件_第1頁
心理測量學課件_第2頁
心理測量學課件_第3頁
心理測量學課件_第4頁
心理測量學課件_第5頁
已閱讀5頁,還剩883頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

心理測量概論心理測量學

心理測量的基本性質

1測驗的類型與功能

2測驗的編制與實施

3心理測量發展簡史

4心理測量學

心理測量的基本性質

第一節心理測量學第一節心理測量的基本性質

DBCA升學升級要測驗

應聘謀職要測驗執業上崗要測驗晉職晉級要測驗

人生的每個關鍵時刻都要用到測驗心理測量應用的普遍性一、心理測量學一、心理測量應用的普遍性(續)

1

2

3

4評估人的心理發展水平有心理成熟測驗評估人的智力發展水平有智力測驗

評估人的心理健康水平有心理健康測驗評估人的人格特征有人格測驗人心理的各個側面都有測驗心理測量學一、心理測量應用的普遍性(續)5評估人的教育水平有教育成就測驗

6評估人的職業能力有執業資格測驗7評估人的學術能力有學術性向測驗

三百六十行,行行有測驗心理測量學一、心理測量應用的普遍性(續)需要更多的專業人員

社會發展和進步的標志

心理測量發展

心理測量學第一節心理測量的基本性質二、心理的可測性人的心理非物質,人的心理可測嗎?

心理測量學二、心理的可測性(續)孟子:權,然后知輕重;度,然后知長短。物皆然,心為甚。桑代克:凡客觀存在的事物都有其數量。麥考爾:凡有其數量的事物都可以測量。心理測量學二、心理的可測性(續)辯證唯物主義的觀點:

人的外顯行為客觀存在,可以感覺、知覺,進而可以測量。心理學的研究證明:

可以通過測量人的外顯行為而推測人的心理。

心理測量學第一節心理測量的基本性質三、心理測量的間接性心理測量是一種間接測量。間接測量必須找準中介媒質。物理測量也有間接測量:測氣溫中介媒質:水銀心理測量學第一節心理測量的基本性質三、心理測量的間接性(續)心理測量的中介媒質:人的外顯行為外顯行為:種類眾多而且復雜多變心理測量的間接測量難度更大。心理測量學第一節心理測量的基本性質四、心理測量的定義廣義測量定義:

測量是依據一定的法則使用量具對事物的特征進行定量描述的過程。心理測量學第一節心理測量的基本性質四、心理測量的定義心理測量定義:

依據一定的心理學理論,使用測驗對人的心理品質進行定量描述的活動。心理測量學四、心理測量的定義(續)定義理解1、心理測量依據的法則:心理學理論心理測量學四、心理測量的定義(續)定義理解(續)2、心理測量工具:測驗。測驗的本質:一個一個精心設計、精心編排,被稱為“題目”的行為刺激組成,“測驗”內容千差萬別,形式林林總總。

心理測量學四、心理測量的定義(續)定義理解(續)3、測量的對象:人的心理品質。心理品質具有內隱性,概念具有抽象性心理測量所測的心理品質實際上是人們的某種理論“構念”我們還要在所測對象為何物的界定上下功夫。心理測量學四、心理測量的定義(續)定義理解(續)4、心理測量的結果:對象的定量描述作為現代科學的心理測量學,涉及多門學科。心理測量學四、心理測量的定義(續)1“心理測量”:多指一項活動、一個過程。2“心理測驗”:多指一樣工具,一個測量文本偶爾當動詞用3“心理評估”:指獲取了測量結果信息后根據某種標準做出狀態優劣判斷的活動。

區別本書三詞用法差異心理測量學第一節心理測量的基本性質五、心理測量的心理影響性心理影響性:無論主觀愿望是什么,只要實施測量,就會給被測量者的心理發展帶來影響。影響可能是積極的,也可能是消極的,可能是短期的,也可能是長期的。心理測量學五、心理測量的心理影響性(續)積極的心理影響:教育測量:準確評價,激勵學習。經歷測量也是學習,有助于提高。心理測量學五、心理測量的心理影響性(續)積極的心理影響:人格測驗:了解人格,促使人格健康發展,促使行為被人悅納。心理測量學五、心理測量的心理影響性(續)積極的心理影響:能力傾向測驗:了解特長,選擇和分配合適工作,人、崗和諧匹配。心理測量學五、心理測量的心理影響性(續)消極的心理影響:誤用和濫用,使用質量低劣的測驗夸大教育考試的作用:為應試而學習,忽視綜合素質發展。頻繁施行教育考試,學生疲于應付,身心受摧殘。心理測量學五、心理測量的心理影響性(續)消極的心理影響(續):不科學解釋智力測驗:盲目樂觀,迷失方向或自暴自棄,喪失動力。不合理使用人格測驗:傷害自尊,甚至導致人格分裂。心理測量學五、心理測量的心理影響性(續)消極的心理影響(續):使用質量低劣測驗:對被試做出錯誤的描述,引發嚴重后果。結論:編制、選擇和使用測驗都要非常慎重。

心理測量學第一節心理測量的基本性質六、心理測量的工具及其特性測驗的本質:任何測量工具都是有參照點和測量單位的數字系統。在心理測量學中也把它叫做量表。量表的兩要素:參照點、測量單位心理測量學六、心理測量的工具及其特性(續)參照點:測量的起點,也稱零點。參照點分類:絕對零點:絕對理解相對零點:測值零只能說品質處于“零點”這個狀態有絕對零點的測量比只有相對零點的測量性能更好優良測量單位:有統一的意義,有恒定的價值。心理測量學六、心理測量的工具及其特性(續)心理測量量表兩要素的特點:參照點是人為的測量的單位要經過統計處理才能有統一意義,有恒定價值心理測量學第一節心理測量的基本性質七、心理測量誤差存在的普遍性與嚴重性測量的誤差:測量所得值與欲測品質實際值之間的差異值。誤差的區別:誤差的性質誤差的大小誤差的來源誤差控制的難度心理測量學第一節心理測量的基本性質七、心理測量誤差存在的普遍性與嚴重性心理與教育測量誤差:不僅存在而且還非常的嚴重。測量研究主要任務:研究如何控制測量的誤差。

心理測量學七、測量誤差存在的普遍性與嚴重性(續)(一)測量誤差的類型隨機誤差:所得值與實際值之間大小和方向都會隨機變化的差異值。系統誤差:所得值與實際值之間的那種大小和方向都不變的差異值。心理測量學七、測量誤差存在的普遍性與嚴重性(續)(一)測量誤差的類型(續)特點:誤差與實際測量值共居一體、混淆難分。任務:將它們分離出來,評估它們的大小,研究控制辦法。心理測量學七、測量誤差存在的普遍性與嚴重性(續)(二)測量誤差形成的原因1、心理品質的特殊性內隱、抽象,造成對目標認識不清晰,導致誤差不穩定,波動起伏,導致誤差。受測者未掌握正確作答技能,致使作答不能代表真實水平。受測者故意掩飾。致使評價出現誤差。心理測量學七、測量誤差存在的普遍性與嚴重性(續)2、使用質量不高的測量工具人的外顯行為與人的心理品質只具備相關關系所測外顯行為不是欲測心理品質的代表性行為測驗項目只“刺激”出了欲測心理品質的一部分行為外顯行為不清晰、不穩定心理測量學(二)測量誤差形成的原因(續)3、施測過程和施測環境安排控制不好施測過程沒有統一要求,測試指導語沒有統一版本,作答起始時間和長短不統一,測試時的內外環境令被試不能集中精力測試過程失控、紀律混亂,舞弊。心理測量學(二)測量誤差形成的原因(續)4、主試的不良品質主試對所測心理品質的理解有誤主試實施的程序有誤評分標準掌握不準確心理測量學第一節心理測量的基本性質

八、心理測量誤差控制的理論與技術概述目標真分數,記為V,是測量者所追求的測量值。隨機誤差分數,記為E非目標真分數(系統誤差分數):記為I目標真分數與非目標真分數合在一起稱為真分數,記為T。心理測量學第一節心理測量的基本性質

九、心理測量誤差控制的理論與技術概述(續)心理與教育測量學假設:

進而有:心理測量學第一節心理測量的基本性質

九、心理測量誤差控制的理論與技術概述(續)在三者都相互獨立的假設下,推得以下兩公式:

心理測量學第一節心理測量的基本性質

九、心理測量誤差控制的理論與技術概述(續)信度:真分數方差在觀察分數方差中所占的比,記為:效度:目標真分數方差在觀察分數方差中所占的比記為;

心理測量學第一節心理測量的基本性質

九、心理測量誤差控制的理論與技術概述(續)心理測量的誤差控制的任務:努力控制測量的隨機誤差,提高測量的信度。努力控制測量的隨機誤差和系統誤差,提高測量的效度。心理測量學第一節心理測量的基本性質

九、心理測量誤差控制的理論與技術概述(續)經典測量理論(ClassicalTestTheory,CTT)。其他理論:項目反應理論(ItemResponseTheory,,TRT)概化理論(JeneralizabilityTheory,GT)心理測量學第一章心理測量概論測驗的類型與功能

第二節心理測量學第二節測驗的類型與功能

一、按所測心理品質不同分類(一)能力測驗1.智力測驗(IntelligenceTest):

測量人的一般認知能力水平高低的測驗。智力測驗的結果比較穩定。測量理論與技術研究最早涉及領域心理測量學(一)能力測驗(續)1斯坦福-比內量表2韋克斯勒智力量表3瑞文推理測驗著名智力測驗

心理測量學(一)能力測驗(續)2.能力傾向測驗(AptitudeTest):能力傾向測驗類型:一般能力傾向測驗:測量個體在多種能力上的潛在優勢的測驗。

特殊能力傾向測驗:測量個體在音樂、繪畫等特殊能力上的潛在優勢的測驗。心理測量學(一)能力測驗(續)2.能力傾向測驗(續):能力傾向特點:依賴于先天,與生活經驗有關,一般不受專門教學或訓練影響。

能力傾向測驗性質:測值相對穩定,具有預測功能。心理測量學(一)能力測驗(續)3.成就測驗(AchievementTests):成就測驗特點:

在特定領域為檢測應試者對有關知識和技能的掌握程度而設計的測驗。教學和訓練會明顯改變成就測驗的結果。成就測驗類型:學科成就測驗、綜合成就測驗、診斷測驗心理測量學(一)能力測驗(續)具體性越來越強抽象性越來越弱穩定性越來越差

智力測驗

能力傾向測驗

成就測驗能力測驗類型特征:心理測量學一、按所測心理品質不同分類(續)(二)人格測驗人格測驗(PersonalityTest):測量個體人格的獨特性和傾向性特征的測驗。心理學人格概念特征:概念非常廣泛,涉及所有情感和非智力因素。應用較廣的人格測驗:自陳人格測驗、人格投射測驗。心理測量學(二)人格測驗(續)1艾森克人格問卷(EPQ)2明尼蘇達多相人格調查表(MMPI).3卡特爾16種人格因素測驗(16PF)

著名自陳人格測驗

心理測量學(二)人格測驗(續)1羅夏墨跡測驗(RIT)著名投射測驗

2主題統覺測驗(TAT)心理測量學(二)人格測驗(續)4句字完成測驗3詞語聯想測驗其他投射測驗

心理測量學第二節測驗的類型與功能

二、按對被試評價時所用的參照標準不同分類對被試評價所用的參照標準:相對標準、絕對標準應用相對標準的稱作為常模參照測驗應用絕對標準的稱作為標準參照測驗心理測量學二、按評價參照標準不同分類

(一)常模參照測驗(Norm-ReferencedTest)定義:以個體在團體中的相對地位來評價個體發展水平的測驗。心理測量學二、按評價參照標準不同分類

(一)常模參照測驗性質:執行可高可低的相對難度標準,難度的高低決定于團體本身的水平。可能使一些高利害、高競爭性測驗難度失控。團體水平發生變化,常模參照測驗要重新修訂。心理測量學二、按評價參照標準不同分類

(二)標準參照測驗(Criterion-ReferencedTest)定義:以個體水平是否達到測驗領域某一固定標準來評價個體發展水平的測驗。心理測量學二、按評價參照標準不同分類

(二)標準參照測驗(續)性質:使用絕對標準,不因很多個體都已達到而提高標準,也不因很多個體都未達到而降低標準。各種專業資格測驗都屬于標準參照測驗。心理測量學二、按評價參照標準不同分類

按評價參照標準不同分類小結:常模參照和標準參照區分:理論上絕對,實際應用中有二者兼具的。附:潛力參照測驗:定義:以個體可能達到的水平來評價個體已經達到水平的測驗。性質:符合對個體進行自身激勵的評價思想。

心理測量學第二節測驗的類型與功能

三、標準化測驗與非標準化測驗標準化測驗:四個方面的標準化要求測驗編制過程標準化測驗實施標準化測驗評分標準化測驗分數解釋標準化心理測量學四個方面的標準化編制過程標準化

標準化測驗編制步驟(六步):測驗目標分解編制方案設計命題征題心理測量學四個方面的標準化編制過程標準化

標準化測驗編制步驟(續):測試分析分數體系設計與制作測驗使用指導書編寫心理測量學四個方面的標準化編制過程標準化編制質量的標準化:

測驗信度效度要求每個題目的質量要求心理測量學四個方面的標準化(續)測驗實施標準化:對主試的要求對被試的要求對測試場所內外環境的要求測試過程順序的要求心理測量學四個方面的標準化(續)測驗評分標準化:試題要有公認的科學答案有統一規范的評分標準心理測量學四個方面的標準化(續)測驗分數解釋標準化:測驗的報告分數要有明確的解釋方法和解釋依據。常模參照測驗:配有解釋常模,可以確定每個分數在團體中的確切地位。標準參照測驗:配有合格分數線以確定每個分數的合格與否

。心理測量學標準化測驗(續)標準化概念說明:標準化主要都是為了控制測量的隨機誤差和系統誤差。教育與心理測量中“標準化”可以理解為是一系列的嚴格標準,也可以理解為是一個過程—測驗的標準化過程。實際應用的測驗是否是標準化測驗必須嚴格鑒別。心理測量學標準化測驗(續)標準化測驗特點:編制要求嚴格,測驗編制周期長,人財物投入大,測驗設計要求面向盡量大的被試群體,使用的針對性、靈活性常常不能滿足要求。心理測量學三、標準化測驗與非標準化測驗(續)非標準化測驗特點:編制目的明確、測試對象熟悉、內容設計針對性強、方法靈活多變、編程短不能輕視自編測驗的作用,同時也要努力提高自編測驗的編制質量心理測量學第二節測驗的類型與功能

四、計算機化測驗與非計算機化測驗(一)計算機化測驗的發展計算機化測驗:被試在計算機前根據指令進行作答計算機化測驗特點:實施方便、反饋及時,測驗效率高。非計算機化測驗--傳統的紙筆測驗,還有用武之地。心理測量學(二)幾種常見的計算機化測驗基于計算機的測驗(Computer-BasedTest,CBT)。由計算機出題,要求被試在計算機前操作作答。各種基于計算機的測驗對計算機的利用程度會有很大不同。除了計算機的形式,基于計算機的測驗的方法、理念與傳統紙筆測驗無本質不同。心理測量學(二)幾種常見的計算機化測驗計算機化自適應測驗(ComputerizedAdaptTest,CAT)。一種新的測驗理念:改變傳統測驗千人一面形式針對被試的水平即時調題、即時施測、即時反饋、即時估算。同時提高測驗的效率和準確率。實現條件:新的測驗理論指導、使用計算機。優點明顯,但技術上也還需進一步完善心理測量學(二)幾種常見的計算機化測驗基于網絡的測驗(Internet-bestTest,IBT)基于計算機的測驗或計算機化自適應測驗采用網絡的形式實施遠程測試,則稱其為基于網絡的測驗。基于網絡的測驗是當前計算機化測驗發展的最高形式。心理測量學五、其它分類

(一)最佳行為測驗和典型行為測驗最佳行為測驗:作答時必須盡能力找到最佳答案。典型行為測驗:作答時要根據自己平時怎么想、怎么做如實作答。能力測驗是最佳行為測驗,自陳式人格測驗是典型行為測驗。典型行為測驗的誤差控制更為困難心理測量學五、其它分類

(二)個別測驗與團體測驗個別測驗應用:面向特殊被試或在測試中主被試間需不斷交流的測驗。個別測驗特點:耗時費力,一般能用團體測驗就不用個別測驗。教育測驗大多采用團體測驗,但也有例外。心理測驗采用個別測驗的要多一些。心理測量學五、其它分類

(三)難度測驗與速度測驗(四)文字測驗與非文字測驗(五)主觀題測驗與客觀題測驗(六)預測測驗(七)行為情境判斷測驗(八)內隱聯想測驗心理測量學第二節測驗的類型與功能

測驗類型豐富:反應社會需求的復雜性和旺盛性。測量學者的任務:開發出更多更好的測驗來滿足社會的各種需求。心理測量學第一章心理測量概論測驗的編制與實施

第三節心理測量學一、測驗的編制明確用于:招聘、晉職升級決策?診斷、評價?了解品質還是做合格決策?

明確:測能力、人格?能力屬哪個層次?人格哪個側面?探明品質結構明確:測驗對象的社會身份、身心特點、分布的范圍與數量。

測驗的對象是誰?

測何種心理品質?

測驗結果作何用?

(一)確定測驗目的--回答三個問題心理測量學一、測驗的編制(二)設計測驗編制方案、制定測驗編制計劃目標:設計一個科學、詳細、可行的測驗編制方案科學:方案從目標到內容、到方法都要符合心理學和心理測量學原理可行:其一是科學意義上的可行、其二是主客觀條件意義上的可行心理測量學一、測驗的編制(二)設計測驗編制方案、制定測驗編制計劃(續)

測驗編制方案的內容:測驗的方法測驗的類型題型及其分布題量及其分布分數系統量評價法測驗質量總體目標編制流程設計和要求心理測量學一、測驗的編制(三)題目編寫測驗題目:基本元素,主體材料。題目類型:客觀題、主觀題題型性質和功能:各有不同,有互補傾向。編寫要求:發揮題型功能,測出欲測心理品質心理測量學一、測驗的編制(三)題目編寫(續)題干編寫:內容科學、語言精練。作答要求編寫:語言準確無歧義、信號強烈醒目。客觀題:正確項唯一正確,迷惑項有適度迷惑力。主觀題:保證答案科學性、評分標準的客觀性。題量分布:題型分布、品質或內容分布、題目難度分布。

心理測量學一、測驗的編制(四)測試分析測試分析目的:評估和篩選試題評估篩選指標:定性指標、定量指標。分析決策:留用、修改留用、修改再測、淘汰心理測量學一、測驗的編制(四)測試分析(續)定性指標:題目的科學性、所測心理品質的相符性、答案的正確性、表述的準確性等等。定量指標:題目定性質量優劣的量化指標有各自的定義和計算方法,有各自的質量優劣標準心理測量學一、測驗的編制(四)測試分析(續)測試對象:代表性的樣本,有足夠容量,與正式測試相同的動機水平,在似真環境中進行。心理測量學一、測驗的編制(五)組卷組卷要求:1、保證入選試題高質量2、嚴格按照設計好的各種題量分布選調試題。3、試題順序:題型順序、難度順序、心理品質層次順序。目的:有效控制測驗的系統誤差。心理測量學一、測驗的編制(六)信、效度調查試卷整體質量調查:信度和效度。信度:只需測驗自身數據效度:還需要測驗外部的一些相關憑證調查目標:信效度證據足夠且都達到一定標準。

心理測量學一、測驗的編制(七)編制測驗分數系統原始分數:以測驗內容為參照背景,不方便比較分數轉換:1、獲取以被試群體為參照背景的分數。2、獲取以某種客觀標準為參照背景的分數。報告分數:方便比較、方便理解和解釋。心理測量學一、測驗的編制(八)編寫測驗使用手冊:指導正確使用手冊內容(10項):1、測驗目的與性質說明;2、適用對象說明;3、測驗內容結構、題型結構介紹;心理測量學一、測驗的編制(八)編寫測驗使用手冊:指導正確使用手冊內容(續):4、測驗編制方法介紹;5、測驗施測方法說明;6、評分方法與標準說明;7、測試對象范圍、數量、來源、抽樣方法說明;心理測量學一、測驗的編制(八)編寫測驗使用手冊:指導正確使用手冊內容(續):8、測驗信、效度報告;9、分數系統編制方法及分數解釋方法介紹;10、測驗使用人員資質要求說明。心理測量學一、測驗的編制(九)編制測驗備份測驗備份:正式測驗的平行復份。平行復份不同處:表面文字內容相同處:所測心理品質內容結構難度結構題型結構信度效度心理測量學一、測驗的編制(九)編制測驗備份(續)測驗備份目的:應付突發事件特殊研究需要取得更可靠結果測驗備份的編制:

與正式測驗有完全相同的過程和標準。心理測量學二、測驗的實施(一)選擇測驗測驗內容和報告分數形式是否符合測驗目的?測驗形式和方法是否適合被試心身特點?測驗的信度和效度是否達到標準?有無所需特殊資質技術人員?心理測量學二、測驗的實施(二)實際施測施測相對簡單:教育測驗、團體測驗、紙筆測驗施測較為復雜:心理測驗、個別測驗、操作測驗規范目的:控制各種可能誤差,提高測驗信效度。心理測量學二、測驗的實施(二)實際施測(續)施測要求:由具備相應資質的技術人員實施按照測驗指導書的要求按步驟實施規范:測驗環境布置指導語宣講測驗材料發放測驗進程控制心理測量學二、測驗的實施(三)評分評分要求:按照測驗指導書規定的方法和標準進行客觀題交由計算機評分,主觀題主要采用人工評閱心理測驗:具備相應資質的技術人員評閱大規模教育測驗:篩選閱卷員嚴格培訓統一評分標準閱卷質量監控網上閱卷系統電子閱卷員系統心理測量學二、測驗的實施(四)測驗結果解釋注意常模參照測驗與標準參照測驗報告的不同。解釋要有辯證思維,不要絕對化,更不要標簽化。善于在個體內部作比較,強調優勢品質,鼓勵改善劣勢品質。以發展的眼光解釋測驗結果,防止負面影響。心理測量學第三節測驗的編制與實施

三、測驗編制與實施中的法律與道德問題(一)為維護社會公平而努力保證測驗質量因為測量嚴重不準導致決策不公,是測量工作者的法律與道德責任。心理測量學三、編制與實施中的法律與道德問題為了保證測驗質量,要防止:因粗制濫造而導致測驗結果嚴重不準;題目內容有文化、職業或宗教偏見;某些群體數據失實、或缺失,導致常模失準。心理測量學三、編制與實施中的法律與道德問題為了保證測驗質量,要防止(續):因不精心或別有用心而選用粗制濫造的測驗;因不精心或別有用心而導致測試過程失控。無相應資質人員主持測驗。心理測量學三、編制與實施中的法律與道德問題(二)為保護個人權益而尊重測驗對象的選擇要征求被試是否愿意參加測驗,沒有權利強迫個體參加測驗。要尊重被試的作答選擇,不能干涉被試的作答。使用被試信息和怎么使用被試信息都要有被試的授權。心理測量學三、編制與實施中的法律與道德問題(三)為保證測驗的安全而嚴守測驗的秘密測驗泄密后果嚴重:能力測驗泄密,造成虛高能力評價。人格測驗泄密,造成虛假的人格評價。高競爭性測驗泄密,造成社會不公。心理測量學三、編制與實施中的法律與道德問題(三)嚴守測驗的秘密(續)重要測驗為國家機密,受法律保護。為了尊重著作權,維護社會公正,遵守職業道德有義務保證測驗的安全、嚴守測驗的秘密,不向他人傳送任何測驗信息。心理測量學三、編制與實施中的法律與道德問題1心理測驗管理條例中國心理學會有關測驗的兩個重要文件:2心理測驗工作者的道德準則心理測量學第一章心理測量概論心理測量發展簡史

第四節心理測量學第四節心理測量發展簡史一、中國古代的心理測量思想(一)個體差異及其可測性思想(二)人才的內涵及其測量方法(三)心理與教育測量的實踐活動心理測量學第四節心理測量發展簡史(一)個體差異及其可測性思想孔子:“性相近,習相遠。”;孟子:“權,然后知輕重;度,然后知長短。物皆然,心為甚。”心理測量學第四節心理測量發展簡史(二)人才的內涵及其測量方法三國時的魏人劉劭:“夫圣賢之所美,莫美乎聰明。聰明之所貴,莫貴乎知人。知人誠智,則眾材得其序,而庶績之業興矣。”他把人的行為表現概括為9種,稱為“九征”。提出“八觀”和“五視”的觀察方法識別人才。心理測量學第四節心理測量發展簡史(三)心理測量的實踐活動孔子:將人的智力分成三個等級,即中上之人、中人和中下之人;不得中行而與之,必也狂狷乎?狂者進取,狷者有所不為也。董仲舒:“一手畫方,一手畫圓,莫能成。”劉劭:《人物志》西周:“國學”心理測量學第四節心理測量發展簡史古代中國心理測量的特點:1.描述性的,定性的,而非定量的;2.分類式的;3.注重對人作整體的鑒定和評價,并傾向于和人的道德品質聯系起來;4.具有強烈的應用性質。心理測量學第四節心理測量發展簡史二、現代心理測量在西方國家的產生與發展(一)心理測量的產生是社會的需要(二)心理測量的早期探索者(三)心理測量的發展(四)心理測量發展的當代趨勢心理測量學第四節心理測量發展簡史(一)心理測量的產生是社會的需要工業革命成功后,對勞動力的需求急劇增加;19世紀,科學的發展和歐洲人道主義思想的廣泛傳播。心理測量學第四節心理測量發展簡史(二)心理測量的早期探索者1.德國:馮特(W.Wundt)2.英國:高爾頓(F.Galton)3.美國:卡特爾(JamesM.Cattell)4.法國:比納(A.Binet)和西蒙(T.Simon)心理測量學第四節心理測量發展簡史(三)心理測量的發展斯坦福大學推孟(L.M.Terman)教授1916年修訂斯坦福-比納量表;桑代克(E.L.Thorndike)編制了第一個標準化的教育成就測驗;人格測驗的先驅克雷佩林(E.Kraepelin),他最早用自由聯想測驗來診斷精神病患者。心理測量學第四節心理測量發展簡史(四)心理測量發展的當代趨勢1.實驗法和測驗法相結合,產生了信息加工測驗;2.計算機測試代替紙筆測試;3.項目反應理論和概化理論等現代測量理論的產生;4.新一代測驗理論心理測量學第四節心理測量發展簡史三、現代心理測量在中國的發展(一)二十世紀前半葉的初步繁榮(二)二十世紀后半葉的再度繁榮與發展心理測量學第四節心理測量發展簡史(一)二十世紀前半葉的初步繁榮對西方心理測驗量表的介紹和翻譯,以及修訂和編制了多種智力測驗、人格測驗及教育測驗;出版的有關心理測量方面的著作達到了20多種。心理測量學第四節心理測量發展簡史(二)二十世紀后半葉的再度繁榮與發展1.理論方面的發展經典測量理論、項目反應理論、概化理論、新一代測驗理論2.心理測量的實踐作用測驗編制、教育及社會考試、人才選拔和人事測評心理測量學本章小結

心理測量學研究內容:如何編制測驗,如何實施測驗,如何控制測量誤差,提高測驗質量。心理測量學本章小結心理測量主要性質:心理測量是間接測量。測量有兩個要素,心理與教育測量的參照點是相對的,測量單位很難恒定。任何測量都有誤差,測量的誤差包括隨機誤差和系統誤差兩種。心理測驗依據不同指標可做許多不同分類。

心理測量學本章小結測量學工作者的社會責任:測量學者關注測驗編制與實施中的法律與道德問題。測量學者還從測量及測量學發展史中汲取經驗和教訓,升華品質與修養。心理測量學本章小結測量學工作者的社會責任:測量學者關注測驗編制與實施中的法律與道德問題。測量學者還從測量及測量學發展史中汲取經驗和教訓,升華品質與修養。心理測量學本章小結測量學發展的啟示:我國測量活動歷史悠久現代測量學發端于西方心理測量學者還從測量以及測量學的發展歷史中汲取經驗和教訓,升華品質與修養。心理測量學第一章心理測量概論討論題:1、為什么說人的心理是可測的,心理可測的意義何在?2、分析心理測量誤差的類型與來源,試說控制方法。3、你從心理測量發展歷史的介紹中感悟到了什么?心理測量學第一章心理測量概論本章參考文獻[1]安妮?安娜斯塔西,蘇珊娜?厄比納著,廖小春,竺培梁譯.心理測驗[M].杭州:浙江教育出版社,2001.[2]金瑜.心理測量[M].上海:華東師范大學出版社,2001.[3]戴海崎,張鋒,陳雪楓.心理與教育測量[M].廣州:暨南大學出版社,2003.[4]鄭日昌,蔡永紅,周益群.心理測量學[M].北京:人民教育出版社,1999.第一節信度概述

一、信度與測量誤差1.經典測量理論的假設式中,X為觀察分數,T為一般真分數,E為隨機誤差分數,V為目標真分數,I為非目標真分數(系統誤差)。

第一節信度的概述一、信度與測量誤差2.信度的定義測量追求的初步目標:T占X的比例越大越好。測量追求的終極目標:V占X的比例越大越好。第一節信度的概述當T占X的比例很大時,那么測值就會是穩定的。一般來說,穩定的測值是可靠的、可信的,因此,信度可被認為是測量結果的穩定性程度。一、信度與測量誤差2.信度的定義第一節信度的概述信度(reliability)是指在不同時間,使用同一測驗,或者使用兩個不同項目的等值測驗,抑或在其他不同的測試條件下,對同一組被試實施兩次或多次測試所得分數的一致性。測驗信度表示測驗分數中個體差異可歸因于所測特質中“真實”差異的程度,以及可歸因于隨機誤差的程度。二、信度的統計定義1.經典測量理論假設的推論第一節信度的概述二、信度的統計定義2.信度的統計定義定義1:信度是被試團體真分數方差與實得分數方差之比定義2:信度是被試團體真分數與實得分數相關系數的平方定義3:信度是一個測驗X(A卷)與它的任意一個平行測驗(B卷)的相關系數第一節信度的概述三、描述信度的指標1.經典測量理論的信度系數信度系數是表示測量結果的穩定性程度的指標。記為:第一節信度的概述信度系數的值域:[0,1]沒有百分之百可靠的測量,因此,rXX=1只是理論上的值,實際當中是不會存在的。?相關系數的值域是[-1,+1],信度系數的值域:[0,1],為什么?三、描述信度的指標1.經典測量理論的信度系數(1)重測信度(test-retestcoefficients),是指用同一個量表對同一組被試施測兩次所得結果的一致性程度,其大小等于同一組被試在兩次測驗上所得分數的相關系數。(2)復本信度(alternative--formcoefficients),是指兩個平行的測驗測量同一批被試所得結果的一致性程度,其大小等于同一批被試在兩個復本測驗上所得分數的相關系數。(3)內部一致性系數(internalconsistencycoefficients)也叫同質性信度(homogeneityreliability),是指測驗內部所有題目間的一致性程度,主要的計算方法有KR20公式、KR21公式、克龍巴赫α系數,以及荷伊特信度等。第一節信度的概述三、描述信度的指標2.經典測量理論的測量標準誤測量標準誤差(standarderrorofmeasurement)是測量誤差的假設分布的標準差。用下列公式能夠容易地計算測量標準誤差:第一節信度的概述式中,SDt表示測驗分數的標準差,rXX表示信度系數。3.概化理論的概化系數(generaliabilitycoefficients)4.IRT的測驗信息函數(testinformationfunction)四、分析測驗信度應注意的問題1.針對測驗類型選用恰當指標(1)傳統的信度概念適合于常模參照測驗,這種測驗的主要目的是為了區分個體在特定特征上所表現出的差異性。個體在測驗分數中表現出的差異范圍越大,該測驗的信度也就越高。第一節信度的概述四、分析測驗信度應注意的問題1.針對測驗類型選用恰當指標(2)標準參照測驗(內容參照或領域參照測驗)的目標是要確定被試是否達到或未達到某個標準,從而將個體分到不同的組別:“達標”和“未達標”。這種情況下,傳統的重測信度、復本信度以及內部一致性系數就不再適用。標準參照測驗可根據具體情況分別采用如下指標:適用于簡單的掌握與否的兩分決策,即所有的分類誤差都被認為同樣嚴重而不管它們離開臨界分數的距離。在這種情況下,可以使用平行型式進行再測,以便得出在兩次測驗上得到相同決策的個體的百分比,進一步可算得分類一致性系數(coefficientofagreement)。

第一節信度的概述四、分析測驗信度應注意的問題1.針對測驗類型選用恰當指標不僅僅關心對掌握者和未掌握者的質的區分,同時也在分數連續體上描述了關于掌握和未掌握的量的差異。這類信度主要采用K2(X,T)指標:

第一節信度的概述式中,、分別為被試總體在測驗上的真分數方差和觀測分數方差;、分別為真分數和觀測分數的平均值;ng為測驗題目數,c是以做對題目百分比表示的區分標準。四、分析測驗信度應注意的問題1.針對測驗類型選用恰當指標K2(X,T)值越大,說明觀測分與區分標準分數(劃界分數)之間的差異代表真分數的對應差異量的可能性越大,因而觀測分與劃界分數的差異就越能反映真實能力上的差異。換言之,測驗就更可信。就單個測驗的結果而言,K2(X,T)的計算公式如下:第一節信度的概述式中,是由庫德-理查德KR20公式求出的信度系數,其余符號意義同前。四、分析測驗信度應注意的問題1.針對測驗類型選用恰當指標(3)在純速度測驗(speedtest)中,個體差異完全取決于速度,此時,就無法恰當地解釋施測一次測驗的信度系數。如果條件許可,可采用重測法或是復本法,這是比較合適的。分半法也可以使用,但是此時的分半是按時間分半,而不是按照項目來分半。也就是,兩半分數必須根據分別規定時間的兩個半測驗。例如,可以把奇偶項目分別印制在兩張卷上,每組項目的用時為全測驗的一半。這種方法等于在同一時間實施了兩個等值測驗。

第一節信度的概述四、分析測驗信度應注意的問題1.針對測驗類型選用恰當指標還有一種替代實施兩個半測驗的方法,就是把總時間四等分,算出每段時間的分數。這種方法簡便易行,施測時每當主試發出事先安排的信號,就要測驗參加進在他們正在做的項目上打個記號。然后,把第一段和第四段時間內答對的項目數相加,得出一個半測驗分數;把第二段和第三段時間內答對的項目數相加,得出另一個半測驗分數。四段時間如此相加,往往可以平衡練習、疲勞和其他因素的累積效應。特別是當項目難度水平前后一致,而不是逐漸增加時,這種方法尤其令人滿意。第一節信度的概述四、分析測驗信度應注意的問題2.信度的報告(1)任何一個信度系數是針對引起測驗誤差的特定因素而言的。有多少種影響測驗分數的條件,就有多少種測驗信度,因此,報告信度時,應該詳細說明測試樣本的特性和所報告的信度類型。在信度報告時只是報告信度系數,而缺乏說明估算系數的方法細節,推導系數時所用的被試群體的特征,以及獲取數據當時的施測條件,等等,這種信度報告是不合格的。

第一節信度的概述四、分析測驗信度應注意的問題2.信度的報告(2)沒有一個單一的、最優的方法來量化信度,沒有一個單獨的指數能恰當地表達所有的相關事實,沒有一個單獨的研究方法在所有的情形下都是最佳選擇,且測驗編制者也不應局限于將某一種方法運用到任何一種測量手段上去。所以,測驗編制者在報告測驗信度時,可以從多方面予以報告。

第一節信度的概述四、分析測驗信度應注意的問題2.信度的報告(3)提供詳細的信度分析報告,讓了解相關知識的人能夠對結果進行評定,并能夠重復信度分析的過程。

例如,簡單說一句“某測驗的信度是0.92”是不能接受的。較恰當的說法是“某測驗的信度系數為0.92,該數值是通過計算一份能力測驗間隔兩周兩次測試成績的相關系數得出的。數據來源是從某市隨機抽取的500名小學5年級的學生施測……”。第一節信度的概述五、信度的標準與作用1.信度是評價測驗質量的重要指標之一。測驗類型

信度系數

低中高學業成就測驗0.660.920.98學術能力測驗0.560.900.97特殊能力傾向測驗0.260.880.96人格測驗0.460.850.97興趣測驗0.420.840.93態度測驗0.470.790.98注:表中數據來源,LewisR.Aiken:Psychologicaltestingandassessment(eighthedition),AllynandBacon,Inc,1994.第一節信度的概述五、信度的標準與作用2.信度是測量過程中所存在的隨機誤差大小的反映。第一節信度的概述例如,我們已知高考文科試卷的總信度rXX

=0.965,文科考生總分的標準差為53.42,那么,文科考試成績的標準誤為:3.信度可以用來解釋個人測驗分數的意義——測量標準誤。如果某生的考試成績為495分,在置信度為0.95時,其真分數的置信區間為:五、信度的標準與作用4.信度可以幫助進行不同測驗分數的比較。第一節信度的概述考察兩個分數的差異是否可靠,是否真有差異的問題。比如,某人的物理成績是否真的優于化學?某人的數學技能本學期是否真有進步?某人在韋氏智力量表上操作智商與言語智商的差異是否真有顯著意義等。

當兩測驗的方差相等時,差異分數的信度系數可用如下公式求出:式中,rXXdiff是差異分數的信度系數;rXX和rYY是兩個測驗各自的信度系數;rXY是兩測驗間的相關系數。五、信度的標準與作用4.信度可以幫助進行不同測驗分數的比較。第一節信度的概述差異分數的測量標準誤可用如下公式求出:式中,SEdiff是差異分數的測量標準誤;rXX和rYY是兩個測驗各自的信度系數;SD是兩測驗間使用的相同的標準差。在比較分數之前,必須將兩個測驗分數轉為具有相同量表的標準分數。五、信度的標準與作用4.信度可以幫助進行不同測驗分數的比較。第一節信度的概述例如,在韋氏成人智力量表中,言語和操作分測驗的信度為0.97和0.93,而它們的智商的平均數為100,標準差為15,故言語和操作智商差數的標準誤為:因為4.74×1.96=9.29,因此,言語和操作智商相差10分時,在0.05水平上,我們說存在顯著差異。若要在0.01水平上作出差異顯著的結論,就要相差13分。?測驗分數的比較與平均數差異顯著性檢驗是一回事嗎?第二節信度的種類

與評估方法詳細介紹第一節中提出的各種信度估計方法的計算。一、重測信度1.含義同一個測量工具在兩個不同時間對同一組被試施測所得結果的一致性程度。重測信度主要考察了一個測量工具是否能夠保證在不同時間測量結果的一致性,他反映了測量工具的結果受到時間間隔因素影響的大小。一般來說,重測的時間間隔越短,那么各種施測情境的變化就越小,重測信度系數就會越大。重測信度系數較大時,說明該測量工具前、后兩次的測量結果比較一致。結果具有較好的跨時間上的穩定性。第二節測驗信度的種類與評估方法一、重測信度2.評估方法重測信度的大小可以通過計算測量工具的重測系數(test-retestcoefficient)或叫穩定性系數(coefficientofstability)來標志。具體來說,就是求取同一組被試在兩個不同時間施測同一個測量工具所得結果分數的相關系數。第二節測驗信度的種類與評估方法一、重測信度3.應用條件測量工具所測量的個體心理特質在時間上應該是相對穩定的。測量工具所測量的個體心理特質應該不存在明顯的練習效應和遺忘效應。在兩次施測間隔期間不應該進行專門的訓練和培訓,以保證重測信度反映的是隨機因素的影響效應。第二節測驗信度的種類與評估方法一、重測信度4.使用重測信度時需要注意的問題兩次施測時間間隔的長短會影響重測信度系數估計值的大小,因此,在報告重測信度系數時應該報告間隔的時間長度。應該根據已有的相關研究結論考慮所測心理特質本身的穩定性程度,以確定前后兩次施測時間的間隔究竟應該多長比較合適時,不應該隨便選擇間隔時間的長短。第二節測驗信度的種類與評估方法二、復本信度1.含義兩個平行的測驗(復本測驗)測量同一批被試所得結果的一致性程度。復本信度反映了由于題目的不同以及時間間隔所導致的測量誤差。平行測驗或復本測驗指的是兩個在題目內容、數量、形式、難度、區分度、指導語、時限以及所用的例題、公式和測驗等其他方面都相同或相似的測驗。也就是用不同的題目測量同樣的內容而且其測驗結果的平均值和標準差都相同的兩個測驗。第二節測驗信度的種類與評估方法二、復本信度2.評估方法復本信度的估計過程就是計算同一批被試在兩個平行的復本測驗上所得分數的相關系數,也叫作等價系數(coefficientofequivalence)。測試設計:同時測試和延時測試。同時測試是在同一個時間段內進行測試,而延時測試則是在兩個時間段進行測試,同時測試可能會存在作答疲勞的效應,而延時測試則可能會存在學習或培訓效應。第二節測驗信度的種類與評估方法二、復本信度3.應用條件要構造出兩份或兩份以上真正平行的測驗;計算復本信度需要對同一批被試測試兩份平行測驗,這就需要掌握一個合理的時間安排。應該盡量在測試結果報告中,詳盡地說明兩次測試的時間間隔、測試順序安排、測試過程中被試的有關測驗經歷等。第二節測驗信度的種類與評估方法三、內部一致性信度1.含義內部一致性信度主要評價了測驗各隨機組成部分之間是否測量了相同的心理特質,因此,它反映的是題目內容的抽樣一致性程度。具體估計方法主要包括分半信度評估法、庫德-理查森信度評估法、克龍巴赫Alpha系數評估法。與重測信度和復本信度不同,在估計測驗的內部一致性信度時,只要用同一個測驗對一批被試測試一次。第二節測驗信度的種類與評估方法三、內部一致性信度2.分半信度含義我們總是可以把一個測驗的所有題目隨機地劃分成對半的兩個部分,然后估計所有被試在這兩個部分題目上得分的一致性程度,這樣得到的測驗一致性估計稱為分半信度。分半信度評價了測驗兩個隨機組成部分的題目是否測量了相同的心理特質。第二節測驗信度的種類與評估方法三、內部一致性信度2.分半信度評估方法計算出被試在測驗兩個隨機組成部分的題目上得分之間的相關系數。由于在用分半測驗得分計算相關系數時,測驗題量被縮短,信度系數需要通過以下這個公式對分半相關系數進行矯正而得到。為兩個分半測驗之間的相關系數,為完整長度測驗的信度系數估計值。第二節測驗信度的種類與評估方法三、內部一致性信度2.分半信度評估方法另外一個估計分半信度系數的方法是Rulon公式,他只需要計算所有被試在兩部分測驗上得分之差的方差以及總分方差:式中,為完整測驗的信度估計值,為被試在兩部分測驗上得分之差的方差,為完整測驗總分方差。

Rulon公式中分子方差反映了由于題目不同等條件帶來的誤差方差,他與總方差之比反映了誤差方差在總方差中所占的比例。第二節測驗信度的種類與評估方法三、內部一致性信度2.分半信度使用時需注意的問題在估計測驗的分半信度時,雖然要求把一個測驗的所有題目隨機地劃分成對半的兩個部分,但是在實踐中對測驗分半時,為了盡量減少無關因素的影響,通常需要考慮題型、題分、題目測試先后順序等因素的平衡問題,比如按照題目順序奇偶分半就是一個經常選擇的方法第二節測驗信度的種類與評估方法三、內部一致性信度3.庫德-理查森信度含義在估計分半信度時,把一個測驗的題目分成兩半的方式是非常多的。而每種分半方式得到的信度估計值總會存在一些差異,但我們無法知道究竟哪種分半結果所得到的信度估計值是最合適的。估計所有可能的分半信度系數的平均數,作為完整測驗的內部一致性最佳估計值。第二節測驗信度的種類與評估方法三、內部一致性信度3.庫德-理查森信度評估方法:所有分半信度系數的平均數的估計方法。第二節測驗信度的種類與評估方法三、內部一致性信度3.庫德-理查森信度使用條件Kuder-Richardson信度系數的估計只能針對1、0記分題型,對于其他題型需要使用更加一般化的估計方法。K-R21公式假設測驗中所有項目的難度是相同的。Kuder-Richardson信度反映的是項目間一致性程度,他會嚴重地受到測驗所測行為特質的同質性程度的影響。第二節測驗信度的種類與評估方法三、內部一致性信度4.Cronbach’sAlpha系數含義是一種比Kuder-Richardson方法更加一般化的信度估計方法,它可以針對各種記分方式的題型進行估計。第二節測驗信度的種類與評估方法三、內部一致性信度4.Cronbach’sAlpha系數評估方法第二節測驗信度的種類與評估方法公式中,k是測驗題目個數,是被試在題目i上得分的方差,是被試測驗總分方差。三、內部一致性信度4.Cronbach’sAlpha系數使用條件可以估計各種記分方式的測驗內部一致性信度系數,是更一般化的測驗內部一致性信度系數估計方法。第二節測驗信度的種類與評估方法四、評分者信度1.含義在評價通過主觀評分方式得到的分數時,我們必須了解不同的評分者在評價被試作答反應時給的分數值的一致性程度(信度)。一般的客觀型題目在評分時很少出現誤差,然而,對于諸如作文測驗、語言類測驗、以及其他的評價性測驗(如人格特質評級、投射測驗評分等),這些測驗類型的評分過程就顯得非常主觀。第二節測驗信度的種類與評估方法四、評分者信度2.評估方法兩個評分者時:計算這兩個評分者評定分數之間的相關系數。多個評價者評價同一批被試:計算和諧系數。第二節測驗信度的種類與評估方法五、信度系數及其估計方法小結1.測試次數和測試卷份數與信度系數估計方法第二節測驗信度的種類與評估方法測試次數測試卷份數1份2份1次分半信度Kuder-Richardson信度Alpha系數復本信度(同時測試)2次重測信度復本信度(延時測試)五、信度系數及其估計方法小結2.各種信度估計方法的誤差方差來源第二節測驗信度的種類與評估方法復本信度(延時測試)復本信度(延時測試)重測信度復本信度(同時測試)復本信度(延時測試)分半信度Kuder-Richardson

和Alpha系數評分者信度時間間隔題目內容時間間隔與題目內容題目內容題目內容與心理行為特質的同質性評分者間差異第三節測量的隨機誤差控制一、影響測量信度的因素影響測量信度的因素施測間隔的時間被試主試施測情境測量工具第三節測量的隨機誤差控制二、提高測驗信度的常用方法提高測驗信度的常用方法規范施測程度、統一施測環境適當增加測驗的長度控制試題的難度分布努力提高每道題的區分度維持測驗的同質性努力提高測驗在被試中各個同質亞團體上的信度保證被試有充裕的作答時間嚴格控制評分誤差第三節測量的隨機誤差控制第四節評分者信度及

評分誤差的控制一、評分誤差存在的嚴重性嚴重到什么程度?歷史教授的答案被評閱為“不及格”高考作文《一幅漫畫的啟示》,67位評閱者,6至25分都有,最高分與最低分相差19分1984年,高考作文評分調查,438位老師,4篇作文,。最高得分為41.25,最低分為20.75,標準差為2.98。1985年,對1984年的四篇作文再研究,347位老師(有部分年參加研究的老師),最高得分為42.5,最低分為24.75,標準差為3.3。第四節評分者信度及評分誤差控制二、評分者信度定義:多個評分者對同一批答卷評分結果的一致性程度。估計方法:①兩位評分者評同一批試卷;②三位或三位以上評分者評同一批試卷第四節評分者信度及評分誤差控制三、評分誤差產生的原因試題原因評分者原因專業知識水平不夠評判能力不夠個性傾向心理狀態客觀效應“名片”、“光環”、“對比”、“先后”環境、組織管理的原因第四節評分者信度及評分誤差控制四、控制評分誤差的方法控制試題作答反應方向與范圍預先制訂好評分細則閱卷人員要選擇、要培訓流水作業分因素評分組織復查要求評分者自覺防止各種客觀效應的影響大規模閱卷可考慮采用統計手段控制第四節評分者信度及評分誤差控制下次上課再見!提高信度的方法——適當增加測驗的長度為什么增加測驗的長度,會提高信度?測驗長度的增加與信度的提高不是等比例的提高信度的方法——適當增加測驗的長度增加測驗長度與信度提高之間關系的公式:例:有一包含10題的測驗,其信度系數為0.30,若把測驗增加到原測驗長度的3倍,那么新測驗的信度系數應該是多少?例:原測驗共10題,信度系數為0.30,如要把測驗信度系數提高到0.94,需要把原測驗延長多少倍?增加多少題?返回兩位評分者評同一批試卷的評分者信度例:甲、乙兩位教師評閱10份試卷,他們對每一試卷各自所評分數如下表,問這兩位教師評分的一致性如何?返回試卷得分D=甲-乙等級等級之差甲評分乙評分甲乙A94931110B9092-222.5-0.5C8692-63.52.51D8670163.573.5E8682-10541F7076-665.50.5G6865379-2H6676-1085.52.5I6468-4981J6160110100心理測量學

測量效度概述1測量工具效度驗證的方法2測量的系統誤差控制3心理測量學

測量效度概述1心理測量學測量效度概述

什么是效度測量工具測量了他所希望測量的心理特質或行為特征的效果和程度。效度總是與一定的測量目標相聯系的。我們稱為某測量工具進行效度驗證的過程為效度證據的獲取過程,簡稱為效度驗證。心理測量學測量效度概述效度與信度的關系信度研究的是測量結果的穩定性問題,效度研究的是測量結果的準確性問題。測量的信度只受到隨機誤差或非系統測量誤差的影響,而測量效度會同時受到隨機誤差和系統測量誤差的影響。一個測量工具可能是非常穩定(信度高),但卻是無效的,因為他與測量的目標之間產生了系統性的偏差;當然,一個完全不穩定的測量工具也不可能是有效的。心理測量學第三章測量效度與系統誤差控制測量工具效度驗證的方法2心理測量學測量工具效度驗證的方法根據測量目標的不同,對測量工具進行效度驗證的方法主要有三種:基于所測內容的效度驗證方法。基于所測心理結構的效度驗證方法。基于效標關聯性的效度驗證方法。心理測量學測量工具效度驗證的方法基于所測內容的效度驗證方法含義就是要對測量工具本身的具體內容進行系統性的查驗,以確定這些內容是不是測量目標特質或行為領域的一個有代表性的樣本。主要應用學業成就測驗、職業資格測驗,還如人員選拔與安置中的工作樣本測驗。心理測量學測量工具效度驗證的方法基于所測內容的效度驗證方法評估方法確定測量目標的全域范圍及各部分內容權重。確定一批有經驗的領域專家,在深入培訓的基礎上,要求他們按照已確定的測量全域范圍及各部分內容權重,初步分析測試題目的代表性,并對題目測量的被試作答的內部心理過程進行初步分析。進行實測,根據測試數據分析和被試作答過程分析,全面驗證測量工具的效度。心理測量學測量工具效度驗證的方法基于所測內容的效度驗證方法關于測量工具的表面效度嚴格來說,表面效度并不符合效度的定義,因為他反映的不是實際要測量的目標是什么,或對目標測量的程度如何,而反映的是,測量工具從表面上看測量了什么。表面效度關心的是測量的友好性和與公眾的和諧關系。心理測量學測量工具效度驗證的方法基于效標關聯性的效度驗證方法效標:它是獨立于測量工具并可以從實踐中獲得的被試的行為特征表現,用于驗證測量工具的有效性。根據測量工具與效標兩者結果獲得的時間間隔的不同,基于效標關聯性的效度證據采集可以有同時性設計與預測性設計兩種方法。心理測量學測量工具效度驗證的方法基于效標關聯性的效度驗證方法效度證據采集的預測性設計方法含義:驗證現有測量評價結果與將來才可能獲取的效標評價結果之間的關聯程度。主要應用:人員選拔、安置類型的測量工具心理測量學測量工具效度驗證的方法基于效標關聯性的效度驗證方法效度證據采集的預測性設計方法首先,獲取被試在當前測量工具上的評價結果,如測驗分數、等級評定;然后,間隔一定的時間,采集被試在預測目標(效標)上的評價結果;最后,分析以上這兩個評價結果之間的關聯性程度,這種關聯性程度的分析方法常用的有以下幾種:相關分析區分能力分析命中率分析心理測量學測量工具效度驗證的方法基于效標關聯性的效度驗證方法效度證據采集的同時性設計方法含義:對同時獲得的測量工具評價結果與效標評價結果之間的關聯性程度進行分析。主要應用經常用于評價測量工具診斷被試當前心理特質狀態的效果。在許多情形下,效度證據采集的同時性設計方法會替代預測性設計方法。評估方法心理測量學測量工具效度驗證的方法基于效標關聯性的效度驗證方法基于效標關聯性的效度驗證方法的影響因素群體的一致性或同質性程度:應該盡量擴大被試群體的異質性,避免低估測驗的真實效度。測驗長度:一般來說,測驗長度越長,測試結果越穩定,效度系數會傾向于越高。效標污染心理測量學測量工具效度驗證的方法基于效標關聯性的效度驗證方法估計標準誤指的是測量工具實際測量的結果與預先設定的測量目標之間相互偏離的程度,而效度驗證的過程就是要考察這種偏離程度的大小。從實際應用范圍及計算過程的便利性角度看,估計標準誤的實際應用更多的是基于效標關聯性的效度驗證方法中。心理測量學測量工具效度驗證的方法基于效標關聯性的效度驗證方法估計標準誤是表現為相關系數的效度系數;是效標評定分數的標準差。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法含義:對測量工具測量了心理學中某種特質或特質結構的程度進行驗證的方法。主要應用:各種心理測驗,如智力測驗、人格測驗、焦慮測驗、成就動機測驗等。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法專家判斷分析法主要依靠專家的主觀專業經驗。盡量減少專家主觀隨意性的影響。德爾菲法。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法測驗內部一致性分析法基于所測心理結構的效度驗證的一個重要證據來源。這個方法的實質是,測驗總分本身是用于評價所測心理結構的效度最好的效標。相關分析法:求取每個項目與測驗總分之間的相關系數,如果項目—測驗相關顯著,表明該項目與總測驗的結構是一致的。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法測驗內部一致性分析法對照組比較法:按照被試的測驗總分,選出一個高分組被試和一個低分組被試,然后,比較高分組被試與低分組被試在各個項目上的作答表現,如果高分組被試的通過比例顯著大于低分組被試的通過比例,表明該項目與總測驗的結構是一致的。心理測量學基于所測心理結構的效度驗證方法評估方法測驗內部一致性分析法很明顯,測驗內部一致性證據保證的是測驗結構的同質性或單一性。測驗內部一致性證據的作用是有限的,因為他畢竟無法證明該測驗究竟測量了什么結構。測量工具效度驗證的方法心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法與現有研究結論一致性的分析法通過分析新開發測量工具測試結果是否與已有研究結論相一致。在許多傳統智力測驗中,成長發展性變化證據是測驗效度的一個重要證據。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法評估方法與其他測量工具的相關分析法求取新開發測量工具與另一個已經被公認為有效的測量工具之間的相關關系,是證明新開發測量工具測量了相同內容結構的一個有效證據。求取新開發測量工具與另一個測量工具之間的相關關系,有時候也被用于證明該測量工具沒有受到其他無關心理因素的影響。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法因素分析法因素分析方法是基于所測心理結構的效度驗證方法中幾乎最為常用的一種方法,他很適合用于鑒別測量工具所測的心理特質結構。實際上,因素分析方法是一種分析觀察數據之間相關矩陣的統計分析技術。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法聚合與區分效度驗證分析法為了驗證測量工具所測的心理結構,我們不僅必須提供關于它與另外一個理論上應該存在高相關的測量工具之間存在高相關的實際證據,同時,也需要提供關于它與另外的無關變量之間不存在顯著相關的證據。多特質—多方法矩陣分析法心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法實驗介入分析法通過實驗的方法考察某些重要變量的介入是否對被試測量分數產生顯著影響。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法結構方程建模分析法除了鑒別測量的潛在結構之外,對這些潛在特質結構本身之間的關系以及它們之間的影響路徑進行考察,同樣是非常重要的。分析潛在特質結構之間的關系及其與效標變量之間的路徑,有利于我們更深入理解所測特質的作用機制。這種分析過程可以用結構方程建模的方式進行。心理測量學測量工具效度驗證的方法基于所測心理結構的效度驗證方法其他評估方法尋求當代認知心理學證據的分析方法基于信息加工理論的研究方法為我們深入理解人類問題解決的加工過程提供了更豐富的證據。認知加工模型讓我們了解完成某種認知任務的智能過程、這個過程的組織方式、涉及的知識內容、這些知識在記憶中的表征形式及其提取模式,這些研究無疑會讓我們對人類心理特質結構的認知更加深入。心理測量學第三章測量效度與系統誤差控制測量的系統誤差控制3心理測量學測量的系統誤差控制影響測量工具有效性的因素測量的心理特質本身的特點有些心理特質至今研究不夠深入,概念界定還不清晰。有些心理特質本身不太穩定。測量工具的建構過程建構過程應遵循嚴謹的態度才能建構出優良的測量工具,避免出現系統偏差。心理測量學測量的系統誤差控制影響測量工具有效性的因素測量工具本身的信度信度是效度的必要條件。效度驗證時的被試群體相同的一個測量工具,可能會因為測量對象特性的不同而測量到不同的心理特質結構。作為用相關系數表示的效度系數,希望參與效度驗證的被試群體越異質越好。心理測量學引子心理測量的工具是測驗,而題目則是構成測驗的基石,因此研究題目的性能及其編制至關重要,它直接影響測量工具(即測驗)的信度及效度,進而影響測量的準確性。在實際工作中,人們應如何來編制測驗題目?如何評價測驗題目質量的好差呢?本章將對這些問題做出回答。心理測量學測驗題目性能與題目編制測驗題目類型、功能與題目編制1測驗題目的難度與難度分布控制2測驗題目的區分度與區分度的提高3測驗題目的猜測度與猜測控制4選擇題的選項分析與選項修改5題目功能差異與測量偏差控制6

測驗題目的類型功能與編制

第一節心理測量學第一節一、測驗題目類型題目主要可分為客觀題和主觀題兩大類。客觀題一般有標準唯一的答案,被試的作答只有與標準答案完全一致才視為答對,否則視為答錯。主觀題無標準唯一答案,只有一個參考答案,被試的作答與參考答案相近或基本一致就可視為答對。心理測量學客觀題主要包括選擇題(含自陳式選擇題)、填空題、是非判斷題、匹配題、行為情景判斷題等。主觀題主要包括名詞解釋、簡

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論