




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
心理測量
第七章效度CONTENTS目錄概述內容效度和結構效度效標效度影響效度的因素效度的應用12345附錄效度的統計檢驗方法——因素分析PART01第一節概述01第一節概述一、效度所要回答的問題效度的基本問題是什么呢?任何測驗都有它所要測量的目標,偏離這個測量目標,測驗則無效。例如,在一項英語成就測驗中,教師本來打算考查學生的語法知識,但是,大量的測驗題目是關于動詞短語的,因此造成了這樣一個系統誤差。也許前后兩次測量結果的一致性很高,但這項測驗并沒有真正測量到學生掌握語法知識的程度,所以,該測驗是低效的。另一方面,如果這個測驗有效,那么它對于所測量的東西又能測量到什么程度呢?這兩個問題是信度所不能研究的,它們就是測驗效度的基本問題:一是測驗測量的是什么東西?或者說,測驗測到了它要測的東西嗎?二是測驗對它所測量的東西能測量到什么程度?效度(Validity)即有效性,是測量的有效性程度,是測量工具能測出其所要測量特質的程度,或者簡單地說,是指一個測驗的準確性、有用性。第一節概述二、效度的含義(一)效度的含義
效度就是一個測驗對其所要測量的特性測量到什么程度的估計(效度的操作定義)。(一)效度的含義效度是針對測驗結果的2.效度是針對某種特定的測驗目的的3.效度具有連續性第一節概述三、效度的種類(一)內容效度
內容效度(contentvalidity)就是測驗用的測題對整個測驗內容范圍的代表性程度。成就測驗特別要注意內容效度。(一)內容效度在心理學中有許多假設性地構建出來的結構,比如說智力、內向—外向等,它們都是科學想象的產物,是用來對某些可直接觀測的行為加以分類和描述的觀念。心理結構是不能直接觀測到的,就比如智力的測量,不同的測驗編制者要根據一定的理論來編制智力測驗。編制出來的測驗是否真正體現了最初所依據的理論結構,以及體現該理論結構的程度就是該測驗的結構效度。第一節概述三、效度的種類(三)效標效度效標效度(criterionrelatedvalidity)也稱經驗效度或統計效度,曾譯為準則關聯效度,用測驗分數和效標分數之間的相關系數rXY來表示,它實質上是指測驗分數對某一行為表現的預測能力的高低。根據獲取校標資料時間的不同,效標效度又可分為同時效度和預測效度。第一節概述四、效度與信度的關系(一)高信度是高效度的必要條件,而不是充分條件高信度并不一定能保證高效度(高信度≠高效度),但如果測驗具有高效度,就可以肯定它具有高信度(高效度=高信度),所以說信度高是效度高的必要條件,而不是充分條件。(二)信度系數的平方根是效度系數的最高限度測驗的效標效度與測驗本身的信度和效標測量的信度有關,如果這兩個信度低,則效度系數就會降低,從而低估了測驗的真實效度,這時要對效度系數進行矯正。PART02第二節內容效度和結構效度02一、內容效度(一)含義
效度研究的目的是要評估測題是否充分代表了所要測量的內容范圍,即測驗題目對有關內容或行為范圍取樣的適當性,它所關注的是測驗的內容方面。(二)驗證和提高內容效度的方法
專家評定是一種確定內容效度的典型程序,它要求一組獨立的專家(他們不是測驗的編制者,但都非常熟悉所測量的內容領域)判斷測驗題目對所研究的領域的取樣是否具有代表性,通過這些評定資料來確定一個測驗的內容效度。確定測驗的內容效度是效度驗證過程中的事情。在測驗編制之前要做的第一步便是盡可能明確而詳盡地規定應測量的領域,編寫出雙向細目表。在評估內容效度時,還必須考慮到國家、種族、性別差異等因素是否與內容效度的判定有關。第二節內容效度和結構效度一、內容效度(三)表面效度在講內容效度時,必須區分內容效度和表面效度。表面效度是指測驗使用者或被試的主觀認識上覺得有效的程度。顧名思義,表面效度就是一個測驗在使用者或被試看來,直覺地被認為它在測量什么,是否測到了測驗所要測量的東西。這種認識是主觀的。嚴格來說,表面效度不算是效度,它只是表面上的東西。第二節內容效度和結構效度二、結構效度(一)定義如前所述,結構效度是測驗能說明心理學上的理論結構或特質的程度,或用心理學上某種結構或特質來解釋測驗分數的恰當程度。其中,結構(construct)是指用來解釋人類行為的理論框架或心理特質,它是心理學中抽象的假設性的概念、特性或變量。(二)驗證結構效度的方法
結構效度的驗證就是要考查一個測驗測量到其所擬測量的結構與特質的程度。與內容效度的驗證不同,結構效度的驗證首先要求對所研究結構或特質進行界定(建立理論框架),說明該結構或特質的心理學意義,它與其他結構或特質之間的關系;再依據理論框架,提出各種可能的有關的假設;然后檢驗假設是否成立。第二節內容效度和結構效度二、結構效度(三)搜集結構效度資料的方法
1.測驗內方法這種方法主要是通過研究測驗內部構造(如測驗的內容、對測題反應的過程,以及項目間或分測驗間的關系)來分析測驗的結構效度。它主要包括內容效度、被試解答測題時的反應過程和測驗的同質性三個方面。(1)內容效度。(2)被試解答測題時的反應過程。(3)測驗的同質性。2.測驗間方法這一方法的特點是同時考慮幾個測驗間的相互關聯,考查這些測驗是否在測量同一心理結構。測驗間方法有多種,如相容效度、會聚效度、區分效度及因素分析第二節內容效度和結構效度二、結構效度3.不同類型信度的特點測驗可以具有多種類型的信度,由于測驗所測的特質或結構不同,這些信度的取值也應表現出不同的特點。4.效標效度的研究在本章第一節中介紹了效標效度,它反映了測驗對效標的預測力的高低。既然測驗能夠預測效標,那么效標的性質和種類也就可以作為測驗所欲測量的結構的指標。5.發展水平的變化許多智力量表的效度驗證都使用了智力的年齡差異這一特點。6.實驗操作有些測驗(如成就測驗)很容易受到特殊訓練的影響,而另一些測驗(如智力測驗)得分則不易受特殊訓練的影響。根據不同測驗具有不同的特性,可以預期經過某種實驗處理之后將會發生哪些變化,以此推測測量某個心理結構的測驗的結構效度。第二節內容效度和結構效度PART03第三節效標效度03一、效標(一)效標的含義
效標效度的實質是要檢驗測驗分數與準則(標準)之間的相關和一致性,也即利用測驗分數來推斷效標的取值能夠有多準確。(二)效標的測量效標要為效度的驗證提供參考標準,其確定與測量必須科學,才能為效度的驗證指引正確的方向。除了對效標下操作定義外,效標還必須具有如下幾個特點。第一,效標應能代表理論上測驗有效性的主要方面,跟所研究的問題真正相關。第二,效標測量與效標要有較高的相關性。第三,效標測量必須測量誤差小,具有高信度。第三節效標效度二、效標效度的估計方法(一)效度系數1.積矩相關系數當預測分和效標分都是連續變量時,可采用積矩相關系數的計算方法來求得測驗的效度系數。2.二列相關系數計算效度系數還有一種方法是二列相關的方法。第三節效標效度(二)組的分類1.基本思想如果根據被試在效標上的行為表現,將他們分為不同的組別,那么,這些組在預測分數上也應該有顯著性差異。如果這些顯著性差異確實存在,那么,就說這個預測的效度是較高的。二、效標效度的估計方法2.重疊量的計算
運用“組的分類”方法表示效度,要檢驗平均數之間的差異,就要用到均數之差的標準差,而均數的標準誤SX=SXn,因此,它與樣組容量的平方根成反比。均數之差的標準差也存在這種關系,那么,當樣組規模n很大時,SX保持不變,則n越大,均數之差的標準誤越小,這樣就使得t值增大,增加了拒絕虛無假設的機會,這就意味著作出“兩組具有顯著性差異”這一結論的可能性提高了。也就是說,組間平均數差異在統計上的顯著性取決于團體的大小,當參加測驗的人數增加,則平均數之間的差異即使比較小,但在統計上也將會變得顯著。要避免這一缺點,可以求出這兩個分布的重疊量。第三節效標效度三、對效標效度、內容效度和結構效度的幾點總結
第一,效度問題的研究基本上是兩個問題:一是測量什么東西,即測驗所測量的變量的性質是什么?二是測驗對它所測量的東西達到何種程度,并在幫助取舍決定上效果如何(這一點將在本章第五節中加以介紹)?
第二,任何一個測驗都需要各式各樣的效度證據,關鍵在于效度是由一定的測驗目的規定的,不同測驗偏重于不同種類的測驗效度。
第三,效度的驗證通常是測驗編制好之后進行的工作,但效度的基本指導思想在測驗編制過程中始終起著主導作用。第三節效標效度PART04第四節影響效度的因素04一、測驗本身的因素(一)測題中所用詞匯和句型應簡單易懂
測題中的詞匯和句型應適于被試的文化水平。(二)測題的意思應表述清楚
題意含糊,容易產生歧義,以致被試產生誤解,也會降低測驗的效度。(三)所編制的測題應該適合所要測量的學習結果如果所要測量的是數學推理能力,但測題卻是過去做過的練習,則所測量到的是記憶力而不是數學推理能力,這就降低了測驗的效度。(四)測題中不能提供額外線索若測題為被試提供了額外線索,就無法確認測題是否真正測量到了所欲測量的學習結果。第四節影響效度的因素一、測驗本身的因素(五)測題的編制要合理一般地,測題以由易到難的順序排列。(六)選擇題的正確答案不能有明顯的組型如果測驗正確答案的位置有明顯的規律,學生有可能因發現規律而答對一些原本較難的題目,從而影響測驗結果的效度。(七)測題數目增加測題的數目(即增加測驗長度)通常可以提高測驗的信度,而效度系數的最大值是信度系數的平方根(即信度指數),因此,增加測題數目也能提高測驗的效度。(八)測題的難度要適當1.常模參照測驗。2.標準參照測驗第四節影響效度的因素二、測驗實施和計分方面測驗情境,如場地的布置、材料的準備等都會影響到測驗的效度。此外,在實施測驗的過程中,是否遵照測驗使用手冊的各項規定進行標準化的施測,指導語是否已將答題方式說明清楚,是否按要求進行時間限制等,也會影響到測驗的效度。如果沒有按照標準化的程序進行施測和客觀地評分,就必然會使測驗效度降低。第四節影響效度的因素三、被試的主觀方面被試的興趣、動機、情緒、態度和身體健康狀況以及是否充分合作與盡力而為等,都會影響到測驗結果的可靠性和正確性,即效度和信度。四、進行效度化所依據的有關效標效標效度是用測驗分數與效標間的相關表示的。五、樣組方面(一)樣本的代表性測驗是針對某一特定團體而言的,也即確認效度時所依據的樣組,必須確實能夠代表所要測量的對象。(二)樣本規模樣本的規模越大,測量誤差就越小。因為測量誤差隨樣本規模的增加有相互抵消的趨勢,從而使信度得以增大。信度又是效度的必要條件,所以,信度的增加對效度的提高也有影響。(三)樣本的異質性如果一個團體的測驗分數完全相同,即樣本具有同質性,則這個團體測驗分數與效標分數的相關為0,也就是效度系數為0。因此,如果其他條件相等,樣組分數全距越大,則效度系數越高。第四節影響效度的因素PART05第五節效度的應用05一、效標分數的預測及預測誤差(一)效標分數的預測大家在統計學中學過回歸方程:Y∧=a+bX。當預測變量與效標變量之間呈線性關系時,也就可以用最小二乘法原理對它們間的關系進行估計(二)預測誤差
效度系數是以測驗分數和效標分數之間的相關系數來表示的,這就意味著,效度系數(相關系數)的平方表示由測驗分數所能說明的效標測量方差的比例,即效標分數中由測驗分數造成的變異數的百分比。根據測驗分數對效標得分進行預測總會存在一定的誤差,不可能預測得完全準確。這個誤差分布的標準差就稱為預測誤差。第五節效度的應用二、效度與人才選拔(一)基本概念1.基礎率在總體中自然存在著的合格人員的比例叫作基礎率。2.錄取率錄取率指采用測驗作為篩選工具時所錄取人員的比例。
第五節效度的應用(二)各比率值之間的關系第一,截點分數越高,正命中率也越高,但錄取率卻低。第二,隨著錄取率的增加,取舍正確率先增后減。
第三,截點分數的中間范圍內取舍正確性比率最高。
附錄效度的統計檢驗方法——因素分析一、因素分析方法的研究簡史
1904年,英國心理學家斯皮爾曼發表了專題論文《客觀決定和測量一般智力》(GeneralIntelligence,ObjectivelyDeterminedandMeasured),用因素分析的技術研究智力結構,并提出智力的兩因素論,這也標志著因素分析方法的誕生。繼斯皮爾曼之后,心理學家們進行了大量研究,采用因素分析的技術來探索智力結構的問題。
20世紀60年代后期,統計學家波克(R.D.Bock)、巴格曼(R.Bargmann)及喬納斯柯格(K.G.Jreskog)在研究因素分析模型中參數的假設檢驗問題時,發展出驗證性因素分析的方法。附錄效度的統計檢驗方法——因素分析二、因素分析簡介(一)基本概念
因素負荷指某一測驗(或變量)與某一因素的相關。因素負荷越大,測驗(或變量)與因素的相關越高。因此,因素負荷的平方相當于決定系數,也即該因素對某一測驗(或變量)的方差貢獻大小。各分測驗與兩個因素的相關值這一部分則稱作因素負荷矩陣。(二)因素負荷矩陣的轉換因素分析的過
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 肝硬化貧血護理查房
- 老年人尿失禁護理措施
- 2024湖北省宜都市職業教育中心工作人員招聘考試及答案
- 品牌推廣合作合同協議書
- 車輛掛靠運營合作協議合同
- 電商廣告推廣服務合同范本
- 國際物流模擬考試題+答案
- 辦公大樓裝修合同
- 編導創業團隊介紹
- 水電工程環境治理- 合同責任與義務
- 呼吸系統疾病的護理研究進展與實際應用
- 鹽酸丙卡特羅吸入溶液-藥品臨床應用解讀
- DLT827-2002 燈泡貫流式水輪發電機組起動試驗規程
- 青少版新概念英語1B-期末測試題(打印1)
- 房屋租賃合同模板(10篇)
- 鏟車安全駕駛和保養操作規程
- 國開土地利用規劃形考任務1-4答案
- 崗位價值評估表
- 煤礦職業危害預防和控制課件
- 遵義會議與遵義會議精神簡化版教學課件
- 轉基因食品及PCR檢測轉基因食品
評論
0/150
提交評論