心理測量課件 第6章 信度_第1頁
心理測量課件 第6章 信度_第2頁
心理測量課件 第6章 信度_第3頁
心理測量課件 第6章 信度_第4頁
心理測量課件 第6章 信度_第5頁
已閱讀5頁,還剩29頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

心理測量

第六章信度CONTENTS目錄信度的理論測量誤差的來源估計信度的方法影響信度系數的因素測量的標準誤差概化理論簡介123456PART01第一節信度的理論01第一節信度的理論一、信度的含義信度就是對測量一致性程度的估計。作為測驗的基本特點之一,信度相當重要。雖然一份測驗的最終目的是求得較高的效度,但是信度的高低對測驗性能的優劣依然影響很大。二、誤差心理測量所指的誤差就是指測量中與目的無關的變因所產生的不準確、不一致效應。誤差大致可分為抽樣誤差、系統誤差和測量誤差三種。第一節信度的理論(一)抽樣誤差

抽樣誤差即由抽樣變動而造成的誤差。(二)系統誤差

系統誤差是由與測驗目的無關的因子所引起的恒定、系統的、有規律的變化,存在于每次測量中,故又稱常定誤差。(三)測量誤差測量誤差是使用測量工具進行心理測量所造成的誤差,又稱觀察誤差、隨機誤差、偶然誤差。第一節信度的理論三、測量誤差和真分數理論(一)物理測量的測量誤差物理測量中的真實值在不少情況下是可以想辦法獲知的,這樣就可以直接計算誤差。而心理測量中的真實值,也就是真分數,通常是個體內在的心理特性或者是代表心理特性的行為,無法像物理測量那樣通過反復測量而獲取,也就不能直接得到誤差的大小。我們只能借助一些方法對其進行估計。這里,我們著重介紹經典的真分數理論,這是最常用的、也是最基本的信度理論模型。第一節信度的理論三、測量誤差和真分數理論(二)真分數理論1.真分數的定義真分數,即測量中不存在測量誤差時的真值或客觀值,操作定義就是無數次測量的平均值,通常用X∞或T表示。2.真分數理論的基本方程式

Xt=X∞+Xe(6.1)或X=T+E意即實測分數是真分數與誤差分數的函數,即實測分數Xt由X∞和Xe共同決定。3.真分數理論的三個基本假設其一,誤差分數的平均數是零。其二,誤差分數與真分數相互獨立,即相關為零。其三,兩次測量的誤差分數之間的相關為零。第一節信度的理論四、信度的數學定義(一)定義及表達式信度就是一組測驗分數中真分數方差與實測分數方差的比率。表達式為:rtt=r2t∞=S2∞S2t(6.3)這里,rtt就是信度,也稱作信度系數;rt∞則是信度指標,是真分數與實測分數的相關。r2t∞叫決定系數,是真分數與實測分數相關系數的平方,表示兩測量間共有的方差比率,標志著因變量能以自變量解釋的比例部分。心理測量實際上是無法直接測量到真分數和真分數方差的,所以對信度只能作估計。而上式提供了一個對信度估計的基礎,即求測量誤差方差,用它來估計信度。值得強調的是,信度是一組測驗之間的一致性,而非個人的分數的一致性。PART02第二節測量誤差的來源02一、測驗本身引起的測量誤差(一)測驗題目取樣不當(二)測驗題目格式不妥(三)測題的難度過高(四)測題或指導語用詞不當(五)測驗時限過短第二節測量誤差的來源二、測驗實施過程引起的測量誤差(一)物理環境施測現場的溫度不適,光線過暗,背景聲音(例如過于安靜或一直有噪音),桌椅不舒適,空間大小不當,通風不夠等諸多情況都會產生測量誤差。(二)主試方面主試的年齡、性別與施測要求不相符合,穿著不得體,施測時的言談舉止不符合施測要求,表情夸張或過分呆板,都會不同程度地影響被試的測試狀態乃至測驗分數。第二節測量誤差的來源(三)意外干擾測試途中突然停電、突發噪聲,或有人生病、作弊,或測驗用品臨時出問題(如計時表失靈,題目、作答卷紙印刷不清,或有裝訂錯誤)等不能預見的干擾都會產生測量誤差。二、測驗實施過程引起的測量誤差(四)評分不客觀,計算、登記分數出錯答題、論文題等自由反應型題目,評分標準難以客觀。尤其是測驗有多個評分者時,評分者的偏好往往各不相同,難以保證分數的一致性。第二節測量誤差的來源三、被試本身引起的測量誤差(一)應試動機的影響如果被試在兩次測試時的動機不一樣,會使被試的回答態度、注意力、持久性以及反應速度發生變化,就容易引起測量誤差。(二)測驗的焦慮測驗的焦慮與被試的能力、抱負水平以及測驗經驗有關,它對被試的興奮性水平、注意力和反應速度都有影響。過度的焦慮對活動有不良影響,從而產生測量誤差。因而主試在施測時應對測驗目的和測驗程序作出清楚的解釋,并適當地鼓勵被試,以緩解焦慮、穩定情緒。第二節測量誤差的來源三、被試本身引起的測量誤差(三)生理因素當被試在測試前失眠,或在生病、疲勞的狀態下進行測試,也容易引起測量誤差。(四)學習、發展和教育重復測驗中,如果有個別人在首次測驗后受到特殊訓練(學習),復本測驗中某些人在兩次測驗間受到特殊訓練,或教育學習量不同,均會造成測量誤差。第二節測量誤差的來源(五)測驗經驗被試對測驗的程序、內容材料的熟悉程度不同以及回答技巧的差異都會影響測量的一致性。所以在正式測驗之前,應有示范或例子、練習。PART03第三節估計信度的方法03一、重測信度(一)計算方法用同一種測驗,對同一組被試先后測量兩次,然后計算這兩次測驗分數的相關。整個過程簡示如下。圖式測驗一段時距再測驗這里,“一段時距”可以為幾分鐘,也可以長達幾年,依實際研究需要和測驗性質而定。同時需要盡可能保證兩次測驗的被試狀態和測試條件相同。(二)重測信度的誤差來源測驗本身:測驗所測的特性本身就不穩定,例如情緒,使得測量的隨機性更大。被試方面:在兩次測量間隔的時間里,身心成熟、知識的發展并非人人等量增長,在練習因素、記憶效果等方面也存在個體差異,這些因素可能會使得不同個體在兩次測量結果上有不一致的變化。偶發因素的干擾:如主試計時錯誤,個體突發疾病,或動機變化等。第三節估計信度的方法二、復本信度(一)計算方法先實施該測驗的復份A(第一型),然后在最短時距內實施復份B(第二型),再求兩次測驗分數的相關系數。(二)復本信度的誤差來源

復本信度的誤差來源主要是測驗兩種形式是否等值:測題取樣是否匹配,格式是否相同,內容、題數、難度、平均數、標準差是否一致。再就是被試方面的情緒波動、動機變化等,以及測驗情境的變化,偶發因素的干擾。這些都會引起測量誤差。第三節估計信度的方法三、內在一致性信度當測驗既無復本,也不可能重復測量時,我們常用內在一致性系數來估計測驗的信度。該系數反映的是測驗內部的一致性,即項目同質性。(一)分半法分半法通常先把一份測驗按題目的奇偶順序或其他方法分成兩個盡可能平行的半份測驗,然后計算兩半之間的相關,即得到分半信度系數。第三節估計信度的方法(二)基于項目協方差的方法

把測驗劃分成兩半的方法實際上有多種,除了奇偶法以外,還有隨機安置法、內容匹配法、難度排序奇偶法等。而每一種劃分方法產生的rtt估計值都有差別,因此用分半法得到的信度估計值不具備唯一性。所以庫德(Kuder)、理查遜(Richardson)針對分半法的不足,提出以項目統計量為轉移,利用每道測題的方差或協方差來計算信度。四、評分者信度

評分者信度是由多個評分者給一組測驗結果評分,所得各個分數之間的一致性。有些情況下,被試的得分會受到評分者的主觀判斷的影響,不同的評分人員對相同被試的評分存在著差異。典型的例子有心理測量中的投射測驗、學業測驗中的高考作文水平的測試、職業選拔中的面試,這時就有必要考慮評分者之間的一致性了。第三節估計信度的方法PART04第四節影響信度系數的因素04一、分數分布范圍的影響(一)分數分布范圍越寬,信度系數就越高(二)馬格魯森公式

由信度系數的推導公式rtt=1-S2eS2t可得S2e=S2t(1-rtt)在同一個全域里,一個測驗應用于有代表性的兩個群體,這個時候,我們可以假定這兩個不同差異范圍的測量誤差的標準差,也就是測量標準誤差是相等的。那么,就可以根據其中一個群體的信度系數、分數分布的標準差與另一個群體的分數分布的標準差,利用S2e=S2t(1-rtt)來估計另一個群體的信度系數。

分布標準差實質上也就是分數分布的范圍對信度系數的影響。所以,我們在編制測驗量表、抽選被試時,往往要考慮選取不同層次的被試,以使得測驗團體呈異質性,從而使得信度提高。反之,當需要同質團體的信度時,就應該盡量選取同一層次的被試。第四節影響信度系數的因素二、測驗長度的影響

前面介紹分半信度時,曾提及分半信度系數低估了原長測驗的信度,這是因為其他條件不變時,測驗長度越長,即題目越多,信度就越高,測驗長度增加,信度就隨之提高。第四節影響信度系數的因素三、測驗難度的影響

測驗難度對信度估計的影響不能像測驗的分數分布范圍和長度那樣,可以用公式直接反映出來。但是,如果測驗對某個測試團體而言太難,被試對許多題目就只能作隨機反應,即猜測,這時,測驗分數的差別就主要取決于隨機分布的測量誤差,信度系數當然就很低,趨近于零。相反,如果測驗太容易,被試對許多測題的反應都為正確,那么測驗分數就相當接近,分數分布范圍隨之變得狹窄,同樣會使得信n度降低。這就表明,要使信度達到最高,測驗應該有一個適當的難度水平,以產生最廣的分數分布。PART05第五節測量的標準誤差05一、測量的標準誤差(一)定義及由來

測量的標準誤差,就是測量誤差分布的標準差,表示測量誤差的大小,用Se表示,又稱標準誤。

真分數理論的信度反映的是一組被試測量結果的一致性程度,測量的標準誤反映的也是一組被試測量結果的情況。測量的標準誤可以用來估計個人的真分數。(二)計算公式

Se=St1-rtt由rtt=1-S2eS2t推導而來。這樣,就可以根據測驗實測分數的標準差和測驗的信度,計算測量的標準誤差,進而估計個人的真分數及誤差。第五節測量的標準誤差一、測量的標準誤差(三)用測量的標準誤差估計真分數

統計學里Z檢驗的基本公式為Z=X-μσ,并可以用Z,σ和X來估計μ。這里,測量的標準誤差是測量誤差分布的標準差,用常態分布標準分的數學模型Z=X-μσ來處理,這時,可以表達成Z=Xt-X∞Se,同樣可以用Z,Se和Xt來估計真分數X∞。(四)判斷差異分數的顯著性在運用測驗進行研究、評估或者臨床診斷時,研究者可能會對被試接受一段時間的訓練或者學習前后是否存在知識、技能、智力等認知因素的改變,或者態度、情緒上的變化感興趣,也有可能關注同一套測驗中的不同分測驗分數的差異(比如言語分數和操作分數),希望判斷這些測驗分數的差異是否能夠說明被試在某些心理特性或者認知的發展方面有差別。這時,就可以利用測量的標準誤差來判斷差異分數是否具有足夠的顯著性。第五節測量的標準誤差二、直接估計標準誤差

用公式Se=St1-rtt求Se是一種間接計算方法,它是從理論出發,以假定真分數已知為前提。在實際問題中,也可以直接根據分數誤差的方差來求Se。第五節測量的標準誤差PART06第六節概化理論簡介06一、GT的基本原理和概念

GT把測量者希望測量的那些實體稱為測量目標(objectofmeasurement),在心理與教育測量中通常是人的能力、成就等特性。對測量目標的測量都是在特定的測量條件下進行的。GT用側面(facet)這一概念來表示一組特定的測量條件,并稱條件的數量為該側面的水平(level)。整個任務涉及概化研究(generalizabilitystudy,簡稱G研究)和決策研究(decisionstudy,簡稱D研究)。GT為評價D研究不同設計方案的效果提供了兩個誤差指標:用于相對決策的相對誤差方差和用于絕對決策的絕對誤差方差。第六節概化理論簡介一、GT的基本原理和概念

側面有隨機(random)和固定(fixed)之分。如果一個側面代表的是概化全域更為廣闊的一組條件,樣本所包含的條件是從全域中隨機抽取出來的,樣本容量比全域要小得多,或者容量相同的樣本之間可以互換,這個側面就是隨機側面。如果一個側面是指概化全域和實際觀察擁有相同的一組條件,或者說側面條件窮盡了全域所有的條件,這個側面就是固定側面。當測量條件有多個側面時,兩個側面可以相互交叉(crossed),也可以一個側面嵌套于(nested)另一個側面。如果一個側面的每一個條件都和另一個側面的每一個條件結合起來出現,那么這兩個側面就是交叉的。在假設G研究和D研究的測量條件來自同一個全域的基礎上,整個GT的研究過程就是:根據D研究可能的設計方案進行G研究,包括設定可接受的觀察全域、進行方差分析等步驟,然后進行D研究,運用G研究提供的方差分析結果估計各種可能的設計方案相應的誤差方差和G系數或Φ系數,最后結合實際情況選擇一個最適宜的D研究設計方案。第六節概化理論簡介二、單側面隨機設計根據測量側面與被試的交叉或嵌套關系,單側面設計可以分為交叉設計和嵌套設計兩大類。當每個被試面對相同的測量條件時,就稱測量側面與被試交叉(crossedwithexaminees),記作p×i,p指被試,i指測量條件。當每個被試面對不同的測量條件時,就稱測量側面嵌套于被試(nestedinexaminees)記作i∶p。以只有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論