




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
心理測量
第五章學業成就測驗CONTENTS目錄學業成就測驗概述綜合學業成就測驗單科學業成就測驗標準化成就測驗的現狀和發展趨勢1234PART01第一節學業成就測驗概述01第一節學業成就測驗概述一、成就測驗的起源、含義和種類成就測驗一詞最早可能出現于20世紀20年代。1923年,美國斯坦福大學的推孟及其同事首次編制并出版了具有標準化測驗特征的斯坦福成就測驗(Stanfordachievementtest,簡稱SAT),適用對象是一到九年級的學生,測試內容有閱讀、聽力、拼寫,數學,科學,社會科學和環境等不同學科(Robert,2007;John&James,1998)。隨著SAT的廣泛應用,其影響力隨之擴大,成就測驗一詞也很快深入人心,并廣為接受。到今天,盡管學界關于成就測驗的描述不盡相同,但普遍認為成就測驗是針對知識和技能的測驗。可以認為成就測驗是測量學生或者受試者對某學科或某組學科,或者經過學習或者訓練之后所獲得的知識和技能的測驗。其類別分為教育成就測驗和職業成就測驗。第一節學業成就測驗概述二、成就測驗與教育測驗教育測驗特征是以學業成績為主要測量目標,依科目的不同可分為閱讀測驗、算術測驗、史地測驗等(陳選善,1947)至于成就測驗與教育測驗的關系,可以認為,成就測驗一詞最初是心理和教育測量學家對教育測驗的另一詮釋,主要是為了與智力測驗等能力及傾向測驗相區別。早期的成就測驗主要以學科知識和技能為測量內容,故成就測驗在測量界一度就是教育測驗的代名詞。隨著成就測驗應用領域的擴展,成就測驗至少可以分成教育成就測驗和職業成就測驗兩大類;同時由于更多類型的測驗,比如能力、能力傾向、態度等測驗應用于教育背景,教育測驗的范圍亦大大擴展,成就測驗與教育測驗不再完全重合,而是彼此區別又相互交融,其交融的部分就是教育成就測驗或者學業成就測驗(academicachievementtest)。第一節學業成就測驗概述三、標準化成就測驗(一)標準化成就測驗的意義、分類和功用1.標準化成就測驗的意義所謂標準化成就測驗(standardizedachievementtest),就是通常由編制測驗的專業人員根據測驗原理和具體的教學目標編制而成,旨在測量受測者學習某學科或某組學科之后,或者參加訓練后所獲得的知識和技能,為評價教育目標實現的程度、衡量學生學習的狀況提供依據的測驗(John&James,1998)。第一節學業成就測驗概述三、標準化成就測驗2.標準化成就測驗的分類(1)根據內容所涉及學科的多少可以把標準化成就測驗分成單科成就測驗和綜合成就測驗。(2)根據內容是否具有特殊性和縝密性分為診斷性成就測驗和非診斷性成就測驗。(3)根據同時參加測驗的受測人員的多寡把標準化成就測驗分為個別測驗和團體測驗。(4)根據測驗結果解釋的參照的不同,成就測驗還可以分為常模參照成就測驗和標準參照成就測驗。第一節學業成就測驗概述三、標準化成就測驗3.標準化成就測驗的功用根據薩爾維亞(JohnSalvia)和耶塞爾代克(JamesE.Yesseldyke,1998)的觀點,標準化成就測驗的功能大致如下。(1)篩選和鑒定。這可能是大多數成就測驗的主要目的。(2)診斷。經過篩選測驗鑒別出來的學生,需要用診斷測驗進一步評價,以確定個體具體所需的教育干預措施。(3)權利判定(entitlementdecision)。(4)進展評估。即對照國家標準來評估不同年級水平的學生所取得學業進展的程度。第一節學業成就測驗概述三、標準化成就測驗(二)標準化成就測驗與能力測驗的區別與聯系1.區別一般認為,成就測驗與能力測驗(包括能力傾向測驗和智力測驗在內)的主要區別在于測量內容所依據的經驗有所不同。2.聯系一方面,成就和能力這兩個構念本身并非完全獨立,而是彼此聯系,相互影響。另一方面,成就測驗和能力測驗歸根到底測量的都是個體的行為表現,多多少少都要受到已有的學習和生活經驗的影響。PART02第二節綜合學業成就測驗02一、斯坦福成就測驗系列(一)分測驗簡介音和字母(soundsandletters),單詞學習技能(wordsstudyskills),單詞閱讀(wordreading),句子閱讀(sentencereading),閱讀詞匯(readingvocabulary),閱讀理解(readingcomprehension),聽力理解(listeningcomprehension),語言(language),學習技能(studyskills),拼寫(spelling),數學(mathematics),科學(science),社會科學(socialscience),環境(environment)第二節綜合學業成就測驗(二)測驗分數和解釋整個測驗系列提供了多種轉換分數:九級記分,年級當量,百分位數,以及各種標準分數。一、斯坦福成就測驗系列(三)常模、信度和效度1.常模1995年,斯坦福成就測驗系列同時制定了秋季和春季常模。根據多個變量(地區、社會經濟地位,社區性質(城市或農村),公立還是私立)來選擇樣本。約250000個學生參加了測驗系列的標準化工作。2.信度提供SESAT、SAT、TASK每個水平的KR20,KR21內在一致性系數和復本系數。3.
效度內容效度:題目經過學科專家組審核,保證了內容準確度;題目經過測量專家的檢驗和修訂,編者再次對題目表達的清晰度做了檢查。經驗效度:題目的難度隨年級水平的提高而增加;與系列測驗的第8版具有中度到高度的相關;與斯坦福各分測驗存在交互相關。第二節綜合學業成就測驗二、加利福尼亞成就測驗(一)CAT/5的組成全套測驗由三大領域組成:閱讀/語言文科(reading/languagearts)、數學(mathematics)和補充內容(supplementarycontentarea)。(二)分數、常模和信效度1.三套分數:CAT/5能提供常模參照分數、標準參照分數和預期分數。2.三套常模:CAT/5測驗在1991年的1月(冬季)、4月(春季)和10月(秋季)進行了三次標準化,相應提供冬季、春季和秋季三套常模。3.信度和效度信度:提供了每個分測驗的KR21內在一致性估計值。
效度:作者努力加強了內容效度,并在編制題目時盡量排除了文化偏差;描述了隨著年齡的增加,學生掌握的目標也隨之提高;匯報了測驗與其他測驗的相關。第二節綜合學業成就測驗三、河畔2000評價系列(一)衣阿華基礎技能測驗(ITBS)
ITBS誕生于1935年,是最早為每個年級提供測驗水平信息的成套成就測驗,由美國衣阿華大學的林奎斯特(E.F.Lindquist)教授與其同事編制而成。1996年版由胡佛(Hoover)、耶羅尼米斯(Hieronymus)、福瑞斯比(Frisbie)和鄧巴(Dunbar)編制。該測驗的目的在于提供學生個體是否具備學校學科學習基本技能的信息,用以制定班級普通教學指導計劃、個人指導計劃、監控個體進程、課程評估以及為家長提供報告。ITBS有三種形式:K和L(1994出版),M(1996出版)。M是K和L的最新常模版。第二節綜合學業成就測驗三、河畔2000評價系列(二)成就和熟練度測驗(TAP)
成就和熟練度測驗(TAP)最早于1992年推出,1995年更新了常模,包括成套完整測驗和成套調查測驗。成套完整測驗的施測時間需要4小時,成套調查測驗只需要1小時40分鐘。TAP有5個目的:鑒別學生個體和班級在技能發展上的優勢和弱點;監控學生的進展;決定學生應該選學哪些初中課程;為向家長匯報提供基礎;項目和課程評估。第二節綜合學業成就測驗(三)衣阿華教育發展測驗(ITED)
ITED由費爾特(Feldt)、福賽斯(Forsyth)、安斯利(Ansley)和阿爾諾(Alnot)于1996編制,屬于常模參照和標準參照測驗。包括兩種格式:成套完整測驗和成套調查測驗。完整成套測驗需要3小時55分鐘。ITED主要有3個目的:評價學生完成中等(secondary)教育主要目標的能力;監控學生的進程;評估課程/方案。成套完整測驗的各分測驗簡介如下。三、河畔2000評價系列(四)河畔2000評價系列的分數、常模和信、效度三套測驗提供6種分數:原始分,發展標準分數,年級當量,全美百分位等級,全美標準九,全美曲線當量。
常模方面,河畔2000評價系列于1992年進行了標準化,精心抽取了全美170000名學生,1996年更新了常模。信度和效度方面,河畔2000評價系列只報告了內在一致性信度。第二節綜合學業成就測驗四、大城市成就測驗(一)分測驗單詞識別(wordrecognition),閱讀詞匯(readingvocabulary)閱讀理解(readingcomprehension),前閱讀(prereading),數學(mathematics),語言(language)寫作前的構思/作文/編輯(prewriting/composing/editing),概念和問題解決(conceptsandproblemsolving),程序(procedures),科學,社會研究,研究技能/思考技能(researchskills/thinkingskills)(二)分數可以得到各分測驗的原始分數和數種導出分數。導出分數包括量表分數,百分等級,年級當量,常態曲線當量,閱讀功能水平,內容分組成績類別,熟練能力確認(,以及對學術潛能測驗和美國大學測驗成績范圍的預期。第二節綜合學業成就測驗四、大城市成就測驗(三)常模、信度和效度常模:MAT7在1992年春季和秋季進行了標準化。春季標準化包括300個學校的100000學生,秋季標準化則有79000名學生。根據地區、社會經濟狀態(socioeconomicstatus,簡稱SES)、社區類別(城市或農村)和種族特點進行統計加權抽樣。信度:提供了復本信度和KR20.、KR21等信度證據,大多數的信度系數都超過了0.8。說明測驗足以用來進行團體報告和篩選,但研究者認為不適合用來做個體決策。效度:在編制測驗時,作者在加強內容效度方面做了一些工作,包括參考學校課程、邀請不同種族的人修改題目;結構效度提供了測驗(分數)在跨等級/水平上出現了增長的趨勢,測題能區分出不同的年級水平。第二節綜合學業成就測驗PART03第三節單科學業成就測驗03一、伍德科克掌握閱讀測驗(一)測驗組成
WRMTR有6個分測驗,包括視覺聽覺學習、字母辨認,詞語辨認、拼讀單詞、詞語理解、段落理解。(二)分數、常模和信效度
WRMTR提供三種精確性不同的解釋,解釋信息分為四種水平,共計9種導出分數。其中,四種水平的信息包括:分析被試錯答的每一個題目;描述被試的年級當量和年齡當量;通過相對表現指數、差異分數等描述學生表現的特點和質量;匯報學生在團體中的百分等級或標準分數。導出分數有的很復雜,比如由拉希標度得來的W分數,也有簡單的原始分數,以及相對表現指數、教學區間、年齡當量、年級當量、百分等級和標準分數等。第三節單科學業成就測驗二、斯坦福閱讀診斷測驗(一)測驗組成
語音分析(phoneticanalysis):考查學生字母和詞段與用元音和輔音聯系起來的技能。
詞匯(vocabulary):測量聽詞匯、辨別同義詞和詞語歸類的技能。理解(comprehension):從初步理解、解釋、批判性分析、閱讀技巧四個方面來測量理解。快速查閱(scanning):測量學生快速閱讀課文、獲取重要信息的技能。此外,SDRT4還提供三套非正式的測評工具:一份閱讀策略調查,一份閱讀態度、興趣等方面的問卷和一份故事復述量表。第三節單科學業成就測驗二、斯坦福閱讀診斷測驗(二)分數、常模和信效度同時提供常模參照和標準參照兩種結果解釋。根據測驗使用的目的,SDRT4可提供6種分數:各分測驗的原始分數、進步指標、百分等級、標準九、年級當量以及量表分。
常模樣組的建立采用了分層隨機抽樣技術,考慮了社會經濟地位、城市性、種族和地理區域等,于1994年秋季到1995年春季進行了標準化,共計400個學校參與,標準化樣組包含60000名學生。信度方面,SDRT4各個水平測驗(包括部分水平的平行形式)幾乎均超過了0.8,有一個測驗的內在一致性系數為0.79,平行測驗之間的穩定等值系數在0.62到0.88之間。效度方面,提供了內容效度和準則關聯效度證據。第三節單科學業成就測驗三、關鍵數學測驗修訂版(一)測驗組成
KeyMathR把整個數學表現分為基礎概念、運算和應用三個部分。基礎概念部分包括計數,有理數和幾何等三個分測驗。運算部分包括加法、減法、乘法、除法、心算等五個分測驗。應用部分包括測量、時間和金錢、估計、數據解釋、問題解決等五個分測驗。每個分測驗又包含3—4個子領域。例如,實數分測驗包括分數、小數和百分位數三個子領域。(二)分數、常模和信效度KeyMathR為測驗總體表現和三個部分表現提供了6種導出分數,分別是標準分、正態曲線當量、標準九、百分等級、年齡當量和年級當量。KeyMathR采取分層抽樣的方法在全美范圍內進行了標準化。KeyMathR提供的信度證據比較充分。效度方面,沒有提供明確的結構效度證據,僅給出了各年級逐漸提高的均分;內容效度證據是用于編制測題的指導細則表。第三節單科學業成就測驗四、斯坦福數學診斷測驗(一)測驗組成測驗考查概念與應用、計算兩大領域的技能。(二)分數、常模和信效度
SDMT4同時提供常模參照解釋和標準參照解釋,因此既能對學生與其他學生進行比較,也能具體指出學生在數學技能上的強弱之處。與SDRT4相似,SDMT4也提供6種分數,即各個分測驗的原始分數、進步指標、百分位數、標準九、年級當量和量表分數。制定常模之前,研究者對來自32個州的27000名學生試用了大約3000道題目,并做了題目篩檢。
SDMT4的信度證據充分,提供了各分測驗以及全量表在不同水平上的內在一致性系數、復本信度以及評分者信度。效度方面,SDMT4提供了內容效度、準則關聯效度和結構效度證據。第三節單科學業成就測驗PART04第四節標準化成就測驗的現狀和發展趨勢04一、國外標準化成就測驗發展現狀和趨勢(一)國外標準化成就測驗的發展現狀
以美國為代表的西方國家,標準成就測驗發展到今天已經相當成熟,不僅種類齊全、數量眾多,而且應用廣泛,產生了極大的社會影響。1.測驗數量巨大和種類齊全2.測驗內容領域廣泛而深入3.測驗編制嚴密、質量優良4.測驗應用廣泛、相關研究多、社會影響大5.標準化成就測驗的不足第四節標準化成就測驗的現狀和發展趨勢一、國外標準化成就測驗發展現狀和趨勢(二)國外標準化成就測驗的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河北省滄州市滄衡八縣聯考2025屆高三一模語文試題(解析版)
- 一年級數學輔導班運營計劃
- 初三數學備課組教學改革計劃
- 某年度回轉換熱干燥技術與設備競爭策略分析報告
- 某年度中成藥制藥生產線戰略市場規劃報告
- 造價員在合同管理中的職責
- 高考生物二輪復習(全國版) 第1篇 專題突破 專題7 微專題(五) 綠色環保
- 初中語文期末復習計劃詳解
- 密度峰值聚類算法研究及其在單細胞RNA-seq數據分析中的應用
- 基于深度學習的三維工件點云補全與實例分割方法研究
- 2024-2025學年人教版初中物理九年級全一冊《電與磁》單元測試卷(原卷版)
- 十八項醫療核心制度考試題與答案
- 組合煙花檢驗原始記錄表
- 【MOOC】模擬電子電路-杭州電子科技大學 中國大學慕課MOOC答案
- 2023年廣東省深圳市南山區第二外國語學校(集團)學府中學中考歷史二模試卷
- 2018年浙江嘉興舟山中考滿分作文《讓矛盾的心不再矛盾》
- 《高強韌馬氏體不銹鋼組織與性能研究》
- 建筑施工安全設備檢測實施方案
- 建筑垃圾處置公司激勵與獎勵機制
- GB/T 32151.25-2024溫室氣體排放核算與報告要求第25部分:食品、煙草及酒、飲料和精制茶企業
- 佳能-M2-Wifi-相機說明書
評論
0/150
提交評論