




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、題目難度淺析 余仁勝 題目難度是反映試題特征的一項重要指標。題目難度顧名思義就是題目的難易程度,反映題目難易程度的指標稱為題目的難度系數,有時簡稱為題目難度。根據測量理論的不同,計算難度系數的方法也不同,我們所常見的難度系數主要有題目正確作答率、難度和利用題目反應理論估計的題目難度等。1經典測量理論(CTT)的題目難度的概念題目的難易程度是因人而異的。一個簡單的例子是:1+1=?。對所有小學以上水平的人來說,作出正確回答是不言而喻的,但對于一個對數字還不了解的嬰幼兒來說,就很難。任何一道試題對于本領域的專家來說是易的,而對于外行來說便是難題。這說明題目難易程度是相對的而不是絕對的。
2、經典測量理論是通過試題的得分率或答對率作為難度定義的,又稱為題目的正確作答率。在每次考試以后,為了了解考生對試題的作答情況,需要進行試題分析,其中一項重要內容就是統計本次考試中每一道題有多少考生做對,有多少考生做錯,或者說平均得分情況。在這次考試中平均得分高的試題較易,平均得分低的試題較難。為了對各題難易程度進行比較,在題目分析中一般就用題目的得分率或題目的答對率作為比較題目難度的依據,這也就是經典測量理論中題目難度定義。我們用P+表示題目難度,則P+= ,其中R是考生在該題上的平均得分,N是該題的滿分。0P+1。其難度值的范圍在0-1之間,難度值愈大,表明題目的得分率愈高,試題愈容易,反之,
3、難度值愈小,表明題目的得分率愈低,試題愈難。其優點是意義直觀,便于理解,在命題中便于專家控制,在題目分析中,可比較直觀地反映各種類型試題得分情況和題目難易程度。其缺點是題目的難度系數與考生樣本水平直接相關,考生群體變化、題目的難度系數變化,難以實現題目參數的等值。經典測量理論題目難度是主客觀相互作用的結果。主觀主要體現為考生群體的水平,客觀主要體現在試題考查內容的深度、廣度以及問題解決復雜程度。當考生群體水平沒有發生變化時,試題間難度值的差異反映試題考查內容的深度和廣度的差異或不同;考生群體水平發生變化時,試題難度值反映考生水平的變化或差異。正因為如此,試題難度的預測必須建立在預測群體水平與實
4、考群體水平大體一致的前提下,否則,所估計的題目難度意義不大。 2題目難度與認知層次的關系題目難度和認知層次是衡量試題質量的兩個重要指標。它們之間既相互區別又相互聯系。題目難度是指試題的難易程度,而認知層次是在認知領域根據諸多教育(考試)目標之間的共同特征或內在聯系把教育(考試)目標分類的結果。由此可知,題目難度和認知層次完全是兩個不同的概念,切不可將它們混為一談。這是二者之間的區別。它們之間也有聯系。通常我們采用B·S布魯姆的分類法,把教育(考試)目標置于一種有層次的框架之中,在認知領域,這些層次按照從簡單到復雜,由低級到高級的順序排列。其中,后一個層次比前一個層次包含更復雜、更抽象
5、或更高的要求,或者說,前一個層次是后一個層次的基礎,后一個層次是在前一個層次基礎上的提高或發展,因此,一般情況下,認知層次高的試題,其難度也較大,或者難度大的試題,其認知層次也較高。這是二者之間的聯系。但是,難度和認知層次畢竟不是同一概念。事實上,不同認知層次的試題,特別是相鄰認知層次的試題,其難度是相互交叉的。譬如:屬于領會類別的大難度試題往往比運用(應用)類別的小難度試題其難度要大,這在考核不同的知識內容的試題中是常見的。綜上所述,在命制試題和組配試卷的過程中,難度和認知層次的作用是不可相互替代的,二者缺一不可。 3命題過程中試題難度的控制對于大規模考試而言,比如高考、研究生考試等,保持歷
6、年間同一課程的試題難度的穩定是非常重要的,能否有效控制試題難度是命題水平的重要標志。由于在大規模考試中不同年份間考生群體水平是相對穩定的,此時,經典測量理論的題目難度是很有價值的,因為同樣試題在不同年份考試中統計的難度值基本一致。我們對研究生數學考試的試題進行過研究,發現同一類型的試題在不同年份或同一年份不同試卷中出現時得分率大致相同,同一試題在不同的試卷中使用得分率基本一致。這說明對于考生水平相對穩定的考生群體而言相同試題的得分率也相對穩定,這是我們命題活動中控制題目難度的理論基礎。 由于大規模考試試題保密要求很高,一般不通過普通的試測方法估計題目難度,而是充分利用命題專家組多年命題的經驗并
7、參照往年題目難度數據預估各題的難度值,并通過控制試卷平均分的辦法,來實現控制整份試卷的試題難度目標。其方法是,首先估計題目的難度值,然后將每題的題分乘以該題的難度,然后相加即得到該卷的估計平均分。如果估計平均分與期望達到的平均分基本一致,則這份試卷難度水平是合格的。不然的話,則通過修改試題,改變試題難度的方法使試卷的估計平均分達到要求。 題目難度的專家估計方法主要有兩種,一種是若干專家分別估計,用其平均值作為題目難度的估計值;一種是若干專家在一起共同研究試題,集體估計題目難度。這兩種方法各有所長,第一種方法,每個教師可以充分體現自己的思想,估計難度受權威人物的影響小。第二種方法,集體思維,大家
8、在一起把各種可能都考慮到,有效地避免了因個人專業性向和對考生水平估計的偏差的影響。在研究生數學命題中,這兩種方法,我們都使用,各有所長,但專家集體估計的精度更高些。 在評估的過程中,專家主要從以下幾個方面進行綜合考慮,一是題目考查的內容深度、考核能力的層次、完成題目的復雜程度;二是同類試題在以往考試中出現的頻次,在教學過程中學生掌握熟練程度;三是考生水平的變化因素。 4經典測量理論題目難度的等值根據上述分析,我們知道題目難度是與考生水平有關的,是難以實現等值的。為了實現題目難度的等值,美國ETS的做法是將其轉化到DELTA量表(), (又稱為難度)。難度與P+的關系是:=134-1(P+)中,
9、(x)是標準正態分布函數,-1 (x)是其反函數。難度是將正確答對率難度轉化為標準難度。-1 (P+)實際上是下圖標準正態曲線下面積P+所對應的z值。P+值與難度的對照表如下表所示,從表中可以看出,量表上每下降一個單位相當于正確答對率提高10。難度可以實現等值,具體方法是從題庫中選取m道試題(其難度分別記為e1,e2,em)和新的試題構成新的試卷,經測試后,計算出這m道試題的難度(分別記為1,2,m),由此求出兩者的回歸直線方程:e=a+b。將其它試題的難度帶入此公式中,即可得到這些試題的等值的難度,并放入題庫中。5題目反應理論(IRT)中題目難度題目反應理論認為:能力水平為的考生群體正確作答
10、難度為b,區分度為a,猜測參數為c的01記分的選擇題的概率P()可以用邏輯斯蒂Logistic數學模型表示,即P()=c+ 。這個模型稱為三參數邏輯斯蒂模型,假定c為零時,此模型稱為兩參數邏輯斯蒂模型;假定c為零,且a為常數時,稱為單參數邏輯斯蒂模型,又稱Rasch模型。在題目反應理論中核心的參數有兩個,一個是能力參數,一個是題目難度參數b。題目難度的直觀意義是:答對概率為 (若c=0,則答對概率為 的考生群體的能力,就是該題的難度。根據數學模型的定義,能力參數和題目難度參數b定義在同一量表上,且難度參數與考生樣本無關。中難度參數不是通過比率(或概率)定義的,而是通過具有某種要求的考生能力定義
11、的,如果一道題很難,要求答對概率達到 的考生群體的能力就越高,則題目的難度就越大。題目反應理論提出了題目信息量和測驗信息量的概念,測驗信息量是各題信息量之和,各題的信息量與題目難度有直接的關系,當題目難度與考生能力水平接近時題目的信息量最大。因此,利用項目反應理論的題庫構造測驗時選擇難度與考生能力水平相當的試題就可以用最少的題量獲得目標要求的信息量,這也就是自適應考試的理論基礎。項目反應理論的難度定義與經典測量理論難度定義相比有質的飛躍。項目反應理論回答了經典測量理論一直困惑著人們認識的兩個難題:一是題目難度與考生能力水平之間的關系;二是測驗信息量與各題信息量之間關系。項目反應理論的發明確實是教育測量理論的重要革命。事物總有兩重性,盡管我們非常清楚,項目反應理論是較經典測量理論更為先進的理論,但在我國的考試實踐中,目前經
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年不銹鋼刀口角尺項目投資價值分析報告
- 2025年鱷魚紋壓花模具項目可行性研究報告
- 2025年銨碘奇效消毒劑項目可行性研究報告
- 2025年窗口鏡項目可行性研究報告
- 普惠托育網絡建設路徑與實施策略
- 2025年氣動活塞銷內徑測臺項目可行性研究報告
- 防洪治理工程項目設計方案優化
- 25年廠里職工安全培訓考試試題真題匯編
- 2025年智能凈化煙罩項目可行性研究報告
- 25年公司、項目部、各個班組三級安全培訓考試試題各地真題
- 飲食與免疫:如何通過飲食提高免疫力
- 中國常見古生物化石
- 腦脊液漏修補術后護理查房
- 《我不是藥神》劇本
- JJF 1101-2019《環境試驗設備溫度、濕度校準規范》規程
- 社區文體活動廣場建設項目可行性研究報告
- 新時代高職生創新創業教育PPT完整全套教學課件
- 第三章-春秋戰國時代的城市課件
- 醫務人員職業健康安全健康-課件
- 醫學文獻檢索重點
- 病區藥品規范化管理與問題對策黃池桃
評論
0/150
提交評論