您好! 歡迎來到中南人才測評中心(第三方命題專家)
幫助優秀組織提高人事決策準確性

全國服務熱線:15364068073

訊中心

當前位置:資訊中心->人事考試理論與實踐->考試的測量學基礎知識:經典測量理論及項目反應理論

考試的測量學基礎知識:經典測量理論及項目反應理論

2022-02-09

考試是一種常見的測量形式,其作為一門科學,擁有深厚的理論基礎,了解理論基礎有利于考試工作的開展,研究院作為學術性機構,致力于加強考試科學知識的普及,本公眾號將會陸續推送考試科普知識,供各考試工作者參考學習。

本期文章轉自《中國考試》,共上下兩篇,按測量學的發展時間,分別介紹了四個測量學理論,本篇將介紹經典測量理論及項目反應理論的理論假設及特點。


經典測量理論(CTT)

經典測量理論(Classical Testing Theory,CTT)是歷史上出現時間最早、發展時間最長、對實際工作影響廣泛、人們也最為熟悉的一種心理測量學理論。1950年,美國學者Gulliksen《心理測驗的理論》一書的出版,標志著CTT的成熟。

圖片

根據CTT理論,測量結果不可能是完全沒有誤差的真值,而只能獲得包含測量誤差在內的觀測分數。因此CTT假定,觀測分數與真分數之間是一種線性關系,觀測分數(X)是真分數(T)與誤差(E)之和,從而形成了CTT的模型:X=T+E,如小明某次數學考試卷面得了80分,80分即為觀測分數。

由于公式中存在兩個未知變量,因此這個公式是無法解的,除非做出一些簡單的假設。CTT的假設是:①測量誤差是隨機的,并服從均值為零的正態分布;②被試總體的誤差均值為零;③平行測驗的誤差分數不相關。

經典測量理論在真分數假設的基石上構建起了它的理論大廈,主要包括信度、效度、項目分析、常模、標準化等。依據CTT的框架編制和施測心理測驗時,最重要的任務就是在測驗的各個環節上,通過各種方法和技術盡量減小測驗誤差,以提高測驗的可靠性,即信度。

經典測量理論由于模型簡單、淺顯易懂,在心理與教育測量領域應用范圍較為廣泛,且貢獻巨大。其不足主要在于:①統計量的樣本依賴性,效度、信度、難度、區分度等參數的估計對樣本的依賴性很大,必須強調樣本對總體的代表性。②測量分數的測驗依賴性,由于很難建立“平行試卷”,測量相同能力的兩個不同測驗上的分數可比性差。③信度估計的不精確性,CTT假定對不同能力水平的被試來說,測量誤差是相同的,但事實上一份測驗只有在施測于能力水平與測驗難度相當的被試時才容易獲得比較高的測量精度。



項目反應理論(IRT)

項目反應理論(Item Response Theory,IRT)的基本思想起源于20世紀30年代末和40年代初。美國心理測量學家洛德(Lord)于1952年在其博士論文中首次提出項目反應模型,即雙參數正態卵形模型,標志著IRT的正式誕生。1957年和1958年,美國數理統計學家伯恩鮑姆(Birnbaum)用數學上更容易處理的邏輯斯蒂曲線取代了Lord的正態卵形曲線。丹麥數學家和統計學家拉什(Georg Rasch)在1960年提出著名的單參數模型——Rasch模型,之后他的學生Wright將Rasch模型應用推廣,推動IRT在發展方向上走出了另外一條路。20世紀70和80年代,項目反應理論迅猛發展,像組卷、項目功能差異(DIF)、標定、等值,以及標準設定和測驗計分、自適應考試等越來越離不開IRT。

圖片

項目反應理論建立在2個基本概念上:①考生在某一測試試題上的表現情形,可由一組因素來加以預測或解釋,這組因素叫做潛在特質或能力;②考生的表現情形與這組潛在特質間的關系,可通過一條連續遞增函數來加以診釋,這個函數便叫做項目特征曲線(Item Characteristic Curve,ICC)。任何一條項目特征曲線所代表的含義是:答對某一試題的概率,是由考生的能力和試題的特性所共同決定??忌臐撛谔刭|或能力的程度越強(或越高),其在某一試題上的正確反應概率便越大。

與CTT的弱假設不同,項目反應模型被稱為強假設模型,因為其前提假設非常嚴格。這些假設有:①單維性假設。即假定測驗中各題目都共同測量一種潛在特質,這種單一潛在特質包含在全部測驗題目中。被試在測驗上的表現只能由一種潛在特質來解釋。②局部獨立性假設。即假設受測者在測驗題目上的反應只受他自身的能力水平以及題目的某些性質的影響,而不受他人或他在其他題目上的反應的影響。也就是說,涵蓋在項目反應模型里的能力(特質)因素,才是唯一影響被試在測驗題目上作出反應的因素。③單調性。即考生對題目正確反應的概率隨其能力水平的增加而單調遞增。通常認為,單維性假設與局部獨立性假設是等價的,局部獨立性是單維性假設成立的一個必然結果。

與經典測量理論相比,項目反應理論至少有以下幾個優點:①題目參數穩定,不受考生樣本的影響,題目參數估計更為精確;②針對每個考生提供個別差異的測量誤差指標,因而能精確推算考生的能力估計值;③解決了測驗等值問題,它既能實現被試測驗總分等值,又能實現題目參數等值;④定義了信息函數這一綜合質量指標,來評定某個題目或整個測驗的準確性。

項目反應理論作為最重要的一個現代測量理論,正日益頻繁地應用在大型題庫建設、大尺度量表開發、國際評價項目及計算機化考試等領域,在心理與教育測量舞臺上扮演著越來越重要的角色。


本文轉載自《中國考試》


Copyright 中南人才測評中心(第三方命題專家) .ALL Rights Reserved.

湖南省長沙市雨花區金海路128號長沙國際研創中心A2棟1001   網站備案:贛ICP備10200863號-6TEL:15364068073

免费。色婬网站