第三節測驗的信度
第一單元信度的概念
第二單元信度評估的方法
第三單元信度與測驗分數的解釋
第四單元影響信度的因素
第一單元信度的概念
一、信度的定義
信度是指同一被試者在不同時間內用同一測驗(或用另一套相等的測驗)重復測量,所得結果的一致程度。
在測量理論中,信度被定義為:一組測量分數的真分數方差與總方差(實得分數的方差)的比率。
二、信度的指標
(一)信度系數與信度指數
信度指數是真分數標準差與實得分數標準差的比值。
信度指數的平方就是信度系數。
(二)測量標準誤
測量誤差分布的標準差,即為測量的標準誤。
第二單元信度評估的方法
一、重測信度
二、復本信度
三、內部一致性信度
四、評分者信度
信度的類型與估計方法
重測信度(test-retestreliability)
又稱穩定性系數。它的計算方法是采用重測法,即使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關系數。最適宜的時距隨測驗的目的、性質和被試特點而異,一般是兩周到四周較宜,間隔時間最長不超過六個月。
內部一致性信度(internalconsistencyreliability)
–分半信度(split-halfreliability)
是在測驗實施后將測驗按奇、偶數分為等值的兩半,并分別計算每位被試在兩半測驗上的得分,求出這兩半分數的相關系數。
分半法經常會低估信度,必須修正,借以估計整個測驗的信度。
–同質性信度(homogeneityreliability)
同質性主要代表測驗內部所有題目間的一致性。當各個測題的得分有較高的正相關時,不論題目的內容和形式如何,則測驗為同質的。相反,即使所有題目看起來好象測量同一特質,但相關很低或為負相關時,則測驗為異質的。
–評分者信度(scorerreliability)
–隨機抽取若干份測驗卷,由兩位評分者按評分標準分別給分,然后再根據每份測驗卷的兩個分數計算相關,即得評分者信度。
–一般要求在成對的受過訓練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。
–當多個評分者評定多個對象,并以等級法記分時,可采用肯德爾和諧系數作為評分者信度的估計。
第三單元信度與測驗分數的解釋
一、解釋真實分數與實得分數的相關
二、確定信度可以接受的水平
三、解釋個人分數的意義
四、比較不同測驗分數的差異
信度與測驗分數的解釋本文來源:中大網校網
解釋真實分數與實得分數的相關
信度系數可以解釋為總的方差中有多少比例是由真實分數的方差決定的,也就是測驗的總變異中真分數造成的變異占百分之幾。
確定信度可以接受的水平
當rxx<0.70時,測驗不能用于對個人作出評價或預測,而且不能作團體比較;當0.70≤rxx<0.85時,可用于團體比較;當rxx≥0.85時,才能用來鑒別或預測個人成績或作為。
解釋個人分數的意義
–其一是估計真實分數的范圍;其二是了解實得分數再測時可能的變化情形。這就是測量標準誤的應用。
比較不同測驗分數的差異
這種比較包括兩個人不同分數的差別和同一被試在兩個測驗上的差別。這就是差異分數的標準誤問題
第四單元影響信度的因素
一、樣本特征
(一)樣本團體異質性的影響
(二)樣本團體平均能力水平的影響
二、測驗長度
(一)測驗越長測題取樣或內容取樣越有代表性。
(二)測驗越長被試的猜測因素影響就越小。
三、測驗難度
難度與信度不存在簡單的對應關系。如果因為難度過大或過小,造成分數范圍縮小,可使信度降低。
四、時間間隔
再測法求信度,間隔時間越短信度系數越大;間隔時間越久,信度系數越低。
注意:
斯皮爾曼-布朗公式為校正分半信度的經驗公式,它的假設是兩半測驗分數的變異數相等。當假設不成立時,可用下列兩種公式之一,直接求得測驗的信度系數。
弗朗那根(flanagan)公式,盧倫(kulon)公式
對于一些復雜的、異質的心理學變量,采用單一的同質性測驗是不行的,因而常常采用若干相對異質的分測驗,使每個分測驗內容具有同質性。
相關鏈接:
(責任編輯:)