第三讲测验的质量分析
§ 测验的信度
§ 测验的效度
§ 测验的难度
§ 测验的区分度
§ 测验的信度
一、信度的定义
二、信度系数的计算
三、提高测验信度的途径
任何一种测量都必然会存在误差。误差是不可避免的,可以分两种:
随机误差:是由一些偶然因素引起的误差。比如一个考生在测验的得分,他的心情好与不好时测验得分会不一样,这种误差就叫随机误差。
系统误差:是指与测量目的无关的因素引起的误差,如考生的阅读理解能力会对他的数学成绩产生影响。物理测验中含有与物理知识无关的数学内容等等,都会他的成绩,这种误差就称为系统误差。系统误差一般的表现是稳定的,不变的。
测验成绩中包含有这两种误差,它是以测验分数的形式出现的。如何区分包含在测验分数中的这两种误差呢?
在经典测量理论中,对这两种误差的主要是用信度与效度来进行描述的。
在介绍信度与效度的概念前,我们需要了解测量的真分数理论。
真分数
为了研究方便,心理学家引入了真分数的概念。真分数即是测量中不存在测量误差时的真值或客观值,操作定义就是无数次测量结果的平均值,在实际的测量中,误差是不可避免的,当测量结果接近于真分数时,我们就说误差较小。通常用XT表示真分数。
数学模型
观察分数用X表示,XT、XSE表示测量误差,则真分数的基本方程式为:X = XT + XSE 。这里的误差只包括随机误差,系统误差是包含在真分数里的。
假设
根据公式我们可推导出三个相互关联的假设公理:
第一,反复观察N次,误差平均数为零,即真分数等于实得分数的平均数XT=E(X)或E(XSE)=0.
第二,真分数和测量误差之间相互独立。ρ(XT, XSE )=0
第三,各平行测验误差相关为零。ρ( XSE1, XSE2 )=0
在实际应用当中,用平行测验反复测量同一个人的同一心理特质是行不通的,因为平行测验不仅要求所测特质相同,对题目、数量、难度、区分度等也要保持一致性。这就增加了编制方面的困难。一般我们都是用同一个测验测量一个团体,团体中的每个人的误差可以假定是随机,并服从正态分布。所测团体的实测分数、真分数和误差分数的方差之间有如下的关系,
测验的信度是指测验结果的可靠性或可靠程度。可靠性是指对同一组对象进行两次相同测量所得结果的一致性和稳定性程度。
一、信度的定义
测量学中,信度可定义为真分数方差与实得分数方差的比率,即
()
这表明,真分数方差在实得分数方差中所占的比重越大,则信度就越高。
由于是未知数,所以根据误差方程可将公式()改写为
()
而和都可以从一组实得分数中计算出来,所以()式更有实际意
从公式()或()看出,若真分数T与实得分X接近时, 和也会接近,而误差及就会很小,此时信度就会增大。可见,信度是实测值与真值之间差距大小的量度。测验信度越高,误差就越小,测验的结果也越可靠。理想情况下,误差为零时,信度达到最大值;当信度很低,甚至降为零时,表明测验分数中充满误差,它比不测验还糟。
信度的值在(0~1)之间,称为信度系数。~,测验可靠性很高,但不常见; ~; ~; ~, ,表明误差太大,该测验不能使用。
实际工作中,通过对测验结果的一致性程度来计算信度的,主要有三种:稳定性系数、等值性系数和内在一致性系数。
1、稳定性系数(再测信度)
用同一个测验,对同一组考生前后两次进行测验,,也称稳定系数。其计算公式为:
()
式中X1和X2为同一考生两次的测验分数, 为两次测验的平均分数,S1和S2为两次测验的标准差,N为考生人数。
二、信度系数的计算
2
1
2
1
2
1
/
S
S
X
X
N
X
X
XX
å
-
=
g
再测信度的计算在使用时,两次测验之间的时间间隔要适宜,相隔时间不要太短,也不宜太长。再测法适用于速度测验而不适用于难度测验,同时要提高考生的积极性,使他们认真负责的参加每次测验。
2、等值性系数(复本信度)
两个等值但具体内容不同的测验,在最短时距内,对相同考生分两次测验所得分数的相关系数即为复本信度,计算公式与()相同。所谓等值是指测验在题型、题数、难易、时限以及题目内容和形式等方面相同或相似。
3、内部一致性系数
内部一致性系数是同一个测验的两部分得分的相关系数,有两种计算方法:①分半信度
分半法是按正常的程序实施测验,然后将全部试题分成相等的两半(通常采用奇偶分半法),根
第三讲 信度难度区分度 来自淘豆网m.daumloan.com转载请标明出处.