1、附件 6、 难度、区分度、信度和效度的一般说明 一、难度 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参 数,它和区分度共同影响并决定试卷的鉴别性。 一般认为,试题的难度指数在 0.30.7 之间比较合适,整份试卷 的平均难度最好在 0.5 左右,高于 0.7 和低于 0.3 的试题不能太多。 1、难度的两种定义 (1)P=1x/w 其中:x 为某题得分的平均分数,w 为该题的 满分。 这种定义法,难度值小时表明试题容易,值大时表明试题难,最 小值为 0,最大 值为 1。 (2)P=x/w 这种定义法,难度值小时表明试题难,值大时表明试题容易,最 小值为 0,最大 值为 1。 2、难
2、度的计算 (1)主观性试题的难度 A、 基本公式法:P=1 x/w B、 极端分组法 P=1(XH+XL)/2W 其中:XH 为高分组的平均得分(前 27%),XL 为低分组的平均得 分(后 27%)。 (2)客观性试题的难度 A、 基本公式法 :P=1R/N 其中:R 为答对人数, N 为全体人数。 B 极端分 组法: P=1( PH+PL)/2 其中:PH=RH/n 叫高分组通过率,RH 为高分组答对人数,n 为总 人数的前 27%。PL=RL/n 叫低分组通过率, RL 为低分组答对人数。 二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以 拉开不同水平应试者分数的距离
3、,使高水平者得高分,低水平者得低 分。而区分度低则反映不出不同应试者的水平差异。 试题的区分度与试题的难度直接相关。通常来说,中等难度的试 题区分度较大。另外, 试题的区分度也与应试者的水平密切相关,试 题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显 现出来。 1、区分度指标的评价 -1.00D+1.00,区分度指数越高,试题的区分度就越强。一般 认为,区分度指数高于 0.3,试题便可以被接受。 2、 区分度的计算方法 (1)基本公式法 :D(HL)/N 其中:D 代表区分度指数,H 代表高分组答对题的人数,L 代表低 分组答对题的人数,N 代表一个组的人数即高分 组与低分组人数
4、之和。 (2)极端分组法: 主观 性试题:D=SHSL/n(WH-WL) 其中:SH 为 高分组得分总数,SL 为低分组得分总数,WH 为该 题的最高得分,WL 为该题的最低得分,n 为 高分组(或低分组)的人 数,即总人数的 27%。 客观 性试题:D= PHPL ,或 D= RHRL/n 一般也可以用 D=XHXL/X 满 计算。 其中:XH 为高分组某 试题的平均分, XL 为低分组某试题的平均 分,X 满 为该题 的满分。 三、信度 信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评 结果越可靠。相反,如果用某套试题对同一应试者先后进行两次测试, 结果第一次得 80 分,第二次得
5、 50 分,结果的可靠性就值得怀疑了。 信度通常以两次测评结果的相关系数来表示。相关系数为 1,表 明测评工具如试卷完全可靠;相关系数为 0,则表明该试卷完全不可 靠。一般来说,要求信度在 0.7 以上。 1、评价信度的方法 (1)再测信度。它是指将同一试卷在相同的条件下,对同一组考 生先后实施两次,两次测评结果的相关系数。 (2)复本信度。它是指用两份或几份在构想、内容、难度、题型和 题量等方面都平行的试卷进行测试,测评结果之间的相关系数。 (3)内部一致信度。它是指试卷内部各题之间的一致性,通常是 将试卷一分为二,然后计算一半试卷与另一半试卷之间的相关系数。 2、 信度系数的计算 xx=S
6、T2/SX2 其中:ST2 叫真分数方差,SX2 为获得分数方差。信度系数的最 大值为 1,表示 测验的可靠性高,最小值为 0,表示测验的信度低。当 xx0.70 时 ,测验可用于 团体间的比较。当 xx0.85 时,测验可用于 个体之间的比较。 四、效度 效度是一个测试能够测试出它所要测试的东西的程度,即测试结 果与测试目标的符合程度。 任何测试工具,无论其它方面有多好,若效度太低,测试的结果 不是它要测试的东西(如用英语试卷测试学生的数学能力) ,那么,对 目前所要测试的东西,这个测试将是无价值的。 由于心理现象本身的特点,测评的效度尤为重要。心理属于精神 方面的东西,目前人们还无法直接观察它,只能通过一个人的行为模 式或者对测试题目的反应,来推论其心理特质。如智力水于主要是借 助于个体对一些问题的反应及正误等结果来推断的。 效度是一个相对概念,即效度只有高低之分,没有全部有效和全 部无效之分。效度从种类上可分为卷面效度、内容效度、构想效度、预 测效度和共时效度。