1、试卷分析常用统计数据一、平均分平均分是反映学生成绩集中趋势最主要的测量指标,一般在 Excel 中可快捷求得。二、标准差标准差是反映每个学生成绩与平均分的平均差异程度,是学生成绩离散程度最广泛的测量指标,其值越大,说明成绩越分散。在 Excel 中,点击函数工具选择“STDEVP”并确定计算范围(如:B2:B500)即可。三、分数段人数按分数段统计学生人数,一般可按 5 分或 10 分为一段进行统计,根据各分数段的人数可绘制出学生成绩分布的曲线或直方图,以“中间高、两头低” 来衡量成绩是否符合正态分布的程度。统计规律表明,考生的智力水平,包括学习能力,实际动手能力等呈正态分布,因此正常的考试成
2、绩分布应基本服从正态分布。综合考察标准差与平均分以及成绩分布的曲线,可以了解学生成绩的分化程度、分布密度等情况。统计分析中,通常还计算各分数段人数占总人数的比率,以及满分率,零分率。在列表叙述相关数据中还应列出最高分、最低分。四、难度系数难度指试卷(题目)的难易程度。一般用试卷(题目)的得分率或答对率表示,所以难度事实上是容易度或通过率。其值在 01 之间,数值越大,说明试卷(题目)越容易。一般计算方法:1、客观性试题难度 P(这时也称通过率)计算公式:P=k/N。其中,k 为答对该题的人数,N 为参加测验的总人数。例:第 1 小题选择题满分是 4 分,全班 50 名学生中有 20 名学生答对
3、,则第 1 小题的难度计算:平均分=42050=1.6,P=平均分满分值=1.64=0.4。2、主观性试题难度 P 计算公式:P=X/M。其中,X 为试题平均得分;M 为试题满分。3、适用于主、客观试题的计算公式:P=(PH+PL)/2其中,PH、PL 分别为试题针对高分组和低分组考生的难度值。在大群体标准化中,此法较为方便。具体步骤为:将考生的总分由高至低排列;从最高分开始向下取全部试卷的 27%作为高分组;从最低分开始向上取全部试卷的 27%作为低分组;按上面的公式计算。例:一次生物测试中,在 100 名学生中,高低分组各有 27 人,其中高分组答对第一题有 20 人,低分组答对第一题的有
4、 5 分,这道题的难度为:PH=20/27=0.74 ,PL=5/27=0.19, P=(0.74+0.19)/2=0.47。4、整个试卷的难度等于所有试题难度之平均值(包括主、客观试题) ,或用公式 P=X/M 计算。难度值在 0 至 1 之间。P0.8 试题太易;P0.8 、P0.4、P 0.6 的中等难度试题应占 60%。整套试卷平均难度在 0.40.6 之间。五、区分度区 分 度 是 指 试 题 对 被 试 者 情 况 的 分 辨 能 力 的 大 小 , 它 反 映 试 题 区 分 不同 水 平 受 试 者 的 程 度 , 即 考 出 学 生 的 不 同 水 平 , 把 优 秀 、 一
5、 般 、 差 三 个 层 次的 学 生 真 正 分 别 开 。 区 分 度 高 的 考 试 , 优 秀 、 一 般 、 差 三 个 层 次 的 学 生 都 有一 定 比 例 , 如 果 某 一 分 数 区 间 学 生 相 对 集 中 , 高 分 太 多 或 不 及 格 太 多 的 考 试 ,区 分 度 则 低 。 区分度也是衡量题目质量的主要指标之一,是筛选题目的依据。一般的教学测验分析中,通常采用极端分组法,具体方法:先将被测学生按其总分由高到低的顺序依次排列,然后取其上端一部分为高分组,取其下端一部分为低分组。各组的人数应占多大比例,要视被测学生总体的具体情况而定。一是学生人数不太多,可把
6、前 50%的考生为高分组,后 50%为低分组。二是学生人数多,如果测验总分的分布符合正态分布,最适当的比例是高分组和低分组各占 27;如果分数分布较正态分布平坦,高、低分组人数比率要略高于27;一般情况下,其比率介于 2533之间即可。计算公式:1、客观性试题区分度 D:D=PH-PL其中,PH、PL 分别为试题高分组和低分组考生的难度值,PH、PL 的计算方法同上。例:一次生物测试中,在 100 名学生中,高低分组各有 27 人,其中高分组答对第一题有 20 人,低分组答对第一题的有 5 分,这道题的区分度为:D=PH-PL=0.74-0.19=0.552、主观试题(非选择题)区分度 D:D
7、=(XH-XL)/N(H-L)其中,XH 表示接受测验的高分段学生的总得分数,XL 表示接受测验的低分段学生的总得分数,N 表示接受测验的学生总数,H 表示该题的最高得分,L 表示该题的最低得分。3、整个试卷的区分度,是所有试题区分度的平均值。六、信度信度是反映测量工具可靠性的指标。试题的信度主要是指测量结果的可靠性或一致性。常见的试题信度多用相关系数来表示,即用同一组被测学生样本对两组项目的反应之间的相关,作为反映两组项目测量的一致性程度的指标,称作信度系数,简称信度。几种常用信度的意义及计算方法:1、再测信度用同一份试题对同一组学生前后实施两次测试,计算两次测验分数之间的相关系数,即得再测
8、信度。这种信度能表示两次测验结果有无变化,反映测验分数的稳定程度,所以又称为稳定性系数。再测信度一般用皮尔逊积差相关公式计算。2、复本信度如果用两份等值平行的试题测量同一组学生,再求两次测验分数的相关,其结果就是复本信度。用皮尔逊积差相关公式计算。3、分半信度在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据学生在这两半测验中所得的分数计算相关系数,即得分半信度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度
9、值偏高。4、同质性信度同质性是指试题中所有项目之间的一致性。若测验中各个项目得分相关较高时,不论项目的内容或形式有何差别,测验都为同质;相反,即使所有项目看起来都好像是测量同一特性,但项目得分之间的相关很低,测验仍然是异质的。测验越同质,同质性信度的值也越大,则说明试题的内部一致性程度越高。因而,同质性信度又称作内部一致性系数。常用计算同质性信度的方法如下:当项目采用二分法(项目只有通过或未通过两种分数)计分时,可用库德-理查逊公式;当项目属于论文式类型,采用连续分数计分时,可用克龙巴赫所创的a 系数公式。七、效度效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。效度分为三种类型:1、内容效度。指根据测验目的确定的测验内容所引起的预期反应达到测验目的的程度。2、构想效度。指测验对预先设立的某一理论上的概念、构想或研究特性的实际测量程度。3、效标效度。指测验分数与效标的相关程度。所谓效标,就是检验测验有效性的一种参照标准。效标常用一种公认比较可靠或权威的测验结果表示。这实际上就是用一种已知的且认为其“有效”的测验结果去检验另一个新测验的有效性。之所以不直接用效标测验去代替新测验,往往是因为新测验可能比效标测验更为简单、易行。