1、医学统计学考试方法的比较研究 关键字: 医学统计学 考试方法 比较 【摘要】 目的 为了了解医学统计学教学改革工作中存在的问题,了解医学统计学考试方法改革的利弊。方法 搜集 9799 级临床医学本科生医学统计学的考试试卷和成绩,对试卷从学生成绩的分布、信息难易度、区分度等方面进行了综合分析,并且对该课程的考试方法改革前后进行比较研究。用 SPSS for Windows12.0 建立数据库和有关的数据处理。多组间比较根据资料的性质不同分别选用 one-way ANOVA 和 Kruskal-Wallis Test 的比较方法,多重比较使用 LSD 法。两组间比较选用 Mann-Whitney
2、Test 法。结果 99 级临床医学本科生医学统计学的考试成绩低于 9798 级的临床医学本科生医学统计学的考试成绩(U=5.702,P=0.000);99 级学生中,一系和二系的成绩优于三系的成绩(P=0.011 和 P=0.033);97 级的试卷可靠性好,99 级的可靠性较好,98 级的可靠性一般;3 份试题的难度和区分度综合评价结果,以 99级的为最优(X 2 =7.580,P=0.065);医学统计学考试方法改革前后的难度无统计学意义(F=1.885,P=0.163);3 年临床医学专业医学统计学试卷的全卷区分度考试方法改革后的比改革前的大,97 级与 98级比较 P=0.004,9
3、7 级与 99 级比较 P=0.007,98 级与 99 级间无差异P=0.435。结论 对五年制临床医学专业医学统计学教学与考试的改革实践结果表明:学生比较适应于记忆的内容,对实际应用的方面感觉较难;作业对学生知识的掌握有一定的作用,发散性的思维锻炼可以促进学生学习的积极性。 关键词 医学统计学 考试方法 比较 医学统计学是本科临床医学专业的必修专业基础课。在教学过程中,学生普遍反映医学统计学抽象、难学。为了进一步了解在教学改革过程中存在的问题,本研究收集了 97、98 和 993 级的临床医学专业(五年制)的医学统计学试卷进行具体的分析和比较研究,可以找出在此课程教学改革工作中存在的问题,
4、了解医学统计学考试方法改革的利弊。为教师调整教学内容,改革教学方法,提高教学质量和以后的教学改革提供理论依据。 1 资料来源和方法 1.1 情况简介 临床医学专业医学统计学课程属于必修专业基础课。在以前医学统计学是预防医学中的一部分(卫生学和统计学各占50%) ,教学一般是分前后 9 周 2 个阶段进行,考试“单科独进” 。历年来教研室一直严格把关,认真施教,采用统一命题,闭卷考试方法,学生学习成绩一直很好。在医学教育改革的影响下,从 99 级临床医学开始,把预防医学分成医学统计学和卫生学两门课。临床医学本科生医学统计学的考试,自从 98 级开始,采用了以“医学实践问题为中心”的方式来出题,结
5、果 99 级 325 人参加考试,有 75 人不及格;98级 12 人参加补考,有 10 人不及格,引起了教研室广大教师的高度重视和警惕。 1.2 资料来源 97、98、99 连续 3 级五年制临床医学专业的医学统计学试卷。试卷命题均由作者亲自完成,阅卷均是采取流水作业的方式,统一评分。3 届学生在年龄、性别比例和招生来源等方面基本相同。大课任课老师和实习指导相同,判卷按统一标准答案,由任课教师每人 1 题,公正评分。97、98 级学生是以书本课后的练习为作业,而 99 级一系学生的作业是:从中华系列或中国系列的专业杂志中找一些相关的文献,要求根据所学医学统计学知识对文中所涉及的统计设计、统计
6、指标和统计方法的选择使用加以 基金项目:本项目受浙江大学第六期 SRTP 项目的资助正确理解、识别其正误并且加以评析,99 级二系的学生是以书本课后的练习为作业,99 级一系学生老师没有布置任何作业。 1.3 方法 1.3.1 统计方法 用 SPSS for Windows12.0 建立数据库和有关的数据处理。多组间比较根据资料的性质不同分别选用 one-way ANOVA 和Kruskal-Wallis Test 的比较方法,多重比较使用 LSD 法,两组间比较选用 Mann-Whitney Test 法。 1.3.2 试卷信度采用分半信度方法 其计算公式:r S-B =2r 半 /(1+r
7、 半 ) ,r 半 为分半相关系数,即按试卷奇偶题得分计算其相关程度。分半信度系数 0.9 以上,可靠性好:0.80.9,可靠性较好;0.60.8,可靠性一般;0.6 以下,可靠性较差 1 。计算得 97 级卫生统计学试卷分半信度系数为 0.96。对 98 级试卷采用克伦巴赫系数法,其计算公式:C=n(1- n i=1 S i2 /S 2 )/(n-1) ,其中 n 为试卷总题数,S 2 为考试总分数的方差, S i 为第 i 题的方差。C 在 0.50.9范围内较好 2 。98 级试卷信度系数为 0.56。对 99 级试卷采用分半法(按难度相等两半两分)计算其信度:=2r/(1+r) ,先将
8、 n 个试题按难度从小到大排列,取顺序号单号为一组,双号为一组,其次求各题的平均分数,然后求这两组的相关系数即为 r,计算 =0.69,即 99 级试卷信度为 0.69。试题难度是考生对某一试题作出正确回答的百分率,用难度系数 P 表示。小样本时:客观性试题 P=答对该题人数/考生总人数:主观性试题 P=考生该题平均得分/该题满分。大样本时:P=(P H +P L )/2,其中 P H 为高分组该题的难度,P L 为低分组该题的难度。按难度四级分类法(P0.8,易;0.650.8 中等难度;0.50.65 较难,P0.5 难) 。 1.3.3 区分度是衡量试题、鉴别考生水平差异能力的重要指标,
9、用D 表示。公式 P=P H -P L 。本文采用得分率求差法(Johnson 法)求全卷区分度:D=X H -X L N(H-L) ,其中 X H 、X L 分别为27%高分组,27%低分组的总分,H、L 分别为最高分和最低分,N 为各组人数。 2 结果 2.1 考试及总体得分情况,见表 1、表 2,图 13。表 1 3 届学生医学统计学考试总体得分情况从表 1 可见,3 年试卷的学生成绩总分的总体分布是呈偏态分布的。97、98 级的平均成绩差不多,以 99 级为最低,学生间总得分的差异以 99 级为最大。不及格率也是以 99 级为最高。表 2 三届临床医学学生医学统计学考试成绩的分布情况对
10、表 2 中资料分析表明,三届临床医学学生医学统计学考试成绩分布是不同的(X 2 =65.469,P=0.000) ,其中 97 级和 98 级间没有差异(U=1.715,P=0.086) ,99 级临床医学学生医学统计学考试成绩比前两级的差(U=5.702,P=0.000) 。 2.2 试卷组成及得分情况 97、98、99 连续三级五年制临床医学专业的医学统计学试卷的题型、题量、分值以及学生的得分情况见表 3。 2.3 99 级三系之间的比较情况 99 级临床医学医学统计学考试的平均成绩二个系之间有统计学意义(F=3.63,P=0.028);一系与二系之间没有差异(P=0.656) ,一系平均
11、成绩比三系高(P=0.011) ,二系平均成绩比三系高(P=0.033) ,见表 4 和图 4。 2.4 试卷质量评价情况 2.4.1 试卷信度 97、98、99 连续三级五年制临床医学专业的医学统计学试卷的信度分别为 0.96,0.56 和 0.69。97 级的试卷可靠性好,99 级的可靠性较好,98 级的试可靠性一般。 2.4.2 难度和区分度 试题的难度和区分度是衡量试题质量的量化指标。三年临床医学医学统计学试卷的难度分布见表 5。三年临床医学专业医学统计学试题的难度无统计学意义(F=1.885,P=0.163) 。表3 三届学生医学统计学试卷组成及学生得分情况年级 表 4 99 级临床
12、医学医学统计学考试成绩情况 三年临床医学专业医学统计学试卷的全卷区分度有差异(F=6.029,P=0.005) ,区分度以 97 级试卷为最差(97 级与 98 级比较 P=0.004) ,97 级与 99 级比较 P=0.007,98 级与99 级间无差异 P=0.435) ,见表 6。表 6 3 份医学统计学试卷的区分度分布情况年级 2.4.3 3 份试题的难度和区分度综合评价结果,以 99 级的为最优(X 2 =7.580,P=0.065) ,见表 7 所示。表 7 3 份医学统计学试卷中的各小题质量综合评价情况 3 讨论 3.1 3 届学生考试成绩均呈负偏态分布,即分布曲线高峰右偏,高
13、分人数较多。 医学统计学考试的目的是检查学生对基本概念、基础知识和基本统计分析方法的掌握程度,即检查学生是否达到教学大纲的要求,所以其 3 届学生考试成绩分布类型是与实际要求吻合的。 3.2 信度表示考试的可靠性,即考试结果是否真实反映考试的实际水平,影响信度的主要因素是测量误差。一个考生的实得分数由两部分组成,一部分是凭他所掌握的知识确能得到的真实分数;另一部分是因试题不合理,包括试题难度、代表性、覆盖面、教师编制试题的主观偏见和随意性等因素而影响了成绩。3 份试卷中,97 级、99 级试卷信度较好,98 级试卷信度不理想,应改进。可以通过增加同质试题数的方法提高其信度 2 。 3.3 3
14、次考试的平均难度分别为 0.76、0.74、0.68,与国内关于考试试卷 P 值在 0.600.80 之间为宜的观点相符 3 ,可以认为 3 份试卷难度适中。 3.4 试卷区分度是说明试卷能否反映学生水平差异的指标,区分度好能反映学生的真实水平,区分度差则说明成绩是随机的,不能反映学生的真实能力。98 级、99 级全卷区分度均优于 97 级试卷区分度,但是3 届试卷的区分度水平一般。 3.5 衡量试题质量的两个指标是难度和区分度。根据难度四分法,97 级试卷易题占 47.4%,难题占 5.3%,易题所占比重过大,使整张试卷显得过于简单,高分人数偏多,成绩呈负偏态分布;98 级难题所占比重相对易
15、题大;99 级难题所占比重与易题相当。一般来说,整张试卷易题和难题各占 1/4,中等难度的试题占 1/2,因此应减少 97 级试卷的易题,增加难题,而 98 级试卷则相反,99 级的难易题分配尚合理。若简单的试题为学生应该掌握的基础知识,作为课程考试题仍可使用。1965 年,美国检验专家 LEbel 根据长期经验提出用鉴别指数评价题目性能的标准:区分度 D0.40 试题很好;0.300.39 之间的试题良好,修改更佳;0.200.29 试题尚可,仍需修改;D0.19 的试题较差,应摒弃或修改 4 。97 级试卷区分度在 0.19 以下的有 11 题,这些试题不能反映出学生能力的差别,应摒弃或修
16、改;98 级试卷区分度差的试题是第一问答题的第 5 小题,应摒弃或修改,其余试题区分度皆可;99 级试卷区分度差的试题有 4 小题,应摒弃或修改。综合难度和区分度两个指标,97级试卷好试题共 9 题,适用试题 1 题,程度适中区分度差,试题 9 题,没有差题,因此 97 级试卷试题质量良好,在考虑知识点的基础上,若能减少简单题的比重,质量将更为完善。98 级试卷好试题有 8 题,适用试题和程度适中区分度差试题仅 1 题,好试题的经验值得以后出题借鉴,98 级试卷只有主观性试题,若能增加客观性试验,考察学生基本概念的掌握情况,将更符合教学大纲的要求。99 级试卷好试题共 18 例,适用试题、程度
17、适中区分度差试题及差试题各 1 题,整张试卷相对来说对学生知识综合运用能力要求更高。 3.6 加强学生能力的培养。97 级试卷题型符合教学大纲,分析其各型的得失分,满分 10 分的词解释平均得分 8.1 分,满分 20 分的选择题平均得分 15.3 分,满分 70 分的问答题平均得分 52.3 分,学生对基本概念掌握良好,对基本知识的简单应用尚可以,综合应用能力相对稍薄弱,可看出学生的综合分析能力欠佳,对所学知识不能灵活应用、融会贯通。98、99 级试卷题型全部为问答题,学生成绩均较 97 级差,也说明了学生在综合应用方面存在缺陷。故在教学工作中应注重培养学生对知识的理解掌握、综合分析能力。对
18、此,可以采用在教学中结合实际问题的方法,鼓励学生积极思考,主动学习,自主分析问题。同时,可根据课程特征,运用多样化的教学方法,如采用讨论法、实习作业法等提高 教学效果。并且,在教学工作中,强调平时的作业,使学生把所学内容加深理解和进一步地得到巩固。 3.7 科学化命题。考试是评价教与学效果的重要指标,对教学工作和学生的学习起着调控和指导作用。而命题的科学性、合理性则决定了这一指标的准确度。一套好的试题应该符合教学大纲的内容,具有合适的难度和较好的区分度,较好的信度和覆盖度,能够客观、准确地反映学生的真实水平。故教师应掌握命题技巧,制定命题计划,建立统一的试题评价体系,综合评价学生的能力。 参考文献 1 洪汝渝.试卷分析.渝州大学学报,1997,14(3):103-106. 2 毛春元.试卷质量的统计分析.淮海工学院学报,1999,8(B12):86-88. 3 张忠伟.统计学原理,杭州:浙江教育出版社,1999,98-104. 4 姜常胜.高等医学院校实用教务管理手册,上海:上海中医学院出版社,1993,58-59.