1、我国小学六年级学生学业成就调查报告中央教育科学研究所中小学生学业成就调查研究课题组*简介:本报告系国家哲学社会科学基金“十一五”规划(教育类)2006 年度国家重点课题“中小学生学业成就调查研究”(课题批准号:AHA060008)的研究成果。本课题由基础教育研究中心、课程教学研究中心、教育督导评估研究中心等多个部门的研究人员参与研究。课题研究成果被全国教育科学规划办公室鉴定为优秀等级。一、调查背景近年来,关注教育质量、科学测评学生学业成就已成为世界教育发展的一大趋势。目前国际上比较有影响的学生学业成就调查主要是 IEA 和 OECD 开展的国际比较研究。此外,一些发达国家定期组织进行的本国学生
2、学业成就调查,如美国的 NAEP、英国的 APU、日本的学力调查等都已形成独立的学业成就测评体系,在促进本国或区域教育质量提高方面发挥了独特作用。我国目前已开始重视和加强推进这方面的工作,并进行了一些较大范围的学生学业成就调查,如教育部基础教育质量监测中心的“基础教育质量监测”、北京市教委的“北京市义务教育教学质量监控与评价”以及联合国儿基会的“东亚太平洋地区学生学业评价”等。在世界各国普遍重视并探索和进行宏观教育质量监控的背景下,对我国义务教育小学阶段学生的学业成就状况进行调查,全面、客观、真实地了解和把握我国小学教育的质量,对于推动基础教育课程改革的深化、改进和提高教育教学水平、提高教育质
3、量、促进教育公平和教育均衡发展具有非常重要的意义。二、调查内容与方法本次调查研究的主要内容是:(1)研制适合我国国情的小学六年级学生语文阅读、数学问题解决、科学、品德与社会四个学科学业成就评价的指标体系和测评工具;(2)在全国范围内进行小学六年级学生语文阅读、数学问题解决、科学、品德与社会学科学业成就水平的调查研究;(3)对影响小学六年级学生学业成就的相关因素进行分析,为学科教学和学生学习提供反馈,促进教学改进和学生学习的提高。*课题主持人:田慧生;核心成员:孙智昌、陈琴、刘芳、蔡永红、任春荣、胡军、陈晓东、杨莉娟、张鹏举、马晓强、马延伟、杨宝山、江明、冯新瑞、王晓霞、李嘉骏等。本次调查采用标
4、准参照评价模式,以全日制义务教育课程标准(实验稿)为依据,根据 SOLO 分类理论关于学习结果的分类来编制语文、数学、科学、品德与社会四个学科的试卷。各学科均以课程标准中对学生在学科内容和基本能力两个维度的发展要求作为依据来确定评价的基本框架(见表 1),编制各科试卷。各学科试题中体现学生单一结构、多元结构和关联结构的题目比例约为 221。除四科试卷外,本次调查还进行了学生问卷和学校问卷的调查。表 1 小学六年级各学科评价的基本框架语文 数学 科学 品德与社会内容维度 字词句段篇章数与代数空间与图形统计与概率综合运用生命世界物质世界地球宇宙世界公民与社会健康与安全历史与文化地理与环境能力维度
5、认读理解运用知识技能数学思考解决问题呈现应用探究认知理解运用本次调查采用分层随机抽样的方法从全国东中西部 8 省共 31 个区县抽取了 18 600 名小学六年级学生,最终参与测试的学生为 18 226 人。其中,城市学生占 68.5%,农村学生占31.5%;男生占 46.6%,女生占 53.4%。每名学生都参加语文、数学、科学、品德与社会四个学科的测试。学生问卷的测试对象为所有参与学科测试的学生,学校问卷的测试对象为所有参与学科测试的学校,共 372 所。本次调查的施测时间为 2009 年 5 月。各科试卷和问卷的回收率均达到了 90%以上。本次调查运用项目反应理论(IRT)计算试卷参数和学
6、生能力参数。在项目反应理论指导下的整卷层面的质量分析以单维单参数计分模型(RASCH 模型)为基础,对测试的质量进行分析。试卷分析的指标主要包括信度和效度、题目难度、区分度、题目特征参数等。调查结果显示,语文、数学、科学、品德与社会四门学科的测试都具有较好的信度和效度,各学科之间的相关系数也达到了非常显著的水平。各学科题目的难度分布较广,题目的区分度比较理想,各学科题目特征曲线的形态都符合项目反应理论(IRT)模型,表现出能力越高的学生,答对难度大题目的概率越高。本次调查依据学生对课程标准的掌握情况将学生分为优秀、良好、合格、基本合格和不合格五种水平。不合格水平是指学生未达到课程标准所规定的基
7、本要求;基本合格水平是指学生基本掌握学科所要求的基本知识和基本技能,但在某些知识和技能方面仍有待提高;合格水平是指学生比较全面地掌握学科基本知识和基本技能,具有基本的学科能力;良好水平是指学生能综合运用所学知识和技能来分析和解决问题;优秀水平是指学生在良好水平的基础上能够创造性地思考和解决问题。三、学生各科学业成就状况分析(一)学生各科学业成就的总体状况1 学生在语文、数学、科学、品德与社会四个学科的学习都基本达到了课程标准的要求调查结果表明,学生在语文、数学、科学、品德与社会四门学科的学习达到合格及以上水平的都超过了 60%,而达到基本合格及以上水平的学生则都超过了 90%,其中,数学、科学
8、、品德与社会三门学科更是有 95%以上的学生达到了基本合格及以上水平,不合格学生所占比例均不到 10%。这表明,小学六年级学生在语文、数学、科学、品德与社会四门学科的学习都基本达到了课程标准的要求。2 学生的数学合格率最高,语文最低本次调查发现,在四门学科中,学生的数学合格率最高,科学、品德与社会居中,语文最低。从图 1 中可以看到,数学达到合格及以上水平的学生最多,占 783% ,其次是科学、品德与社会,分别为 71%和 673% ,语文最少,仅为 628% 。有近 30%学生的语文成绩是处于基本合格水平,即对一些基本知识和技能的掌握不足。因此,关注学生的母语学习,提高学生的语文素养应当引起
9、全社会的普遍重视。图 1 学生在四门学科上的学业水平分布3 具有较高综合解决问题能力的学生不到三分之一学生灵活地运用学科知识解决现实生活问题的能力是新课标中着重强调的一个重要方面。本次调查发现,达到良好及以上水平即能够综合运用学科基本知识和技能来分析和解决问题的学生所占比例在四门学科上均不到 30%(见图 2)。以科学学科为例,只有约三分之一的学生能够准确读出用温度计分别测到的 4 种液体的温度,并按由低到高的顺序排出来。在品德与社会学科,只有 31%的学生能够灵活地依据图示上呈现的早晨太阳所在的位置来进行实际的学校方位的判断,并进而正确地解决问题,寻找到最佳路线。因此,关注学生综合解决问题能
10、力的发展是新课程在修订过程中应该进一步强调并在具体的课程标准中加以明确的一个重要方面。图 2 各学科达到良好及以上水平的学生比例4 东部地区学生的学业成就水平明显高于中西部地区,城市高于农村本次调查表明,东部地区学生学业成就水平明显高于中西部地区,两者间的差异非常显著(F=113.014,P=0.0000.05)。在相同地区,农村学生的学业成就水平比城市学生低 0.735 个标准分(标准误=0.335,p0.05),在科学学科上男生的成绩高于女生(Z=-3.86,P=.0000.05),而在阅读、品德与社会学科上女生的成绩则显著高于男生(Z=-11.48,P=.0000.05;Z=-2.19,
11、P=.0280.05)。但进一步通过统计效力检验(effect size)我们发现,男生和女生在语文、数学、科学、品德与社会四门学科上的学业成就水平均无显著差异。从图 5 我们可以很清晰地看到,在数学、科学、品德与社会三门学科上达到合格及以上水平的男生和女生比例基本相当,在语文学科上虽然达到合格及以上水平的女生则略多于男生,表明女生的语文阅读能力略高于男生,但两者间的差异并不显著。图 5 达到合格及以上水平学生的性别差异比较(二)学生在各个学科的学业成就状况分析依据课程标准和各学科的测试框架,在对学生学业成就的总体状况进行分析的基础上,我们进一步从内容和能力两个维度对学生在各个学科的学业成就状
12、况进行了分析,主要是通过对学生在不同领域的得分率进行比较以及在一些典型测试题上的表现来了解学生各个学科的学习状况。1 语文学科语文学科学业成就测试框架的内容领域主要包括“字词”、“句段”、“篇章”三个部分,能力领域主要包括“认读”、“理解”、“运用”三个方面。学生在不同领域的得分率见表 2。表 2 学生语文学科各领域的得分率(%)内容领域 能力领域字词 句段 篇章 认读 理解 运用得分率 81 59 63 82 76 27(1)学生对字词内容的掌握明显好于句段和篇章。从内容领域来看,学生得分率最高的是字词,句段和篇章的得分率相对较低。这表明学生对于字词内容的掌握要明显好于句段与篇章。如,绝大多
13、数学生“能够准确地理解词语在语言环境中的恰当意义”、“能够准确地理解成语特定含义”,但是“能够从文中准确地提取相关信息”、“能够准确地理解诗歌的主要内容”以及“能够在语境中准确地辨析多音多义字的读音”的学生仅为三分之二左右,而“能够准确地理解并用自己的语言概述文章的主要内容”以及“能够体会并用自己的语言评价表达效果”的学生则不到十分之一。(2)学生具备了基本的认读和理解能力,运用能力有待提高。从能力领域来看,学生在认读和理解方面的得分率最高,而在运用方面的得分率较低,其差异达到了非常显著的水平。这表明学生已经具备了基本的认读和理解能力,但在感知和理解的基础上进行判断、推理和运用的能力还有待提高
14、。这一特点也体现在不同能力组学生所能完成的任务上。基本合格组的学生能够进行词句的理解和运用以及在篇章中根据需要搜集信息,如“准确地理解关联词”、“准确理解词语在语言环境中的恰当意义”等;合格组学生能够在篇章语境下提取并整合信息以及理解文章的主要内容,如“从说文明中准确提取并整合相关信息”、“准确理解诗歌的主要内容”等;而在篇章语境下的理解和运用,如“能够准确判断、推理并用自己的语言表达”则是优秀组学生才能完成的任务。2 数学学科数学学科学业成就测试框架的内容领域主要包括“数与代数”、“空间与图形”、“统计与概率”、“综合运用”四个部分,能力领域主要包括“知识技能”、“数学思考”、“解决问题”三
15、个部分。学生在不同领域的得分率见表 3。表 3 学生数学学科各领域的得分率(%)内容领域 能力领域数与代数 空 间 与 图 形 统 计 与 概 率 综合应用 知 识 技 能 数 学 思 考 解 决 问 题得分率 81 74 66 65 80 78 64(1)学生对数与代数、空间与图形内容的掌握要好于统计与概率以及综合运用。从内容领域来看,学生得分率最高的是“数与代数”和“空间与图形”领域,而“统计与概率”、“综合应用”方面的得分相对低一些。这表明学生对“数与代数”、“空间与图形”的掌握好于“统计与概率”以及“综合运用”。这一特点也反映在不同能力组学生所能完成的具体任务上。如,“从时间路程图中间
16、接获得关于速度的信息”、“从时间路程图中获得正确的隐藏信息”、“根据统计图中的数量关系进行计算等任务”要在良好及以上组的学生才能完成,“计算一个半圆的周长”也是合格及以上组学生才能完成的。(2)学生具备了基本的知识技能和数学思考能力,但运用数学规律解决问题的能力仍有待提高。从能力领域来看,学生在“知识技能”和“数学思考”能力方面的得分率要明显高于“解决问题”能力,学生发现数学规律、进行数学推理的能力仍有待提高。表现在“根据发现的规律进行推断”要到合格及以上水平的学生才能够完成,而“用分数大小的比较进行推理”要到良好及以上水平的学生才能够完成。又如,有 92%的学生可以根据等量关系求出未知的数,
17、但只有 61%的学生能够运用方程解决问题;有 82%的学生可以判断“满分不为 100 的考试中的及格情况”这样的计算问题,但只有 66%的学生能够很好地解决与小数有关的实际问题。3 科学学科科学学科学业成就测试框架的内容领域主要包括“生命世界”、“物质世界”、“地球宇宙”三个部分,能力领域主要包括“呈现”、“应用”和“探究”三个部分。学生在不同领域的得分率见表 4。表 4 学生科学学科各领域的得分率(%)内容领域 能力领域生命世界 物质世界 地球宇宙 呈现 应用 探究得分率 69 63 68 68 71 60(1)学生对生命、物质和地球宇宙三大领域内容的掌握水平基本相当。从内容领域来看,学生在
18、“生命世界”、“地球宇宙”领域的得分率略高于“物质世界”,但三者间的差异并不显著。这表明学生对于生命世界、物质世界和地球宇宙三个领域内容的掌握水平基本相当。但同时,相比较而言,学生对生命健康的关注程度和卫生常识的掌握比较理想。有八成多的学生都能识别出大量吸烟最可能增加人患支气管炎的风险;八成学生能意识到饮用了被污染的水最有可能引起腹泻;七成多的学生能正确辨别出子女从父母那里得到的遗传特征。由此可见,开展科学教育有利于儿童从小养成良好的卫生和生活习惯,注重健康生活,尊重生命,热爱生命,从而实现人的全面发展。(2)学生具备了一定的观察、分析和解决问题的能力,但在综合运用多种技能解决较复杂的现实问题
19、的能力仍有待提高。从能力领域来看,学生在“呈现”和“应用”方面的得分率要明显高于探究,这表明学生已经具有了一定的观察事物、识读图表、分析数据、利用科学知识和原理解决简单的科学问题的能力,但在综合运用多种知识和技能来分析和解决较复杂的现实问题的能力仍有待提高。如,有 86%的学生能通过观察图例,找出完全变态和不完全变态生物之间的主要区别;七成学生能观察地图,判断出甲乙丙之间的位置关系;近六成学生能识读折线图找出某种金属熔化的时间与温度的关系;75%的学生能正确使用温度计进行测量和读数。但是,在识别哪种常见蔬菜食用部分为植物的根时,只有 56%的学生回答正确,虽然学生会识别课堂上展示的典型植物六大
20、器官的特征和功能,但在联系生活实际时却不能充分利用所学的有关根、茎的关系特征去识别;只有半数学生能正确选择使汽水尽快变凉的最有效的方法;近半数学生不能辨别出生活实际中帮助减少摩擦的做法,其中近两成学生误认为用干布盖住饮料瓶来拧开是减少摩擦的做法;有 34%的学生选择了金属而不是塑料用做电源开关盒的材料,不能利用所学的金属适合做导电材料、塑料等非金属适合做绝缘材料作出正确选择。只有三成半的学生能准确读出用温度计分别测到的 4 种液体的温度,并能按由低到高的顺序排出来;近半数的学生不能通过分析几组实验数据作出相对复杂的推论,不能分析食物链中 3 种以上生物之间的数量变化关系。4 品德与社会学科品德
21、与社会学科学业成就测试框架的内容领域主要包括“公民与社会”、“健康与安全”、“历史与文化”、“地理与环境”四个部分,能力领域主要包括“认知”、“理解”、“运用”三个部分。学生在不同领域的得分率见表 5。表 5 学生品德与社会学科各领域的得分率(%)内容领域 能力领域公 民 与 社 会 健 康 与 安 全 历 史 与 文 化 地 理 与 环 境 认知 理解 运用得分率 64 65 64 59 76 57 59(1)学生对公民与社会、健康与安全、历史与文化内容的掌握要好于地理与环境部分。从内容领域来看,学生在公民与社会、健康与安全、历史与文化三个领域的平均得分相对高一些,这表明学生已经初步具备了社
22、会规则意识、民主参与意识,了解相关的法律知识,掌握维护自身健康与安全的知识,了解具有代表性的世界历史文化、历史知识和重要的历史事件,能对历史事件进行分析与判断等。而在地理与环境领域,学生的能力水平相对低一些,如掌握基本的一些地理知识与技能,理解中国和世界一些基本的地理概况,以及自然环境与人们生活的关系,理解人类面临的一些环境、资源等问题。(2)学生对于社会性基本知识和常识、基本技能的了解和掌握较好,具有初步的分析和思考问题的能力,但在思维的广度和深度上有待拓展,灵活、综合运用所学知识解决问题的能力仍有待加强。从能力领域来看,学生在认知能力方面的得分率要明显高于理解和运用能力,其差异达到了非常显
23、著的水平。这表明,绝大多数学生对基本的社会性知识和基本技能如国际知识、法律知识、历史史实、地理常识、生活技能等方面的了解与掌握较为理想。但在理解和运用方面,发现学生普遍对于与自己生活经验切近的试题(如班级中的民主规则、保质期问题、安全技能、气候变暖的后果),或事物间关系较为直接、单一的试题(如海拔与气温的关系、气候与农作物的关系等),或呈现有图和表的试题(如从统计图获取电话发展的相关信息,从统计图获取吸烟与健康关系的相关信息)解答的正确率能达到 60%以上;对那些略为超越了自己现实生活或目前经验的试题(如地震与逃生方式、居住方式与环境的关系),凸显事物间内在逻辑关系较为复杂、多元、抽象的试题(
24、如公元前后的概念理解、人类与自然的关系、价格变化与供求间的关系、气候与人类活动的关系),需要灵活地、综合地运用多种知识和多种能力来解决问题的试题(如结合现实情境进行的方位辨别、两难情境中的自护选择、从信息中提取有效信息进行未来预测等)得分率则均低于 60%。这表明学生具有利用生活经验和借助图表信息对事物及其现象进行初步分析和思考的能力,但在思维的广度和深度上有待提升,灵活运用所学知识,综合解决问题方面的能力和意识有待加强。四、影响学生学业成就因素的多水平模型分析关于影响学生学业成就水平的因素,本次调查主要分析了学生家庭、学生学习、学校教学和学校管理四个方面。其中,学生家庭方面包括家庭物质文化条
25、件、父母受教育程度、流动人口、家校距离和亲子互动五个方面;学生学习方面包括学生的学习兴趣和投入、自主学习、自我效能感以及学习负担四个方面;学校教学方面包括教师的教学方式、课时安排、人际关系三个方面;学校管理方面包括校长队伍素质、教师队伍素质以及教研活动等。本次调查采用了多水平回归模型对影响学生学业成就的因素进行了检验。我们以学生四门学科的成绩总和为因变量,引入学生家庭、学生学习、学校教学和学校管理 4 组变量进行分析,产生了以下 5 个模型。零模型:仅加入一个常数项,计算学生、学校和地区水平的初始方差。模型 1:在零模型基础上,加入个体家庭变量模型 2:在零模型基础上,加入学生个体的学习变量。
26、模型 3:在零模型基础上,加入学校教育教学及管理等变量。完全模型:各组变量中显著的变量同时进入模型参与运算,称为完全模型。从表 6 中我们可以看到,在零模型中,38.73%的学生成绩方差可以归因于学校水平的方差,21.53%的学生成绩方差可以归因于学校所在县区的差异,而学生水平的跨级相关达到了 39.75%,这说明学生成绩的差异更多是由于个体和家庭方面的差异引起的。在模型 1中,个体背景及家庭支持解释了学校间差异的 13.76%,解释了地区差异的 30.22%,解释了总方差的 15.28%。在模型 2 中,个体的学习解释了学校间差异的 17.29%,解释了地区差异的 34.21%,解释了总方差
27、的 21.00%。在模型 3 中,学校水平变量相比个体水平变量对学校方差的解释力更高一些,达到 21.12%,但是对区县水平的方差解释力则低一些,为10.89%,这说明学生家庭以及个体的投入等变量解释了更多的地区差异。同时,从表中可以看出,对于个体水平的方差,个体背景及家庭支持以及学校教育有关的变量分别解释了8.66%和 8.36%,个体参与、投入以及态度解释的比例达到了 17.47%,说明个体水平的差异更多是个体自身因素引起的。表 6 多水平模型解释力零模型 模型 1 模型 2 模型 3 完全模型个体水平跨级相关 39.75 42.85 41.53 42.28 43.27学校水平跨级相关 3
28、8.73 39.42 40.55 35.46 36.40地区水平跨级相关 21.53 17.73 17.93 22.27 20.33个体水平方差被解释的比例 8.66 17.47 8.36 22.67学校水平方差被解释的比例 13.76 17.29 21.12 33.24地区水平方差被解释的比例 30.22 34.21 10.89 32.93总方差被解释的比例 15.28 21.00 13.84 28.98完全模型是在前四个模型的基础上,将学生家庭、学生学习、学校教学和学校管理 4组变量中显著的变量同时进入模型中参与运算。结果表明,学生个体水平的跨级相关为43.27%,学校水平的跨级相关为 3
29、6.40%,地区水平的跨级相关为 20.33%。这表明,学生成绩的差异更多的是由于个体和家庭方面的差异所引起的。学生个体水平、学校水平以及地区水平方差被解释的比例分别为 22.67%、33.24%和 32.93%,总方差被解释的比例达到28.98%。下面我们分别对学生家庭、学生学习、学校教学和学校管理四个方面的因素对学生学业成就的影响进行了具体分析。(一)学生家庭因素分析本次调查表明,在学生家庭方面,对学生的学业成就有显著影响的因素有家庭物质文化条件、父母受教育程度、家校距离以及亲子互动。学生是否为留守儿童或是进城务工随迁子女,以及城乡、地区等变量对学业成就的影响被其他因素的效应所解释。1 家
30、庭物质文化条件,包括拥有的图书、学习空间、计算机等对学生的学业成就有显著影响。具体来说,在控制其他背景变量相同的情况下,家庭拥有图书为 26100 册的学生学业成就水平比拥有图书 10 册以下的学生高 0.17 分,这一差异达到了统计显著水平(=0.17,se=0.08,t=2.125,p0.05);拥有图书为 101200 册的学生学业成就水平显著高于拥有图书 10 册以下的学生(=0.22,se=0.09,t=2.44,p0.05);拥有图书多于 200 册的学生学业成就水平显著高于拥有图书 10 册以下的学生(=0.41,se=0.10,t=4.1,p0.05)。而家里拥有 1125 册
31、图书的学生和图书在 10 册以下的学生之间没有显著差异。而家庭其他的一些物质条件,如专门的学习空间、计算机、各类书籍等也对学生的学业成就产生显著影响,学生家庭在该变量上每增加 1 分,学生的学业成就水平就增加 0.07 分(=0.07,se=0.01,t=7.0,p0.05)。2 父母受教育程度对学生的学业成就有显著影响。具体来说,在控制其他背景变量相同的情况下,父母受教育程度为高中(=0.11,se=0.05,t=2.2,p0.05)、专科(=0.26,se=0.08,t=3.25,p0.05)、大学(=0.54,se=0.08,t=6.75,p0.05)以及研究生(=0.64,se=0.1
32、3,t=4.92,p0.05)的学生学业成就水平显著高于父母为初中文化程度的学生。3 家校距离是影响学生学业成就水平的一个显著变量。具体来说,在其他背景变量相同的条件下,上学路上花费时间在 30 分钟以下学生的学业成就水平显著高于花费时间为30 分钟到 1 小时(=-0.12,se=0.08,t=1.5,p0.05)和 1 小时以上(=-0.52,se=0.19,t=5.7,p0.05)的学生。4 亲子互动的频率对学生学业成就有显著影响。具体来说,在控制其他背景变量相同的情况下,那些亲子间能够“经常”谈论学校发生事情的学生学业成就水平显著高于“从不这样”(=-0.35,se=0.08,t=4.30,p0.05)、“很少这样”(=-0.10,se=0.06,t=1.67,p0.05)或者“有时这样”(=-0.12,se=0.05,t=2.40,p0.05)的学生。而家人辅导功课频率高的学生学业成就水平显著低于频率低的学生,这主要是因为家长之所以辅导学生一个非常重要的原因可能是学生