新课程实施中的教育评价改革.ppt

上传人:ga****84 文档编号:350042 上传时间:2018-09-25 格式:PPT 页数:74 大小:1.24MB
下载 相关 举报
新课程实施中的教育评价改革.ppt_第1页
第1页 / 共74页
新课程实施中的教育评价改革.ppt_第2页
第2页 / 共74页
新课程实施中的教育评价改革.ppt_第3页
第3页 / 共74页
新课程实施中的教育评价改革.ppt_第4页
第4页 / 共74页
新课程实施中的教育评价改革.ppt_第5页
第5页 / 共74页
点击查看更多>>
资源描述

1、新课程背景下的中考命题,赵德成北京师范大学教育管理学院,10087558802990,,专题一,新课程的实施与反思,基础教育课程改革的组织与推进,2001/72002/7:课程改革在全国38个国家级实验区正式启动。2002年秋季,3个新增国家级实验区和500多个省级实验区的一年级进入课改,全国实验规模达到同年级学生的1015。2005年秋季,中小学阶段所有起始年级的学生原则上已都进入新课程。,在青海治多县藏民居住地区,一位中学校长跟我说了心里话。他说,党的教育方针是为了培养接班人,培养一个合格的文化人和劳动者,现在培养的接班人他们又没有多少文化,又没有多少生存技能,这就是我们现在教育培养出来的

2、“四不像”。,我这样亲历西部教育(尚立富),在青海,牧民孩子上学大多是被逼的。假如今年这个村有10个适龄儿童,就开始抽签。有些家长宁可交罚款,也不愿让自己的孩子上学,因为他们从上学的路上看不到希望,孩子学不到看得见的技术。,国际学生评价项目(PISA),PISA在32个国家中抽选26.5万个15岁青少年,以纸笔测验衡量这群初中学生的阅读能力、数学能力和科学能力,希望了解即将完成义务教育的各国初中学生,是否具备了未来生活所需的知识与技能,并为终身学习奠定良好基础。,PISA发现了什么?,2000年举行的第一轮测试结果表明,15岁学生的阅读能力,芬兰位居榜首,日本、韩国在数学和科学方面也位居首位。

3、所有这三个国家学生之间的差距也是最小。中国没有加入PISA项目,但参加了1999年的PISA项目预试,中央教科所协助在北京市郊县选取了2000名15岁高中生作为样本进行了测试,结果发现中国学生表现不理想。,新课程新在哪里?,强调形成积极主动的学习态度,使获得知识与技能的过程同时成为学会学习和形成正确价值观的过程。,司马光,拿一个吸管一样的长棍让那个小朋友先呼吸着,再想其它办法去救它。你是个善良且充满智慧的孩子,可是要找一个你说的木棍可能来不及了。找来一块大木板,让那个小朋友趴上去浮起来。你真爱动脑筋,知道的知识也不少,是个聪明的孩子。可是到哪儿去找这么合适的一块木板呢?还有水缸是不是足够大呢?

4、都存在问题。谁还有别的方法?,司马光,找个皮管子,用嘴一吸水就吸出来了,我爸爸浇菜就这样做。这样做小朋友也得救了。你真是个细心的孩子,这么善于观察,现在又学会应用了,真了不起。可是要在当时找到我们所需要的皮管子可能也来不及了。同学们的方法都不错,可在当时的情况下,还是司马光的方法最便捷,最能解救那个落水儿童。,一道中考语文题,同学们,你们有没有意识到我们的母亲已经人到中年,请你写一段文字说说母亲人到中年发生的变化。请你写一段母亲生日晚宴上的致辞。请你给同学们介绍一本关于母亲的书。,新课程新在哪里?,加强课程内容与学生生活以及现代社会的联系,关注学生的学习兴趣和经验,精选终身学习必备的基础知识和

5、技能。,分数、百分数应用题训练,没来的非洲国家占国家总数的几分之几?来了的非洲国家占国家总数的几分之几?没来的国家占来了的国家的几分之几?来了的国家占没来的国家的几分之几?没来的国家比来了的国家少几分之几?来的国家比没有来的国家多几分之几?,你能提出什么样的问题?,某学校师生到距学校30千米的郊外去春游,一部分同学骑自行车先走,过了1.5小时,其余的人乘汽车出发,结果他们同时到达。已知汽车的速度是自行车速度的4倍,求两种车的速度。,一道中考数学题,一道中考物理题,简答题:流体压强的大小有什么特点?分析题:有的汽车开得快就会发飘,为什么?请用物理学原理加以解释。,专题二,如何理解教育评价,为什么

6、要讨论这个基本问题?,我国教师培训中有教育学、心理学、教材教法(教学论)等课程,但很少专门开设教育评价课程。很多人将评价与表扬、奖赏、说服教育等混淆在一起,使评价研究游离在学科之外。在义务教育阶段,很多实验区在评价改革中进展不大,与他们对教育评价的理解有关。,三种经典的教育评价模式,Tyler的行为目标评价模式Stufflebeam的CIPP评价模式Scriven的目标游离评价模式,1.行为目标评价模式,由Ralph W. Tyler在八年研究期间(1933-1941)提出,所以也被称为泰勒评价模式。这是世界上最早的评价模式,也是最有影响的评价模式之一。,Ralph W. Tyler (190

7、2-1994),泰勒的观点,所谓教育,就是使人的行为方式发生变化与改进的过程。这些行为方式的种种变化,就是教育目标。教育评价就是考察这些教育目标实际上达到什么程度的手段。,行为目标评价模式的实施步骤,确立宽泛的目的或目标;对目的或目标分类或排序;以可观察的术语界定目标;寻找证明目标实现的情景;开发或选择测量与评价方法;收集数据资料;把数据资料与既定目标相对比。,体验泰勒模式,以中学生口语交际能力评价为例,明确教育教学目标,确立宽泛的目的或目标;对目的或目标分类或排序。,认真阅读基础教育课程改革纲要(试行)与语文课程标准(实验稿)。具有日常口语交际的基本能力,在各种交际活动中,学会倾听,表达与交

8、流,初步学会文明地进行人际沟通和社会交往,发展合作精神 。,将目标具体化,以可观察的术语界定目标。,能注意对象和场合,学习文明得体地进行交流。耐心专注地倾听,能根据对方的话语、表情、手势等,理解对方的观点和意图。在交流过程中,能根据需要调整自己的表达内容和方式,不断提高应对能力。,设计评价情境与方法,寻找证明目标实现的情景;开发或选择测量与评价方法;,我们每个人都有自己心底的秘密,今天晚上回家后,请你和你的父母说说你心底的秘密。你会如何说呢?请你把它写下来。,你怎样看待爱因斯坦对当时学校教育的不满?如果有同学对我校某些教育方式也不满意,你觉得怎样做合适?请同学们每五人分成一组,就上述问题进行小

9、组讨论。,分析与评判,收集数据资料。把数据资料与既定目标相对比。,如果发现数据资料与目标不相一致,可以调整教学以改进其效果。在调整之后,重复实施评价。,2.CIPP评价模式,它是一种以决策为中心的评价模式。教育评价不仅应该关心目标,还应关心目标是怎样筛选与达成的,评价应从以目标为中心转向以决策为中心。斯塔佛尔比姆(L.D.Stufflebeam,1966)Context, Input, Process, Product既要关注结果,还要关注过程。,3.目标游离评价模式,由斯克里芬在70年代提出。他指出,实际进行的教育活动除了收到预期的效果外,还会产生许多意想不到的 “非期望效应”。教育评价必须

10、考察教育计划或方案的实际效果,而不仅仅是预期效果。,专题三,什么样的评价是好的评价,元评价的主要指标,实效效度信度难度区分度公平,1.评价的实效,效果:评价是否真正发挥了促进学生成长、教师发展、学校教育质量不断提高的作用。效率:评价是否需要付出很多人力、物力和财力,这些付出的回报和实际效率如何。,“在一次研讨会上,我问在座的历史老师,如果氏族公社在打猎过程中没有抓到足够的猎物,不够吃了,他们会如何分配这些仅有的食物?没有人回答我。可是当我换了个提问的方式,问他们氏族公社有什么特点时,他们却都能答出来。”,问题出在哪?,一个科学课标组专家经历的真人真事,关于新航路开辟的历史表现性评价题目,假设现

11、在是2024年,也就是30年后的将来。那时候地球已相当拥挤。食物和能源(如石油)都出现短缺。美国要送一批航天员到宇宙中的其他地方去探险,以寻找新的资源。科学家们认为,在某个遥远的星球上可能会存在丰富的资源。而且,他们还有证据表明有种生物生活在那个星球上,在那里“安居乐业”,但这种生物到底是何面目,科学家们也无从知晓。你现在的身份是一名探险方面的资深专家,总统请你给她的策划团队提出建议。她发现,航天员要做的事情与历史上欧洲探险家(如哥伦布)开辟新航线有某些相似之处。你的历史知识将会对即将举行的宇宙探险有帮助。,为准备给总统提建议,请回答下面问题:,登陆其他星球和历史上欧洲探险家(如哥伦布)去新大

12、陆有哪些相同之处?写出至少两个相同点,但如果你想起的不只两个,可以多写。要求援引具体的历史事件支持你的观点。登陆其他星球和开辟新航路有哪些不同之处?写出至少两个不同点,但如果你想起的不只两个,可以多写。要求援引具体的历史事件支持你的观点。探险者应该尽力完成的主要目标和好事是什么?写出两个人类追求的目标和两个可以使其他星球受益的目标,但如果你想到的不只两个,可以多写。,为准备给总统提建议,请回答下面问题:,探险者要尽力避免或克服哪些可能的问题?写出两个人类可能遇到的问题和两个其他星球会遇到的问题,但如果你想到的不只两个,可以多写。如果可以的话,请你援引具体的历史事件支持你的观点。在制定计划时,还

13、有哪些值得考虑的主意?根据你对哥伦布及其他探险家的了解,你认为要是这次宇宙探险尽可能成功,总统和航天员应该计划和实际做些什么?,一道高中历史期末测验题,评分标准,对历史事件的理解、掌握和运用课外知识的运用文采和论证方法知识与观点错误的处理,指一个测验或量表实际能测出其所要测的特质的程度。指测量的准确性与有效性,也就是测量的结果与所要测的目标之间相符合的程度。指对于一个既定的目标,在做出推论和提供解释过程中测量的有用性程度。,2.效度,几种不同的理解,指一个测验实际测到的内容与所要测量的内容之间的吻合程度。估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的领域。这种效度主要应用于

14、成就测验,也适合于某些用于选拔和分类的职业测验。,内容效度及其估计方法,在初中阶段学习过的古诗中,你最喜欢其中的哪一首,请你把它写下来。古诗文积累:沉舟侧畔千帆过, 。无可奈何花落去, 。长风破浪会有时, 。过零丁洋中直抒胸臆,表明了作者文天祥以死明志的决心的两句诗是:复习旧知识,就会有新发现和新知识。论语中阐述这一道理的名句是:,古诗文评价,指一个测验实际测到所要测量的理论结构或特质的程度。结构效度的估计方法:测验内部寻找证据法测验之间寻找证据法考察测验的实证效度法多种特质多种方法矩阵法,结构效度及其估计方法,这些评价任务的结构效度如何?,“这么小的孩子就追星”如何用最漂亮的字体和富有创意的

15、构图,为青春心语集锦一书设计一个较精美的封面,请你不妨试试!相信你是最棒的。告诉大家远离毒品的宣传画春江花月夜与审美情趣,有人设想通过建造地下城来解决交通拥堵问题。他打开了如下网页,希望了解有无该方面的信息动态。除使用“站内搜索”引擎外,还可通过哪个链接来获取信息?请用圆圈标出应该点击的那一链接。,如何审查题目的结构效度?,找几个学科评价专家进行审查。找几个学生进行预试并与之进行讨论。完成这个评价任务需要什么知识、技能、素质或能力?完成这个任务关键靠什么?参加考试的学生主要差别体现在什么方面?能深入刻画我们要评价的特质吗?,指一个测验有效预测被试未来表现的程度。估计一个测验的预测效度要选择一个

16、效标,然后计算被试在原测验和效标测验上的成绩的相关。让高中教师参与中考命题,是保证预测效度的一个重要手段。,预测效度及其估计方法,指测量结果的稳定性程度,即,如果反复测量或评价某一特质,则多次测量的结果间的一致性程度叫信度。,3.信度,指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等同于同一组被试在两次测验上所得分数的积差相关。使用条件:所测量的特质必须是稳定的。遗忘与练习的效果基本上相互抵消。两次测量间隔期间,被试没有获得相关的学习与训练。,重测信度的估计方法,指多个评分者给同一批被试的答卷(反应)进行评分的一致性程度。当评分者为两人时,评分者信度等于两个评分者给同一被试分数

17、的相关系数(积差相关或等级相关)。当评分者人数多于两个时,可用肯德尔和谐系数进行估计。,评分者一致性信度的估计方法,情况 A :完美一致性(r=1.0),评分员甲,评分员乙, , , , , ,情况 B :高度一致性(r=0.8),评分员甲,评分员乙, ,情况C :低一致性(r=0.35),评分员甲,评分员乙,明确的、操作化的评分标准严格的评分者培训保证评分者的积极性,提高评分者一致性信度的方法,指用同两个平行的测验或量表对同一组被试施测所得结果的一致性程度,其大小等同于同一组被试在两份测验上所得分数的积差相关。实践中的复本信度:高考命题中的复本选做题/超量命题,限量做题,复本信度的估计方法,

18、4.难度(题目的难易程度),二分法记分的题目:P=R/N*100选择题的难度校正公式:CP=(KP-1)/(K-1),CP为校正后的通过率,KP为实际通过率,K为选项个数。非二分法记分的题目:P=平均分/满分*100 ,5.区分度,指测验题目对被试心理特性的区分能力;在中考中指区分不同水平学生的能力。鉴别指数法:D=PH-PL D越大,区分度越好。一般要求D在0.4以上。点二列相关法,6.评价的公平,指某一评价任务或评价方案是否对某一特殊群体(如女性团体、经济弱势群体)构成冒犯或不公正待遇。 几个反映公平问题的例子:“找出一到两个饮水机上用到了物理学原理”假如记忆可以移植语数外学科以百分制记分

19、,专题四,试题编制的基本程序与要求,1.确定测验目的,初中生毕业?高中招生?两者合一依据课程标准命题选做题?开卷题?多主体评价?改变过去片面注重知识和技能的状况,有意识地增加考察综合/其它素质的题目。值得注意的是,并不是所有的教育目标都可以在中考中进行评价。,分界分数的确定,分界分数是将被试在某一测验上的成绩划分为通过与通过、优秀与非优秀,或者划分成不同水平组的分界点。分界分数界定的方法有很多。例如,安戈夫方法。,安戈夫方法举例,2.编制测验细目表,列出教学目标清单列出教学内容要点填写双向细目表也可以使用单向归类系统编制细目表的核心目的是保证测验的内容效度,国外某中学地理天气单元测验细目表,中

20、考语文细目表,分值,中考语文细目表,使用单向归类系统,3.选择合适的任务类型,客观题/选择反应题填空选择是非匹配简答主观题/建构反应题/表现性评价简答论述作文分析比较,4.设计评价任务,将题目与所要考查的成果匹配获得题目的代表性样本减少妨碍表现的无关因素减少客观题中的无意线索题目要符合考生的阅读水平使每道题目的答案得到专家的一致认同;如果是评价任务,优秀表现的标准也应得到专家的一致认可。注意题目的审查,中考政治题,小军为某重点中学学生,学习成绩优异,深受老师的喜爱,同学们也愿意同他交朋友。但是自去年下半年开始,他偷偷到网吧上网、聊天、打游戏,在网络虚拟的世界中流连忘返,学习成绩急剧下降,和老师、同学的交往也日渐减少。老师和父母都做了很多工作,他仍然迷恋网络。小军很想走出网络游戏的阴影,只是控制不住自己。假如你是小军的好朋友,请你帮小军想象改正的方法。,谢谢倾听!,演讲的评价标准,站立姿势自然与听众保持良好的目光接触面部表情适当有效使用肢体语言音量适当清楚说话没有多余的口头禅以有条理的方式呈现观点正确使用修辞保持听众的兴趣和注意力,在小组交流中分享观点,有趣的、丰富的、开放的表述主题明确逻辑清晰观点间有过渡衔接明显的润色、修饰至少有三个主要的观点每个观点都有具体的分析和论证结论简洁至少有三个明显的资料来源充满趣味,信息量大,返回,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 1

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。