1、 美国大学水平考试 柳 博 ( 作者简介:柳博,助理研究员,教育部考试中心理科处,北京, l00080。 ) 摘要 : 本文对美国大学水平考试 (CLEP)进行了详细介绍。其中涉及概况、历史、发展策略、考试标准的确定、命题、成绩报告与及格线的确定和平行控制等多方面问题。 关键词 : 美国大学水平考试 (CLEP) 一、大学水平考试 (CLEP)简介 (一 )CLEP 概况 CLEP 是由美国大学委员会 (The College Board)主办、 ETS 承办,在全美影响范 围最大的一项以考试获得学分的国家考试项目。 CLEP 的考试科目包括 5门 公共 课和 29 门专业基础课。那些在普通高
2、校之外学习大学课程的人通过参加 CLEP, 都能够有机会获得大学承认的相同课程的学分。目前,全美每年约有 l300个考 点来实施这项考试。 CLEP 的考生群体主要由三部分组成: (1)传统意义上的 l8 到 22 岁的大学 生; (2)已 经参加工作的成人 (公司职员 ); (3)业余学习的学生。 CLEP 就是通过考 试给予这些考生一个有效而可靠的途径来获得学分。与 AP(主要是考查高中在 校学生学习大学课程的情况 )相比, CLEP 的考生群体更广泛。 (二 )CLEP 的功能 1通过考试证明所学的知识并为取得学 位积累学分,从而节省珍贵的时 间和金钱,使自己的学习站在较高的起点上; 2
3、通过考试展示在某一课程领域的知识水平而获得一些基础课程的免修资 格,从而直接迈进更高级和更新的课程学习领域; 3特别是通过一些外语课程的考 试,可以确定考生的能力水平,从而决定学习的级别。 (三 )CLEP 的考试科目与要求 CLEP 的考试科目由公共课和专业基础课两部分组成。一般地,在一个专业 领域方向上,设置一门公共课和若干专业基础课。 1公共课:每门公共课覆盖了与普通大学相同或相似的专业在前两学年里 对大多数学生要求掌握的课程内容,通常在 校学习时要求含有 3 至 6 个学分 (1 或 2 个学期的学时 )。公共课考试的 5 个领域分别是:英语写作、人文科学、大学 代数、自然科学和社会科
4、学与历史。 3专业基础课:每门课程涵盖了与大多数大学有相同或相似名称的课程内 容。通过 CLEP 考试的考生一般能够与在校内修完该课程的学生取得相同的学 分。通常,专业基础课程的考试内容覆盖了普通高校里需要在一个学期学习完成的课程内容。 29 门专业基础课程包含在分别与公共课程相对应的 5 个专业领 域里,它们是 (括号内为所含考试课程门数 ): (1)写作与文学 (4):美国文学,文学评析,大学新生作文 ,英国文学; (2)外语 (3):大学法语 ( 、 级 ),大学德语 ( 、 级 ),大学西班牙语 ( 、 级 ); (3)历史与社会科学 (11):美国政府,美国历史 (殖民地时期至 l8
5、77 年 ),美国 历史 (1865 年至今 ),人类进化发展史,教育心理学导论,微观经济学原理,宏观经 济学原理,心理学基础,社会学基础,西方文明史 I(古代近东至 1648 年 ),西方文明 史 (1684 年至今 ); (4)科学和数学 (6):微积分与初等函数,大学代数,大学代数和三角学,普通 化学,普通生物学,三角学; (5)商务管理 (5):计算机应用与信息 系统,管理原理,会计原理,商法基础知 识,市场学原理。 除了语言类的公共课英语写作与文学和 4 门专业基础课 (美国文学、 文学评析、英国文学、大学法语写作 )有选做的论文题部分外,其他课程的 考试题型全部是选择题。所有课程的
6、考试时间都是 90 分钟,要求分别在两个单 独的部分 (各 45 分钟 )完成。为了使考生有充分的时间进行学习,避免一味地为 了获取合格成绩而连续应试, CLEP 要求每位考生不能在 6 个月之内参加同一门 课程的两次考试。 (四 )CLEP 的管理结构 CLEP的管理结构模式如下图所示: 各部分的作用分别 为: 1大学委员会 (The College Board)确定 CLEP 的发展方向,课程考试科目以及与 考试相关的政策制定方面的工作。 2 ETS 负责课程命题、实施考试、评阅答卷、保存成绩以及提供官方的复习指导 等与考试有关的工作。 ETS 向考点提供试卷,考试结束后由考点将答卷寄回
7、ETS, 由 ETS负责评阅,分数转换,向考生报告成绩,并保存考试成绩 20 年。 3美国教育委员会 (the American Council on Education,简称 ACT,成立 于 l918 年 ),是美国高等教育发展研究与政策制定方面的主要 机构,主要服务于当前社 会关注的焦点问题并制定有关高等教育发展重要政策,以确保大学教育的质量。 ACE 向 CLEP 各考点推荐可授予学分的合格成绩标准。 4 CLEP 的课程考试命题委员会由在普通大学里从事某门课程教学的教授 组成,委员会成员名单公布在有关的考试信息指导材料上。命题委员会和 ETS 的专家一起确定课程内容细目表和试卷格式,
8、进行命题、试验 (pilot)、制定成绩量 表等工作。 5 CLEP 的考点由具有学位授予权的高等教育机构 (主要是大学 )组成。每 一所想成为 CLEP 考点的普通高校,在申请时必须制定一个明确的通过考 试授予 学分的专业考试计划,其内容包括: (1)最少应采用 CLEP 的 3门公共课和 5 门专业基础课的考试; (2)明确指出该计划所有的可授予学分课程的考试成绩要求; (3)说明每门课程的学分数; (4)指明考生取得课程学分或文凭的其他条件,诸如写论文、通过实践性环 节考核以及交付一定的成绩档案保存费用等; (5)说明这项计划适用于该大学的哪些系。 除了英语写作类的课程考 试时间由全国统
9、一安排之外,其他所有的考试时间安排均由各考点自行安排。 考点的负责人必须是该高等教育机构的正式职员,同时具有管理标准化考 试的经验。 另外,各考点必须承诺保证考试的机密要求并按照 ETS的要求实施 考试。 二、 CLEP 的发展历史 1967 年,随着大学委员会在全美建立了 50 个考点, CLEP 才得以第一次在全 国范围内普遍实施。这被认为是一件了不起的事情,是教育制度上的一个创新。虽然通过考试授予学分的想法在此之前已经提出了好多年,但一直没有成为系统化的思想,未被人们广泛接受。 实际上,通过加快获得大学课程的学分而提前完成学业的概念最初 是由伦敦大学于 l836 年提出的。该大学从未设立
10、过常规意义上的班级,其主要功能就 是为那些被证明有大学水平知识的人颁发学位 ,这些参选者通过考试展示他们的能力。 l9 世纪末,通过考试获得学分的想法传人美国,但直到第二次世纪大战 结束前,赞同这个想法的人并不多。二战胜利了,成千上万的老兵回到家乡,他们中的大多数人甚至连高中文凭都没有,需要在部队里接受教育培训之后才能找到合适的工作 并且这种培训还要得到社会的广泛认可。 1950年代初期, 哥伦比亚大学基础学院的副院长 Jack N Arbolino提出一项计 划,允许那些没有高中基础知识的人在五个特定的专业方向上学习大学的课程。如果他在这些试验性的课程上至少达到了 B 级水平,那么将会获得和
11、正规 大学生相同的学分。 于是其他大学也跟着效仿。 l957 年,哥伦比亚大学基础学院的院长公开提议采 用伦敦大学的体制来为那些非正规学生提供获得学分的机会。正如所预料的,这个新兴的事业引起了异议,纽约州务委员会提出一项动议,认为可以通过一系列的考试来评估大学课程的学习水平,但通过考试获得学分的标准应该比课堂教学的要求高。 1960 年代开始,要求保证给予那些没有在大 学学习过或没有受过正规教育的人以广泛的教育机会的呼声高涨起来,并且问题的焦点迅速转移到了诸如对教育测量的有效性、可靠性及可行性等方面问题的争论。这场讨论产生的 共识保证了几年后的以考试获得学分的项目的诞生,也吸引了那些最终实施
12、CLEP的 开创者们。 1964 年底,卡耐基基金会资助 ETS 准备在全国范围内实施大学课程 内容考试 大学综合考试 (The Comprehensive College Tests,简称 CCTs),它主要 为两类人服务:没有受到正规大学教育但在通过课堂外学习想获得大学承认的人和那些希望能够在大学之间转移学分的学生。 CCTs 设计的考试内容覆盖了大 学前两年的学习内容,并分为公共课和专业基础课两部分。 l967 年, CCTs 正式 更名为 CLEP。 CLEP 产生的另 一个大背景是在 1960 年,美国的成人教育和继续教育蓬勃发 展,在其辉煌时期,每年参加各种教育形式的成人有 250
13、0 万人,平均每 5 个成年 人中就有一人在接受教育。创建初期时的 CLEP包括 5 门公共课和 10 门专业基 础课,到 l970 年代末期, CLEP 开考的专业基础课曾一度发展到 47 门。与此同 时,考生群体也发生了变化。 1950 年,全美有 1851 所高校,在校生 350万人。二十年后高校数量发展到 2525 所,在校学生人数猛增到 748万人。在这个变化期间, CLEP 找到了一个巨 大的市场:普通高校里每学年大约有 l 3 左右的在校生转学, 其中 35 40的 学生同时也改变了专业,而且往往不止一次。仅有 l 4 的大学生能够持续读完 四年大学后毕业。大约有一半的学生中途停
14、学,其中只有 40的人后来能够继 续完成学业。这些学生是 CLEP 的主要考生群体,因为他们在转学或改变专业时 需要利用通过 CLEP获得的学分,并且在离开学校期间其学分仍然有效。 1979 年, ACE 组织了一次全美范围内的调查,征询大学关于通过提前学习授 予学分的实践是否可行的意见。 ACE 发了 3 千份问卷,大约 3 4 有了回应,实 际上几乎所有的回答都说他们同意接受通过考试来评价学习成果并授予学分的 观点。作为 CLEP 变化的一个侧面,参加 CLEP 的女考生占所有考生的比例从 1970 年代的低于 50上升到了 62,今天这个比例还可能在增大。并且,考生的年龄 结构也发生了变
15、化, 1970 年代早期,小于 19 岁的考生是主体;从 70年代到 80 年 代,考生主体的平均年龄慢慢增大,到 1991 年,约有 56的考生年龄大于 26 岁。 1989 年, CLEP 通过一项研究调查发现,参加 CLEP 的人是想尽可能地获得大 学学位,他们中有许多人是第一次参加高等教育的学习,希望在以后转学的过程中使以前获得的学分有效。从整体上讲, CLEP的考生有非 常浓厚的学习欲望, 并且能够从自我安排的学习中获得益处。 现在,参加 CLEP 考试的学生越来越多。 三、 CLEP 的发展策略 ETS 遵循科学、严格的考试组织与管理模式,从制度上保证 CLEP 的高质量。 ETS
16、 开发一项考试通常需要两年的时间,这个过程是由从全国不同地区不同层次 的高校中选出的专家与 ETS 和大学委员会一起合作完成的。首先,从该课程领 域中选择合适的人选为命题组长,他是每次命题的核心人物,对整个试题设计和命题运作负责。接下来是组建命题队伍,从不同的地区不同的高校选拔在该课程领域具有代表性的教授组成命题组。命题组 制定考试命题细目表,确定要测量的知识内容和能力要求,命题组成员每人每次至少命制 25 道题。除了命题组 之外,其他普通高校的教师也常常为 ETS 写题 (征题 ),这些题也添加到题库中去。命题组对所有的试题进行审查,主要检查试题描述事实和述语的准确性,以及有关提法与当前该课
17、程教学中的讲法是否相符。当试题命制好以后,从全美各地的大学请一些刚学完该课的学生作为 “ 参照组 ” 来进行预测试 (即 Do Pilot)。 虽然 CLEP 考试课程数目众多,互不相同,各自独立,但所有的课程考试必须使用设计相同的高质量的考试程序。并且,所有考试实际 施测前必须接受严格的试验,在不同的课程命题程序上不能存在严重的偏差。 ACE 对 CLEP 的所有考试进行整体项目评估,包括审查操作流 程、命题实施、保密情况、考试阅卷和成绩 报告等方面,最后对每科考试都给出一个学分推荐授予标准。 ACE 每隔一定时间就要对 CLEP 进行一次项目审查。最近的一次审查是在 1996 年完成的。
18、为了吸引更多的考生, CLEP 积极主动地向许多商务公司建议让其职员参加这项考试。同时使这些公司的主管们明白,职员参加 CLEP 的学习无疑是非常有益的。无论是这些职员是想通过学习大学的课程来变更工作岗位,还是基于 已有的工作经验通过考试来提高其理论知识水平。并且,通过和一些大公司的合作,还可以 扩大 CLEP 的影响。 另外, CLEP 还能使那些在社区学院学习的成人主动地接受大学课程教育。通过 CLEP,能够发现那些在社区学院或专科学校 (the business college)优秀 学生,并吸引他们到大学里来读书。 CLEP 的目标就是鼓励独立的学习,帮助成人接受高等教育获得学位,并找
19、到合适的工作。 CLEP 利用这些优势来提高社区学院里的学生参加 CLEP 的数量。 在以前的实践中, CLEP 的发展受到了广泛的赞誉,并且越来越多的组织机构 承认 CLEP 成绩的权威性。比如加州有个法学院 (美国的法学院属于研究生院层次, 无 本科教育 ),甚至让那些没有大学学历而有四门 CLEP 公共课合格证的学生进入学院深造。 并不是每个人坐在教室里都能够学习得最好。今天,过去的课堂教学、集体学习的方式已不再是公认的基本学习形式。从中学教育层次到大学教育阶段,教育的过程与内容已经融入了实习 (internship)、见 习 (apprenticeship)、独立研究和行业服务等观念。
20、 将考试作为对以前的学习成果检验的惟一手段并授予学分,这种做法在美国发展的历史虽然并不长,曾经受 到了各种各样的非议: CLEP 将给高等教育带来什么呢 ?难道发现了一种新式有效的教育途径了吗 ?有人认为这种非正规的学习方式只是头脑发热的人们一时的念头,将会很快消失的。然而事实是在这些争论出现的同时,许多不同层次的人却加入了这种学习的行列。其中有退伍军人、职业妇女和年龄较大的公民等,他们都渴望能继续学习知识。大学也开始 认识到高等教育的多样性,并欢迎这些兼职的学生。社会在改变,教育思想也在改变。 六七十年代,以考试获得学分是使成人学习者获得认可的惟一的具有创新 性的方式,虽然也面临着许多挑战,
21、但随着 CLEP的出现, 终身教育的思想渐 入 人 心。学生不再被当作一张“白板”而等着被充实,他们自身的人生经验和独立研究的能力被看成一种有效的学习途径而得到承认。 CLEP 不在乎你于何时何地 学习过,而注重于你想学些什么和已经学习过哪些知识。对于那些想返回学校或别无选择的成人学习者来讲, CLEP 无疑是一种受欢迎的教育方式。 CLEP 允许 所有的学生来展示他们所学的知识,无论他们的年龄或家庭背景如何,更不关心他们通过何种方式获得这些知识。正如有人这样评价 CLEP:教育使人上瘾,你 学得越多,你想学的就越多。 四、 CLEP 考试标准的确定 由于 CLEP 是标准参照测验,所以考试标
22、准即考试范围 (domain)的确定就显 得尤为重要。 ETS 确定标准参照考试的内容标准依靠做试验 (Pilot)研究。目前 在 CLEP 上应用的有两类研究方法,一类称作常模化研究方法 (Norming Study),主 要是通过选取普通大学里学完某一门课程的学生作为参考样本实施测验,在对其结果数据进行分析的基础上确立考试的内容参照标准,这是目前 CLEP各课程 考试普遍使用的方法;另一类称作标准建立的研究方法 (Standard Setting Study), 主要依赖专家的经验判断确定内容标准。在后一类确立标准的研究方法上, CLEP 准备应用安格夫 (ANGOFF)方法或 “N0 -
23、YES” 方法,这两种方法性质相似,操 作方式不同。 从理论上讲,选取大学里的学生组成参考样本实施测验,得到的数据比较客 观,能够比较准确地反映该课程在课堂教育上的实际水平,建立的标准可信度高。但是进行大规模的试验,参加试验的学校的水平不同,接受测试的学生的应试态度无法保证,而且要花费大量的人力、物力,代价太高,有时候得到的参考数据也未必能反映真实水平。所以, CLEP 准备应用新的标准确立研究方法, 依赖 富有教学经验的教授们的判断来建立内容标准。 CLEP 在 1999 年 4 月讨论确立新的美国历史课程考试标准时,就使用了 ANGOFF 方法,其具体实施步骤为: 1准备一份样题; 2聘请
24、全美不同地区不同层次大学的 20 名历史系教授互相独立地对这份样 题中的每个试题进行评估。要求每位教授参考其所在学校对该课程内容的教学要求,并根据刚学完该课程的平均水平的学生对每道试题最可能的反应来对该题打分。每个分值通常在 0 1之问,有两层含义:代表了平均的一般水平的学 生答对每道试题的可能性;或者假设有 100 个平均水平的学生参加 考试,可能有 多少人回答正确,这些人所占的百分比是多大。 3收集所有教授们的评分表,将所有题的所有给分列出,统计出每道题的平 均分数,组成下表: 4按照题目顺序组织讨论。如果所有人对某道题的打分比较接近,例如相差不超过 5 个百分点 (视具体情况而定 ),则
25、认为观点基本一致,就可将此平均分作为该题的实际难度水平。如果某道题的分数差异比较大,则请打分最高和最低的人分别说明理由,并重新进行评分,最终取得一致意见。 5将此样题及其评估参数和意见进行整理,作为以后命题的依据。 由于美国历史是 CLEP第一次应用此种方 式确定考试标准,所以,虽然 4 月份已经组织过专家讨论,但为公平谨慎起见, ETS 决定 8 月份在网络上就 此内 容再进行一次范围更广泛的讨论,以确保它们的客观性。 “N0 -YES” 方法类似于 ANGOFF 方法,也是建立在专家经验判断的基础上。所不同的是,应用 “N -Y”法,不作具体数字上的估计,而只是划出大致的等级。其依据的理由
26、是,在大学里学完某一课程后,学生的学习水平有差异,考试结果也互不相同,通常分为 A、 B、 C、 D、 E 五个层次 (A 为优秀, C 是及格水平。 )基于这个经验,教授们分别独立地对样题中的每道题作出判断,划归其所属 的层次,然后再讨论确定。基于 “N -Y” 方法的样题判 断表格结构一般是这样的: 题号 _: 该题层次: _(A、 B、 C、 D、 E) 具体实施步骤与 ANGOFF 方法相同。 显然,用 “N -Y” 方法判断要比 ANGOFF 方法更便于操作,因为毕竟有时凭经 验赋具体数值要更困难一些。 五、 CLEP 的命题 (一 )考试说明 CLEP 的每门课程考试都有一个课程考
27、试信息指导,类似于我们的考试大 纲或说明。它一般由两部分组成:第一部分提供考试命题说明和样题,第二部分提供有关考试的一些技术参数诸如分数解释、信度、效度等方 面的内容。 命题说明指出课程通常在普通高校中所占 的学时数,考试内容的范围和重点,考核的基本能力要求和比例,试题题型和题数,以及答题要求等。 技术参数部分说明选取了哪些州的那些大学的多少名学生作为参考样本做 试验,这些学生的各类成绩 (原始分、公式分、量表分等 )的分布情况、试题特性, 以及对于试验样本的效度与信度方面的解释。 (二 )考核内容及能力要求 CLEP 一般列出某一课程各部分考核内容及其所占的大致比例,而不作具体 知识点要求的
28、细化。因为不同的课程知识结构不同,能力要求也不统一,所以不同的课程关于能力考核的表述也 是不同的。例如: 大学代数要求结合列出的课程内容,能够: (1)解决一般的、简单直接计算 的问题 (约占 50 );(2)能够理解并应用所学的基本知识和基本技能解决较复杂 的问题 (约占 50 )。 计算机应用与信息系统的能力要求更简单: (1)知道基本概念和术语 (约 占 50 ); (2)应用知识的能力 (约占 50 )。 管理原理的能力要求: (1)识记、基本理解管理的目的、功能和技术,以及 特殊的事实性内容 (约占 l0 ); (2)理解并能够将专有名词的意义与重要的管理 思想、技术、概念和基本原理
29、联系起来 (约占40 ); (3)理解管理理论并重点掌握 管理数据的假设、概念和局限性,包括了解数据处理的过程、方法和分析的基本原理 (约占 40 ); (4)应用所学知识、基本概念和原理去解决特殊问题的能力 (约 占 10 )。 各门课程的命题委员会和 ETS 的专家一起讨论决定考核内容结构及能力要 求,并且要对普通高校该课程的教学内容及要求进行大量的调查研究,命题委员会对某一课程的考试内容要达成一致意见。这项工作一般需要两年时间。例如,新大学代数的考核内容范围和要求是在 1993 1994 年制定的,同时还完成 了该学科的成绩量表及其他技术参数。 (三 )CLEP 命题过程 (见流程图 )
30、 在 CLEP 的命题考试过程中,考试命题系统 (Test Creation System,简称 TCS)和 考试组配系统 (Test Assemble System,简称 TAS)是两个最重要的环节。 TCS 犹如一个试题生产线,这个过程完全通过计算机系统完成。当征集的试 题 (原料, Raw Items)送到 ETS 后,由专门录入员将这些试题存 进计算机,送上生产线 (TCS 系统 ),然后经过专职命题人员磨题(Triage),完成编辑、校对、审查等工 作,最后由终审者 (Locker)确认试题无误后,装入试测题 库,准备在实际考试中进 行试测。经过 TCS 系统,每道试题都得到了命题人
31、员的严格审查,但真正质量如 何,还有待于在实际中进行检验 (试测 )。 通过 TCS 系统后的每道试题还不能立即用于试测,因为这时的试题只能算 作一个个单独的零件,只有装配成完整的机器,才能在实际中应用。将单个的试题组配成试卷的过程就是 TAS 系统。不同内容、难度分布的试题通 过 TAS 系统 这个试卷的组装线,生成完整的符合考 试要求的试卷方能用于测试。 六、 CLEP 的成绩报告与及格线的确定 (一 )CLEP 成绩量表说明 CLEP使用量表分 (The Scaled Score)报告考生成绩,每科考试课程都有各自 的量表。 CLEP公共课的量表值为 200-800,平均分是 500,标
32、准差是 100;专业基 础课的量表值为 20-80,平均分是 50,标准差是 10。建立量表后, ETS 将每一次 考试考生的原始分数进行转换,得出考生的量表分,就可以将某一考生同适当的参考样本学生进行比较,来说明考生的水平。这个量表的均值和标准差对 CLEP 的用户来说,很容易理解并接受。 CLEP 成绩量表是建立在对参考样本群体实施考试并进行特殊的成绩量化 处理之上的,并且隔一段时间将重新选取参考样本修订量表,以 反映当前普通高校学生的水平。不同的 CLEP 课程或同一门课程不同时代的量表分数是不能够 进行比较的,这是因为不同量表是通过对不同的参考样本进行测试得到的,它们之间没有可比较性。
33、例如,将大学代数和大学代数 -几何学的量表分进行比较就是不合适的,因为这两门课程的量表的参考样本不是同一个群体。同样,将某一门课程 80 年代的量表和 90 年代建立的量表进行比较也是不合理的,因为这 两个量表的依据的参考样本群体已经发生了变化。 (二 )CLEP 成绩量表的建立 CLEP 每门课程的成绩量表是从通过选取参考样本进行试验测试 (Do Pilot)的数据中得出的。其具体做法为,选取不同高校刚学完同一门课程 (一般是 CLEP 科目考试的考点学校 )的学生组成参考样本 (the reference groups),让这些学 生参加试验测试,对所得出的数据进行统计分析,制定量表。比如
34、 1993年秋季, ETS 就选取了 36 所高校的 l024 名学生组成参考样本对大学代数的量表进行 了修订,制定成新的量表 (如下表所示 )。计算机应用与信息系统则于 1989 年 冬季选取了 26 所高校的 l990 名学生组成参考样本试验修订并制定了新的成绩 量表。 通过做试验得到参考样本的数 据,不仅可以确定 CLEP的考试标准 (criteria),而且还可以用来指导以后考试的命题与分数统计。另外,将试验的技术数据公 布,向社会解释其科学性与公平性,有利于增加人们对该项考试的认识,还可得到有关考试及教育测量专家的认可,提高考试信誉。 (三 )CLEP 成绩的计算方法 1原始分 (R
35、aw Score):所有正确答案的分数总和 (正确题个数 ),假设全卷共 T个试题,其中答对 R个题目,错 W个题目, N个题目未答,则 T=R+W+N, 原始分为 R 个题目所占的分值。 2公式分 (Formula Score):从原始分中扣除 受随机猜想影响而获得的分数,作 为对猜想的惩罚之后的分数, F=R-1 (n 一 1)W,其中 n 为每题的选项个数。 该公式表明,每作错一个题目,要扣除 1(n 一 1)分。例如,假设有 l0 个考试题 目,每题 5 个选项,猜测正确概率为 1 5,全部猜测正确的试题个数为 101 5=2,答错 8 个题目,扣除猜测因素,按其实际水平,得分应为 2
36、-81 (5-1)=0。 若答对两个题目,其余的题目未答,即未进行猜测,则不扣分,其公式分应为 2 分。 在成绩量表中对应选定的量表分值给出公式分的范围而不是具体的值,这 是因为特定的公式分值所对应的量表分每次考试都有所不同,甚至在同一次考试中,两个或更多的公式分值有时能转换成同一个量表分。 3量表分 (Scaled Score):最后将公式分转换到 CLEP 的量表上,得出其量表 分。答对的题目数越多,取得的量表分就越高。 当我们建立成绩量表之后,就相当于我们制定了测量标准,以后每次考试过 后,都将原始分转换成量表分,这样不同次的同一门课程考试成绩之间就可进行比较。当然,这个成绩量表不宜经常
37、变动。 (四 )CLEP 考试及格分数线的确定 由于不同学校的课程讲授内容有所不同,而且 CLEP 的试题难度分布也有所 不 同 (尽管大部分试题属于中 等难度 ),所以 CLEP 考试设计的目的就是使完成某 一课程学习的平均水平的学生通常能够答对试题的 50。大多数学校的及格线 就设置在这个水平附近,但也有一些学校要求比这个标准高。 不同的大学对授予学分的成绩要求有可能是不相同的,大学委员会建议大 学采用 ACE 推荐的参考标准授予学分。所有 ACE 的推荐标准都是经过相关的 评价组仔细研究和审查之后得出的,这个评价组是由课程专家和考试与教育测量方面的专家组成。但具体的学习成绩要求或者学分授
38、予条件需要视申报学校的政策。 (五 )CLEP 的作文评分 大学委员 会组织大学的英语教授来评阅 CLEP 的公共课程英语写作的作文部分。这些评卷者是从全美范围的二年制或四年制的大学里正在从事该课程的教学的教授中精心挑选出来的。这些评卷者在阅卷前需要认真学习并领会大学委员会的评卷细则,并进行大量的评卷培训,方能进入正式阅卷。每一篇文章由两名教授评阅,所得的两个分数与选择题部分结合之后,再转换到 200-800 的量表上。 CLEP 不会单独报告作文部分或选择题部分的分数,因为一个 45 分钟的短文写作是不足以可靠地评估考生的大学水平的写作能力的。虽然两部分 (选择与写作 )形式不同,但它们都
39、考查了说明性文章所 必需的写作能力。在选择题 部分,规范的语法是必要的,然而论述题 (Free-response)却注重考查写作技能胜于语法要求。 七、 CLEP 考试的平行控制 CLEP 主要从以下三个方面来控制考试的平行 (一 )命题 如 同 其他 ETS 的考试项目命题方式一样, CLEP 也是由外部聘请专家和内部 专职命题人员写题。命题委员会的成员不仅要保证考试质量,而且是主要的命题者,他们在 CLEP 的学科秘书协助下展开工作。除此之外, CLEP 向社会上进行 广泛的征题。但这种征题不是盲目进行的,而是 ETS 根据命题委员会的推荐,与 拟聘请的课程命题专家商谈并签订协议,组织过
40、CLEP 命题培训工作之后,再根 据 CLEP 试题编写标准命题。 一般来讲,对于初次参加命题的专家, CLEP 的培训内容除了说明课程性质、 考试内容比例及能力要求各种试题书写标准之外,还有一最主要内容就是提供已经试验测试过 (pilot)样题及统计数据,使命题者对本课程的考试水平有一个感 性的认识。这样在写题时有内容、有样题、有数据,就不至于仅仅依靠主观判断,而有一个比较深刻的理解。实际上,取得参考数据的样题是最重要的命题依据。 当外部的命题人员将写好的试题寄回 ETS 后,还要经过 ETS 的考试命制系 统 (TCS, the Test Creation System),经过 ETS 内
41、部职业命题人员磨题 (triage),然后 才能装入试测题库 (the item pool for pre-testing),准备进行试测。试测前试题的一 些主要参数 (如难度、内容层次等 )是命题人员根据经验估计的,只作组卷时的参 考。准确的试题特征参数如难度、区分度等还有待于考试结束后收集。 (二 )组卷 CLEP 通过对从不同大学选取的参考样本做 试验测试,不但制定了分数量表,而且还确定了详细的组配试卷细目表,其主要内容包括试题 格式、考试长度、试题参数要求、题量,以及试测部分所占的比例等。根据这个细目表,考试组卷系统 (TAS, the Test Assembling system)就可以自动组配试题,生成格式和内容都与 其要求相符的试卷,从理论上讲,这个试卷就是平行卷。但该试卷还不能立即用于考试,因为无法保证其质量,所以必须经过 ETS 的专家进行审查,并与考过的 试题进行比较,然后才能实际使用。 (三 )分数统计 评阅试卷结束后,对考试试题进行统计分析,剔除掉参数不理想的试题,再 记录原始分数,根据分数转换规则,将考生的原始分数转换到该课程考 试的量表上,得到考生的量表分。不同次的考试,原始分之间无法进行比较,但转换到同一成绩量表上,得出量表分,就可以进行比较。通过量表的转换,也可以保证考试成绩的平行。 CLEP 经过这三个环节的控制,就可以基本保证考试的平行性了。