1、心理测量学知识,姜长青010-58303223首都医科大学附属北京安定医院,国家职业资格培训教程,讲课内容,第一节概述第二节 测验的常模 第三节测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序 第七节 心理测验的使用 附:几个常用统计学概念,3,第一节 概述,第一单元 测量与测量量表第二单元 心理测验的基本概念第三单元 心理测验的分类第四单元 纠正错误的测验观第五单元 心理测验在心理咨询中的应用第六单元 心理测验的发展史,4,第一单元 测量与测量量表,什么是测量测量要素测量量表,5,什么是测量,测量就是依据一定的法则用数字对事物加以确定。该定义包括三个元素:事物、数
2、字和法则。 1.所谓“事物”,指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征。 2.所谓“数字”,是代表某一事物或事物某一属性的量。 区分性、 序列性、 等距性、 可加性 3.所谓“法则”,代表的是测量所依据的规则和方法。,6,测量要素,任何测量都应该具备这样两个要素:即参照点和单位。参照点:要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。绝对零点人定的参照点即相对零点单位:是测量的基本要求,没有单位就无法进行测量 有确定的意义有相同的价值,7,测量量表,测量的本质是根据某一法则在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。量表的四
3、种水平命名量表 :代号/类别顺序量表 :在顺序量表中,既无相等单位,又无绝对零点,数字仅表示等级,并不表示某种属性的真正量或绝对值。 等距量表 :不但有大小关系,而且具有相等的单位,其数值可以相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算。 等比量表 :是最高水平的量表,既有相等单位又有绝对零点。 那么,心理测量中使用的量表一般是什么量表呢?一般说来,心理测量是在顺序量表上进行的。,8,第二单元 心理测验的基本概念,心理测验的定义心理测验的性质,9,心理测验的定义,所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理
4、特点作出推论和数量化分析的一种科学手段。 首先,心理测量的对象是人的行为 。 其次,心理测量往往只是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。 第三,为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。 第四,个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。,10,心理测验的性质,心理测量的间接性 迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即通过测量人们对测验题目的反应来推论出他的心理特质。心理测量的相对性 在对人的行为做比较时,没有绝对的标准,有的只是一个连续的行为序列。
5、心理测量就是看某个人处在这个序列的什么位置上。心理测量的客观性:1、测验的刺激是客观的2、对反应的量化是客观的3、对结果的推论是客观的,11,第三单元 心理测验的分类,按测验的功能分类 智力测验、特殊能力测验、人格测验按测验材料的性质分类 文字测验、操作测验按测验材料的严谨程度分类 客观测验、投射测验按测验的方式分类 个别测验、团体测验按测验的要求分类最高作为测验、典型行为测验,12,第四单元 纠正错误的测验观,错误的测验观测验万能论测验无用论某些人格测验侵犯了个人隐私,违背民主原则测验为宿命论和种族歧视提供了心理学依据 心理测验=智力测验=智商=遗传决定论 正确的测验观心理测验是重要的心理学
6、研究方法之一,是决策的辅助工具 心理测验作为研究方法和测量工具尚不完善,13,第五单元 心理测验在心理咨询中的应用,智力测验:可在求助者有特殊要求时及对方有可疑智力障碍的情况下应用;人格测验:有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作; 心理评定量表:用于检查求助者某方面心理障碍的存在与否或其程度如何。,14,第六单元 心理测验的发展史,科学心理测验的产生与发展现代心理测验在我国的发展,15,科学心理测验的产生与发展(1),首先倡导科学心理测验的学者是英国生物学家和心理学家高尔登(F. Galton),因此他的工作被视为心理测验的开端。
7、此外,高尔登也为心理测验奠定了统计学基础,即首先提出了相关的概念。,Francis Galton(1822-1911),16,1890年,卡特尔在心理杂志上发表“心理测验与测量”一文,这是心理测验第一次出现于心理学文献中。并提出心理测验的结果应与常模进行比较。,科学心理测验的产生与发展(2),J.M.Cattell(1860-1944),17,科学心理测验的产生与发展(3),1905年,比内(A.Binet)与其助手西蒙(T.Simon)研究制作了世界上第一个正式的心理测验。,Afred Binet(1857-1911),18,科学心理测验的产生与发展(4),操作测验的发展 由于理论上的缺陷和
8、实际上的需要,所以有操作测验的问世。团体智力测验的发展 团体测验始于第一次世界大战,在推孟的研究生欧提斯所编团体智力测验的基础上发展了陆军甲种和乙种智力测验。能力倾向测验的发展 分析个人心理品质的内部结构,为职业选拔与安置提供依据。 普通能力倾向(智力)测验也向多元化发展。人格测验的发展 测量情感或行为等非智力方面的人格因素。,19,现代心理测验在我国的发展,我国近代心理测验大约源于1914年前后。上世纪二、三十年代,我国心理学家曾两次修订过比内-西蒙量表。 1979年后,全国各地的心理学家组织起多个协作组,先后对国外的广泛采用的智力和人格测量工具进行修订。近些年来我国的心理学家正在致力于测验
9、本土化,编制适合我国文化背景的智力测验,适应行为量表等,并已取得了初步成功。,20,第二节 测验的常模,第一单元 常模团体第二单元 常模的类型第三单元 常模分数的表示方法,21,第一单元 常模团体,常模团体的性质常模团体的条件取样的方法常模与常模分数,22,常模团体的性质,常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。对测验编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。这种工作包括:确定一般总体确定目标总体确定样本。对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。,23,常模团体的条件,群体的构成必须明确界定
10、 依据不同的变量确定群体,便可得到不同的常模。常模团体必须是所测群体的代表性样本当所要测量的群体很小时,将所有的人逐个测量,其平均分便是该群体的最可靠的常模。在群体较大时,因为时间和人力物力的限制,只能测量一部分人作为总体的代表。样本的大小要适当总体数目小,只有几十个人,则需要100%的样本。如果总体数目大,相应的样本也大,一般最低不小于30或100个。全国性常模,一般应有20003000人为宜。样本大小适当的关键是样本要有代表性。标准化样组是一定时空的产物,24,取样的方法,取样即从目标总体或目标人群中选择有代表性的样本简单随机抽样:在简单随机抽样中,每个人或抽样单位都有相同的机会被抽中。系
11、统抽样:又称等距抽样,就是将已经编好号码的个体排成顺序,然后按每隔若干个号码抽取一个。系统抽样要求目标总体无序可排,也无等级结构存在。分组抽样:先将群体分组,再在组内进行随机取样。分层抽样:先将目标总体分成若干层次,再从各层次中随机抽取若干被试,最后把各层的被试组合成常模样本。包括分层比例抽样和分层非比例抽样,25,常模与常模分数,常模常模是一种供比较的标准量数,由标准化样本测试结果计算而来,它是心理测验时用于比较和解释测验结果的参照分数标准。常模有全国常模、区域常模和特殊常模。 常模分数 常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。原始分数本身没有多大意义
12、,必须转换成导出分数。,26,第二单元 常模的类型,发展常模百分位常模标准分常模智商的计算及意义,27,发展常模,发展常模,亦称年龄量表。在此量表中,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。发展常模主要包括:发展顺序量表智力年龄年级当量,28,发展常模(1)/发展顺序量表,最直观的发展常模是发展顺序量表,因为它告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。最早的一个范例是葛塞尔发展程序表,其中按月份显示出儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。,29,发展常模(2)/智力年龄,简称
13、智龄,比内-西蒙量表中首先使用智龄的概念。计算方法:方法一:基础年龄与在较高年龄水平的题目上获得的附加月份之和。方法二:将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个人的智龄。,30,发展常模(3)/年级当量,年级当量实际上就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。其表述方式常常是:某学生的算术是6年级水平,阅读是4年级水平,理解是5年级的水平等。 年级量表的单位通常为10个月,以10个月为一个年级,这种做法是假设一学年中两个月的假期在所测量目标的发展上是不重要的。例如,40(或4.0)表示四年级开始时的平均成绩,45(
14、或4.5)表示学年中间的平均成绩。,31,百分位常模,百分等级指在常模样本中低于这个分数的人数百分比。百分点百分点也称百分位数,与百分等级的计算方法不同。百分等级是计算低于某测验分数的人数百分比,而百分点则是计算处于某一百分比例的人对应的测验分数是多少。四分位数和十分位数四分位数和十分位数是百分位数的两个变式,其含义相似。,32,标准分常模,标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。 1线性转换的标准分数(按下面公式计算)T分数:平均数为50,标准差为10标准九分:以5为平均数,以2为标准差标准十分:平均数为5.5,标准差为1.5
15、;标准二十分:平均数为10,标准差为3 2非线性转换的标准分数(根据常态化转换)对每个原始分数值计算累积百分比/百分等级;在常态曲线面积表中,求出对于该百分比的z分数。,33,智商的计算及其意义,心理年龄/智力年龄比率智商离差智商离差智商表示个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。,34,第三单元 常模分数表示法,转换表法最简单、最基本的表示常模的方法就是转换表,也叫常模表。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。剖面图法剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上的表现
16、及其相对的位置。,35,第三节 测验的信度,第一单元 信度的概念第二单元 信度的估计方法第三单元 信度与测验分数的解释第四单元 影响信度的因素,36,第一单元 信度的概念,信度的定义也称稳定性或可靠性,指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。信度只受随机误差的影响,随机误差越大,信度越低。系统误差产生恒定效应,不影响信度。 信度的指标信度系数:信度指数:信度指数的平方就是信度系数。测量标准误,37,第二单元 信度的估计方法,重测信度 复本信度 内部一致性信度 评分者信度,38,信度的估计方法(1),重测信度(test-retest reliabil
17、ity) 又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最长不超过六个月。重测信度的误差来源主要是时间误差。,39,信度的估计方法(2),复本信度(alternate-form reliability) 又称等值性系数, 它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。复本信度高低主要受内容误
18、差的影响,重测复本信度则既受内容误差影响,也受时间误差影响。,40,信度的估计方法(3),内部一致性信度(internal consistency reliability) 分半信度(split-half reliability) 是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。分半法经常会低估信度,必须通过一些公式去修正,借以估计整个测验的信度。同质性信度(homogeneity reliability)同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,测验为同质的。相反,即使所
19、有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。,41,信度的估计方法(4),评分者信度(scorer reliability) 随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。当多个评分者评定多个对象,并以等级法记分时,可采用特定公式去估计评分者信度。评分者主要用于测量不同评分者之间所产生的误差。,42,第三单元 信度与测验分数的解释(1),解释真实分数与实得分数的相关信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定
20、的,也就是测验的总变异中真分数造成的变异占百分之几。确定信度可以接受的水平当rxx0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70rxx0.85时,可用于团体比较;当rxx0.85时,才能用来鉴别或预测个人成绩或作为。,43,第三单元 信度与测验分数的解释(2),解释个人分数的意义 其一是估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。这就是测量标准误的应用。人们一般采用95%的概率水平,其置信区间为: X1.96SEXT1.961.96SE比较不同测验分数的差异这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。这就是差异分数的标准误问题。当
21、两个分数的差异1.96SEd时,说明有显著意义。,44,第四单元 影响信度的因素,样本特征样本团体的异质性:一般而言,若获得信度的取样团体较常模总体为异质的话,往往会高估测验的信度,相反会低估测验的信度。样本团体的平均能力水平:不同水平的团体,难度不同测验长度:一般来说,在一个测验中增加同质的题目,可以使信度提高。测验越长,测验的测题取样或内容取样就越有代表性。测验越长,被试的猜测因素影响就越小。测验难度通常难度的平均水平为中等难度(0.50)较好。时间间隔,45,第四节 测验的效度,第一单元 效度的概念第二单元 效度评估的方法第三单元 效度的功能第四单元 影响效度的因素,46,第一单元 效度
22、的概念,效度的定义效度也称准确性或有效性,是指所测量的与所要测量的心理特点之间的符合程度。效度除受随机误差影响外,还受系统误差的影响。效度的性质效度具有相对性任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。效度具有连续性测验效度通常用相关系数( )来表示,它只有程度上的不同。我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或效度较低来评价。,47,第二单元 效度的估计方法,内容效度构想效度效标效度,48,内容效度,定义: 也称逻辑效度,指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。估计方法
23、 专家判断法定义好测验内容的总体范围;编制双向细目表,确定内容和技能各自所占的比例;制定评定量表来测量测验的整个效度。统计分析法计算两个评分者之间评定的一致性(评分者信度)两个测验复本上得分之相关(复本信度)再测法也可用于内容效度的评估(测验-学习-再测验)经验推测法这种效度是通过实践来检验效度内容效度与表面效度,49,构想效度,定义:也称构思效度或结构效度,是指测验能够测量到理论上的构思或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构思,解释的程度如何。估计方法 对测验本身的分析测验的内容效度测验的内部一致性分析被试者对题目的反应特点测验间的相互比较相容效度是构思效度的一个
24、证据。区分效度是构思效度的又一个证据。因素分析法也是建立构思效度的常用方法。效标效度的研究证明(效标分组/分数分组,年龄变化)实验法和观察法证实(训练),50,效标效度,定义:又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。估计方法相关法:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。区分法 :是检验测验分数能否有效地分析由效标所定义的团体的一种方法。或者计算每一组内得分超过(或低于)另一组平均数的人数百分比,或者计算两组分布的共同区的百分比。重叠量越大,说明两组分数差异越小,即测验的效度越差。命中率法:命中率法是当测验用来做
25、取舍的依据时,用其正确决定的比例作为效度指标的一种方法。,51,第三节 效度的功能,预测误差效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,其表达式是rxy2,它表示测验正确预测或解释的效标的方差占总方差的比例。另一种表达方法是估计的标准误,简写为Sest,它是指所有具有某一测验分数的被试其效标分数(Y)分布的标准差,也即真正效标分数落在某一范围内有多大可能性。预测效标分数在测验工作中,人们感兴趣的是从测验分数预测效标成绩,因此最常用的是Y对X的回归方程。预测效率指数,52,第四单元 影响效度的因素,测验本身的因素:测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式都
26、会影响效度。测验实施中的干扰因素主试的影响因素:包括指导语、时限、评分、测验情境等。被试的影响因素:包括兴趣、动机、情绪、态度、心身状态等。样本团体的性质样本团体的异质性干涉变量:如动机、兴趣(0.200.60)等。效标的性质效标测量本身的可靠性如何是值得考虑的一个问题。,53,第五节 项目分析,第一单元 项目的难度第二单元 项目的区分度,54,第一单元 项目的难度(1),难度(difficulty)的定义:是指项目的难易程度,在非能力测验中类似的指标称为“通俗性”。计算方法二分法记分的项目未分组资料分组资料非二分记分的项目,55,第一单元 项目的难度(2),难度水平的确定项目的难度:P值越接
27、近于0.50,区别力越高。测验的难度如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分配。正偏态分布,大多数得分集中在低分端,必须增加足够数量的较容易的项目;负偏态分布,大多数得分集中在高高分端,必须增加足够数量的有较高难度的项目。一般来说,最好使测验中所包含的试题的难度在0.50.2之间,平均难度接近0.5.,56,第二单元 项目的区分度,定义:也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。计算方法鉴别指数 D=PH PL相关法常用的计算方法有点二列相关、二列相关和相关法。相关越高,表明项目越具有区分的能力。区分度与难度的关系为了使测验具有更大的区别力,应选择难度值
28、在0.5左右的试题比较合适。假如某测验各试题间的相关系数均为1.00,项目难度均为0.50,则易形成“U”形分布,这样反而降低测验总分的区分能力。,57,第六节 测验编制的一般程序,第一单元 测验的目标分析第二单元 测题的编写第三单元 测题的编排与组织,58,第一单元 测验的目标分析,测验的对象测验的用途测验的目标,59,测验的对象,描述:在编制测验时必须明确测量对象,也就是该测验编成后要用于何种团体。要考虑的因素:年龄、文化程度、社会经济条件及阅读水平等。如WAIS-RC按被试者生活的社会经济条件分为城市版和农村版。,60,测验的用途,描述:所编的测验是要对被试做描述还是预测,是用于诊断还是
29、还是选拔,这一点在测验编制前就应明确的。用途不同,编制测验时的取材范围及试题难度等也不尽相同。测验的分类:显示性测验:指测验题目和要测量的特征相似的测验,比如成就测验,它所反映的是被试具有什么能力,能完成什么任务。预测性测验:为了预测一些没有被测量的行为的测验,即希望测验能作出对未知情况的预测。,61,测验的目标,描述:指编制的测验是测什么的,即测什么样的心理变量或行为特征。目标分析工作分析/选拔和预测功用的预测性测验第一是确定哪些心理特征和行为可以使要预测的活动达到成功 第二是建立衡量被试是否成功的标准,这个标准我们称之为效标 对特定概念下定义/测量某种特殊心理品质的测验确定测验的具体内容/
30、描述性的显示测验,62,第二单元 测题的编写,搜集资料命题原则编制要领,63,搜集资料,已出版的标准测验最简单、最直接的方法是从已经出版的各种标准测验中选择合适的题目 理论和专家的经验理论和专家经验有时也可以作为题目的来源之一 临床观察和记录临床的观察也可以作为题目的来源,64,命题原则 (1),内容方面试题要符合测验的目的;内容取样要有代表性;题目间内容相互独立,互不牵连;文字方面使用准确的当代语言,避免使用生僻的字句或词汇 语句要简明扼要,既要排除与答案无关的因素,又不能遗漏答题所依据的必要条件;最好是一句话说明一个概念,尽量少使用双重否定句 理解方面题目应有确切的答案,题目内容不能超出受
31、测团体的知识水平和理解能力;题目不可令人费解,更不能有歧义。社会敏感性方面避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。,65,命题原则 (2),可是有些测验必须涉及这类社会敏感性问题,那么怎样鼓励被试作出真实的回答呢?菲力普(Phillips,D. L.)列举了几条策略值得参考:命题时假定被试具有某种行为,使他不得不在确实没有该行为时才否定,可避免否定答案过多的倾向。命题时假定规范不一致指出该行为是常见的,虽然是违规的,66,编制要领,对心理测验的题目进行分类的标准很多,常见的分类是根据对被试的要求不同来分,可以分为两大类:提供型(supply)和选择型(selection)题
32、目。 选择型题目:要求被试在几个选项中选择正确答案选择题是非题匹配题提供型题目:要求被试提供答案简答题论文题:填充题,67,第三单元 测验的编排和组织,合成测验测验的预试信度与效度考察常模制定编写指导手册,68,合成测验(1),筛选与审定试题选择试题形式测验的目的和材料的性质:简答题、选择题、论文题接受测验的团体的特点:口头测验、操作测验 各种实际因素:团体纸笔测验、操作测验 审定题目材料内容以及所测量的认知技能上的比率与计划相符,必要时须加以适当调整。题目的数量要比最后所需的数目多一倍至几倍,以备筛选和编制复份。题目的难度必须符合测验的目的。 题目的说明必须清楚明白。,69,合成测验(2),
33、测题的编排编排原则题目的难度排列宜逐步上升;尽可能将同类型的测题尽可能组合在一起;注意根据各种类型测题本身的特点排列题目。编排方式并列直进式:如韦氏智力测验混合螺旋式:如比内-西蒙智力量表,70,测验的预试,预测应注意的几个问题预试对象应取自将来正式测验准备应用的群体;预试的实施过程与情境应力求与正式测验的情况相似预试的时限可稍宽些,以搜集充分的反应资料应将被试的各种反应情形随时加以记录。项目分析确定题目的难度、区分度、备选答案的合适度等 为了检验所选出的项目的性能是否真正符合要求,通常需再选取来自同一总体的另一样本再测一次,并进行第二次项目分析,看两次分析结果是否一致,71,信度和效度考察与
34、常模的制定,信度和效度考察编好后的测验可在小范围内试用,以对其可靠性和有效性进行鉴定,初步确定该测验是否可用。然后再在较大的范围内试用,进一步检验其信度和效度。 信度和效度的考察方法很多,一般应视测量的性质和目的而定。 常模的制定常用的心理测验常模有百分位常模、标准分常模、发展常模及商数等。,72,编写指导手册,测验的目的和功用。测验编制的理论背景以及测验中的材料是根据什么原则、应用什么方法选择出来的。如何实施测验的说明。测验的标准答案和记分标准。常模资料,包括常模表、常模适用的团体及对测验分数如何做解释。测验的基本特征,包括难度、鉴别力、信度、效度和因素分析的资料,以及这些资料取得的条件和情
35、境,包括调查的样本和时间。,73,第七节 心理测验的使用,第一单元 主试的资格第二单元 测验的选择第三单元 测验前的准备及注意事项第四单元 测验实施的程序及要素第五单元 被试误差及控制方法第六单元 测验的评分第七单元 测验结果的报告,74,第一单元 主试的资格,知识结构基础知识相关专业知识专业理论知识和专业技能专业理论知识专业技能职业道德测验的保密和控制使用测验中个人隐私的保护,75,第二单元 测验的选择,所选测验必须适合测量的目的 所选测验必须符合心理测量学的要求信度、效度如何,常模样本是否符合你的测试对象标准化测验必须经常修订,使测验内容、常模样本、分数解释更符合变化了的时代 考虑是否符合
36、我国国情,76,第三单元 测验前的准备及注意事项,测验前的准备工作 预告测验 准备测验材料 熟悉测验指导语 熟悉测验的具体程序 测验中主试的职责 按照指导语的要求实施测验测验前不讲太多无关的话对于被试的反应,主试不应做出点头、皱眉、摇头等暗示性反应 对特殊问题要有心理准备 建立协调关系,77,第四单元 测验实施的程序及要素,指导语对被试的指导语 对主试的指导语 时限典型行为测验/最高作为测验/速度测验测验的环境条件物理环境:光线、通风、温度及噪音水平等。意外干扰:,78,第五单元 被试误差及控制方法,应试技巧与练习效应应试技巧练习效应动机和焦虑因素反应定势求“快”与求“精确”反应定势喜好正面叙
37、述的反应定势喜好特殊位置的反应定势喜好长选项的反应定势猜测的反应定势,79,第六单元 测验的评分,原始分数的获得及时而清楚地记录反应情况 要有一张标准答案或正确反应的表格,即记分键 将被试的反应和记分键比较,对反应进行评分 原始分数的转换要使测验分数具有意义,并且使不同的原始分数可以比较,这就要对它们进行适当的转化处理或者与参照标准加以对照。,80,第七单元 测验结果的报告(1),测验分数的综合分析 把测验分数视为一个范围而不是一个确定的点 分数与他的遗传特征、测验前的学习与经验以及测验情境的关系。除了常模资料外,还应了解测验的信度、效度资料。在解释测验分数时,一定要依据从最相近的团体、最匹配的情境中获得的资料。 来自不同测验的分数不能直接加以比较。以百分等级为中介/线性等值,81,报告分数的具体建议应告知对于测验的分数的解释,并非仅仅报告测验分数。要避免使用专业术语。要保证当事人知道这个测验测量或预测什么。要使当事人知道他是和什么团体在进行比较。要使当事人知道如何运用他的分数。要考虑测验分数将给当事人带来什么心理影响。要让当事人积极参与测验分数的解释,第七单元 测验结果的报告(2),82,Thank You!,
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。