1、心理测量学知识第一节 概述第一单元 测量与测量量表一、什么是测量:1、测量概念:测量是依据一定的法则用数字对事物加以确定。2、测量三要素:1)事物:指我们要测量的对象(就是心理能力和人格特点) 。2)数字:是代表某一事物或事物的某一属性的量。这些数值具有自然娄的特点:区分性;序列性(等级性) ;等距性;可加性3)法则:代表的是测量所依据的规则和方法法则有好坏之分。 二、测量要素:1、参照点(零点):指计算的起点:1)绝对零点:意义为“无”2)相对零点:指人定的参照点 理想的参照点是绝对零点;很难找到绝对零点,多采用人为标定相对零点。2、单位:是测量的基本要求。好的单位的条件:1)有确定的意义;
2、2)有相同的价值。心理测量的单位不够完善,既无统一的单位,也不符合等距的要求。三、测量量表:1、量表:是一种尺度,是测量的工具,是测验的表现形式;心理测验是心理测量的一个部分。2、测量的本质:1)是根据某地法则将事物数量化;2)定有单位和参照点的连续体称为量表;3、量表的种类:1)命名量表:是最低水平的一种量表形式。(1)概念:只是用数字来代表事物或把事物归类。(2)分类:代号用数字来代表个别事物(如学生编号)类别用数字代表某一具有某种属性的事物的全体(3)数字只能用作标记和分类,不能作数量化分析。2)顺序量表:比命名量表水平高。在心理测量中最常用。(1)概念:数字不仅指明类别,同时指明类别的
3、大小或含某种属性的程度。(2)特点:无相等单位、无绝对零点、数字仅表示等级,并不表示某种属性的真正量或绝对值。3)等距量表:比顺序量表高级。(1)特点:A、不但有大小关系,还有相等的单位和相对零点,但只能做加、减运算(不能乘除)B、其数值加或减一个数值或用一个常数乘或除,不会破坏原来数据之间的关系(2)常用于感觉测量4)等比量表:为最高水平的量表。 特点:有相等单位和绝对零点;可做加、减、乘、除第二单元 心理测验的基本概念一、心理测验的定义:1、定义:心理测验,就是依据心理学理论,使用一定的操作程序,通过观 察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的
4、一种科学手段。2、特点:1)心理测验测量的是人的行为;即一个人对测给题目的反应;2)心理测验在测量个别差异的时候,往往对是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。不免有某种程度的偏差;(样本是指有代表性的样本) 。3)测验的条件对所有的被试者都必须是相同的(测验的标准化) ;4)个人在测验中所得的原始分数,只有下其他人的分数或常模比较才有意义;(常模指一般人即正常人的平均水平) ;二、心理测验的性质:1、间接性即通过对测验项目的反应来推论他的心理特质。2、相对性每个人的测得结果都是与所在的团体或大多数人的行为或某种人为确定的标准相比较而言的。3、客观性即测验的标准化问
5、题,包括:1)测验用的项目或作业、施测说明、施测者的言语态度及施测时的物 理环境等,均经标准化,测验的刺激是客观的;2)评记分的原则和手段经过了标准化,对反应的量化是客观的;3)分数转换和解释经过了标准化,对结果的推论是客观的。第三单元 心理测验的分类一、按测验的功能分类:1、智力测验Binet-Simon 智力测验Stanford-Binet 智力量表Wechsler 儿童和成人智力量表2、特殊能力测验3、人格测验问卷法:MMPI、16PF、EPQ 投射法:罗夏测验、主题统觉测验( TAT)二、按材料的性质分类:1、文字测验MMPI、EPQ、16PF、Wechsler 儿童和成人智力量表中的
6、文字 部分1)优点方便 2)缺点容易受被试者文化程度的影响 3)应用团体测验较多用2、操作测验(非文字测验):图片类操作罗夏测验、TAT、Raven 测验、Wechsler 儿童和成人智力量表中的操作量表1)优点不受文化因素的影响 2)缺点不适宜团体实施,费时3、有时二类测验常常结合作用,如: Binet-Simon 智力量表原主要是文字测验,修订后则增加了操作测验成分; Wechsler 的三套智力量表(幼儿、儿童、成人)每套均有文字和操作二类测验。三、按测验材料的严重程度分类:1、客观测验绝大多数的心理测验都属些类测验2、投射测验:1)特点:刺激没有明确意义,问题模糊;对被试的反应没有明确
7、规定;2)常用测验:罗夏测验、主题统觉测验(TAT) 、 自由联想测验、句子完成测验。四、按测验的方式分类:1、个别测验:如:Binet-Simon 智力量表、Wechsler 智力量表个别测验材料不能以团体的方式进行。2、团体测验最早使用,著名的有陆军甲种和乙种测验;团体测验材料也可作个别实施如MMPI、EPQ 、16PF 等。五、按测验的要求分类:1、最高作为测验:要求被试者尽可能做出最好和回答,主要与认知过程 有关,有正确答案。如:智力测验、成就测验。2、典型行为测验:要求被试者按通常习惯方式做出反应,没有正确答案。如:各种人格测验。第四单元 纠正错误的测验观 一、错误的测验观:1、测验
8、万能论 2、测验无用论 3、心理测验即智力测验二、正确的测验观:1、心理测验是重要的心理学方法之一,是决策的辅助工具。2、心理测验作为研究方法和测量工具尚不完善。3、心理测验的最大问题是基础理论不够坚实。第五单元 心理测验在心理咨询中的应用一、智力测验吴天敏修订的中国内比量表龚耀先等人修订的韦氏成人智力量表(WAIS-RC)韦氏儿童智力量表(C-WISC)和韦氏幼儿智力理表(C-WYCSI)林传鼎等人修订的韦氏儿童智力量表(WISC-CR )张厚粲主持的瑞文标准型测验(SPM)李丹等修订的联合型瑞文测验(CRT)二、人格测验艾森克人格问卷(EPQ)卡特尔 16 人格因素问卷(16PF)明尼苏达
9、多项人格调查表(MMPI)为临床诊断量表三、心理评定量表精神评定量表躁狂状态评定量表抑郁量表焦虑量表恐怖量表心理测验是分析求助者心理问题的工具,它不但可以检验咨询人员的判断是否正确,还能帮助其对求助者的问题进行深入的分析。在咨询和心理治疗过程中并不是必不可少的一个环节。一般来讲,心理测验应在咨询关系尚未建立之前实施,也可在咨询无法进行下去时实施。第六单元 心理测验的发展史一、科学心理测验的产生与发展:1、心理测量及统计学的奠基人高尔顿:测量智力的个体差异; 为心理测验奠定了统计学基础;第一个提出了相关的概念2、皮尔逊创立积差相关法 智力年龄(用年龄作智力的准则)3、卡特尔主张测验手续和考试方法
10、就有统一规定要有常模比较4、比内、西蒙最早提出智力测验智力量表(1905 年)19 世纪 80 年代是高尔顿的十年;90 年代是卡特尔的十年;20 世纪头十年是比内的智力测验的十年5、此后心理测验的主要发展:1)操作测验的发展 2)团体智力测验的发展 3)能力倾向测验的发展4)人格测验的发展先驱:克雷丕林自由联想测验 罗夏测验投射测验的发端二、现代心理测验在我国的发展:我国近代心理测验大约源于 1914 年前后。二十世纪二、三十年代,我国心理学家曾二次修订过比内-西蒙量表。第二节 测验的常模第一单元 常模团体一、常模团体的性质1、常模团体:是由具有某种共同特征的人所组成的一个群体,或者是该群体
11、的一个样本。2、常模团体在某方面的心理特质:常模是用一个标准的、规范的分数表示出来,以提供对个体作比较或评价的基础。3、任何一个测验都有多个可能的常模团体。如智力测验分儿童智力测验和成人智力测验。4、对测验编制者来说,常模的选择主要基于对所要施测的总体的认识。团体常模团体必须能够代表所要研究或施测的总体,具体工作包括:确定一般总体、确定目标总体、确定样本5、对测验的使用者来说,要考试的问题是,现有的哪个常模团体最适合。标准化测验通常提供许多原始分数与各种常模的比较转换表。有时能够适用的常模团体不止一个。6、常模团体的成员。二、常模团体的条件1、群体的构成必须明确界定;定义常模团体的标准(变量)
12、有:性别、年龄、职业、教育水平、社会经济地位、种族等。2、常模团体必须是所测群体的代表性样本;3、样本大小要恰当:取样误差与样本的大小成反比; 样本大小一般 30100,全国性 20003000,最好为题量的 5 倍;样本大小适当的关键是样本要有代表性。4、标准化样组是一定时空的产物三、取样的方法1、取样:是指从总体(目标人群)中选择有代表性的样本。2、分类:1)随机取样 2)非随机取样3、具体取样方法:1)简单随机取样:概念:总体中每个个体均有独立的等概率被被抽取的可能。常用方法:抽签法和随机数字法(如从 50 随机选取 10 人) 。2)系统取样:概念:假设总体数目为 N,选择 1/K 的
13、被试作为样本,则样本的大小(n)为:n = N1/K(K = N/ n)给被试编号,按组距 K 分段,每段取 1 人注意事项:要求目标总体无序可循,也无等级结构存在例如:从 40 人中抽取5 人,从第 3 号开始抽取,为 3、11、19、27、35 3)分组取样:如:按个方面条件基本相同的学校取样适用于:总体数目大,而且群体有多样性,将群体分组,在组内随机取样。注意事项:要求尽可能减小组间差异,尽量加大组内差异4)分层取样:方法:将目标群体按某种变量(如年龄)分成若干层次,再从各层次中随机抽取若干被试。特点:使各层次差异显著。同层次保持一致,增加了样本的代表性注意事项:要求尽可能加大层次间的差
14、异,尽量减小层次内的差异分类: (1)分层比例取样: (2)分层非比例取样:各层次的差异很大时采用四、常模分数与常模1、常模分数:就是施测常模样本后,将被试者的原始分数按一定规则转换出来的导出分数。原始分数:是指被试者的反应与标准答案相比较而获得的测验分数。导出分数:原始分数本身没有多大意义,必须有一个参照标准才行,在心理测验中,这种标准是由原始分数构成的分布转换而来的分数,叫导出分数。导出分数具有一定的对照点和单位,它实际上是一个有意义 的测验量表,它与原始分数等值,可以进行比较。2、常模:就是常模分数构成的分布,它是解释心理测验分数的基础。一般常模:常为测验指导书上列出的常模。特殊常模:为
15、非典型群体建立的,如某个单位。特殊常模的建立方法:根据样本的原始分数制作次数分布图,再计算出导出分数,最后制成转换表。第二单元 常模的类型一、发展常模(年龄量表):就是根据不同年龄上各种发展水平的人的平均表现(如智力、技能、感觉运动等方面的发展水平)所制定的量表。1、发展顺序量表:与发育正常的儿童相比,按年龄评定一个儿童的心理发展水平。1)葛尔塞发展程序量表:按月份显示发育正常儿童在运动水平、适应性、语言、社会性四个方面的发展水平,以此作为标准,评定个体的发展水平。强调儿童早期行为的发展是有规律的。2)皮亚杰的发展理论对守恒概念的研究:5 岁时才会理解质量守恒; 6 岁才会掌握重量守恒; 7
16、岁时才有容量守恒概念。守恒:是指二种等量的物体,只要无增无减,无论怎么组合,它们在质量、重量、长度、数量及容量等方面仍然是相等的。2、智力年龄(个体的智力所达到的年龄水平智龄)1)比内-西蒙智力量表首先使用智力年龄的概念;智龄是年龄量表上度量智力的单位。编制出可区分各年龄儿童的智力水平的测题,这些测题的难度随年龄而逐渐加大,2)为每个年龄水平都编制一些适当的题目,其中的每个测题是该年龄组大部分儿童都能完成的。以智力年龄(智龄)作为度量智力的单位。智力年龄是指一个儿童在年龄量表上所得的分数。3)智力年龄的计算方法:范例:吴天敏修订的比内-西蒙智力量表:每个年龄组各有 6 个测题,每答对一题增加智
17、龄 2 个月先确定基础年龄(智力量表中全部被通过的那一组测题所代表的年龄) 。例如:六岁组的测题全部答对,更高年龄组的测题只有部分答对,或都未通过,则基础年龄为六岁,再求答对的更高年龄组上的测题数量,每答对一题增加智龄 2 个月。智力年龄=基础年龄+ 更高年龄组上通过的测题数量所代表的智龄增长的月数3、测定智力年龄的另一种方法测题不分年龄组以标准化样本中每个年龄组的平均分数作为年龄常模将个人的原始分数与年龄常摸作比较,计算其智力年龄4、年级当量实际上就是年级量表。将一个学生和同年级学生相比。年级量表的单位通常为 10 个月间隔(故 10 个月为一个学年) 。二、百分位常模1、百分等级:1)是应
18、用最广的表示测验分数的方法;2)一个测验分数的百分等级是指在常模样本中低于该分数的人数百分比;即百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低;3)分类:(1)未分组资料的百分位数:计算:PR = 100 -(100R-50)/N R 是原始分数排列顺序,N 是指总人数(样本的总人数)(2)分组资料的百分等级:2、百分点(百分位数):是计算处于某一百分比例的人对应的测验分数是多少;是分数量表上相对于某一百分等级的分数点,又称百分位数(PP)可根据直线内插法计算(举例:高考成绩): (100- 百分等级)/(最高分-PP)=(百分等级-1/PP- 最低分)原始分数
19、和百分等级可互相转换,由此编制的原始分数与百分等级的对照表,称为百分位常模。3、四分位数和十分位数1)四分位数:将分数量表分成四等份,相当于百分等级的 25%、50% 和 75%三个百分点分成的四段;2)十分位数:将分数量表分为十段:10%、20% 等三、标准分数(标准分数):1、是将原始分数与平均数的距离以标准差为单位表示出来的量表;2、其基本单位是标准差;3、常用的标准分数有:z 分数、Z 分数、T 分数、标准九分数、离差智商(IQ)等。4、分类:1)线性转换的标准分数:(1)适用于正态(常态)分布的数据资料;(2)z 分数为最典型的线性转换的标准分数;(3)z 分数: z =(X-M)/
20、SD X 为任一原始分数,M 为样本平均数, SD 为样本标准差。z 分数可以用来表示某一分数与平均数之差是标准差的几倍。(4)转换后的 Z 分数:Z=A+Bz Z 为转换后的标准分数,A、B 为根据需要指定的常数;加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小而去掉小数点;加或乘一个常数并不改变原来分数间的关系。2)非线性转换的标准分数:(1)原始分数不是常态分布使之常态化(常态化过程是非线性的) ;(2)常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均差,并可以表示为任何平均数和标准差。(3)计算步骤:A、对每个分数值计算累积百分数B、在常态曲线面
21、积中,求出对应的该百分比的 z 分数所得的 z 分数可将分布分成几部分,称之为 z分数,以区别由线性转换所求得的 z 分数。与线性导出分数一样,常态化标准分数也可以被转化为任何方便的形式,并可用以下表示:C、T 分数以 50 为平均数(即加上一个常数 50) ,以 10 为标准差(乘以一个常数理 10) ,即: T= 50 +10 z (平均数为 50,标准差为 10)D、标准九分:其量表是个 9 级分数量表(平均数为 5,标准差为 2)E、标准十分平均数为 5,标准差为 1.5;标准二十分平均数为 10,标准差为 3。 (使用最广、影响最大的一种常态化标准分数是离差智商)四、离差智商及其含义
22、:在最早的比内西蒙智力测验中没有智商的概念,只用“心理年龄”(MA)来表示被试智力的高低。目前一般都用比率智商和离差智商来表示智力的高低。1、比率智商(IQ):为心理年龄( MA)与实足年龄(CA )之比。为避免小数,将商数乘以 100。计算公式IQ = MA/CA100 如果一个儿童的心理年龄等于实足年龄,他的智商就 为 100。IQ 等于 100 代表正常的或平常的智力。比率智商并不适合于年龄较大的被试。2、离差智商:是一种以年龄组为样本计算而得的标准分数;韦克斯勒将离差智商的平均数定为 100,标准差为 15;离差智商表示的是个体智力在年龄组中所处的位置;是表示智力高低的一种理想指标。计
23、算公式:IQ=100+15z=100+15(X-M )/SD X 表示被试的量表分数, M 表示被试所在年龄水平的平均量表分数, SD 表示这一年龄水平被试的量表分数的标准差。将原始分与 IQ 值的对应关系计算出来作为常模表(P344表) 。韦克斯纳:平均数定为 100,标准差为 15斯-比测验:平均数为 100,标准差为 16第三单元 常模分数的表达方法一、转换表法(常模表)是最简单而且最基本的表示常模的方法。1、一个转换表显示出一个特定的标准化样组的原始分数与其对应的等值分数百分位、标准分数、T 分数或其他任何分数。利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义
24、的解释。2、简单的转换表就是将单项测验的原始分数转换成一种或几种导出分数(P346 表 52) 。复杂的转换表通常包括几个分测验或几种常模团体的原始分数与导出分数的对应关系(P347 表达3)二、剖面图是将测验分数的转换关系用图形表示出来。可以很直观地看出被试在各分测验上的表现及其相对位置(P346 表 51) 。标准差代表一组数据的离散程度,如一个班内学生数学成绩的离散程度从理论上说,心理测量数据一般服从为正态分布,或接近正态分布正态分布曲线的形状取决于标准差,但曲线下的面积始终为 1 个单位在心理测量中,个体在团体中的相对位置,以 Z 分数的大小表示,而 Z 分数是标准差作为单位,既以包含
25、几个标准差表示个体分数与总体平均分数的距离,而不是用两者的绝对分数之差表示表示个体在团体中的相对位置根据 Z 分数可确定低于或某或高于某个分数的人数比例,也可以对不同的测量结果进行比较心理统计基本知识第三节 测验的信度第一单元 信度的概念一、信度的定义:1、信度:是指同一被试者在不同时间内用同一测验(或一个同等形式的测 验)重复测量,所得结果的一致程度。2、信度是评价一个测验是否合格的重要指标之一;也是标准化心理测验的基本要求之一。3、信度只受随机误差的影响。随机误差越大,信度越低。4、实得分数(X)总是由真实分数(T)和误差(E)二部分构成的:X=T+E5、如果我们讨论一组测验分数的特性时,
26、可用方差代表具体分数;公式如下:S 平方 x=S 平方 T+S 平方 E S 平方 x 是测验实得分数的方差; S 平方 T 是测验真分数的方差; S 平方 E 是测验误差的方差。在测量理论中,信度被定义为:一组测量分数的真分数方差现总方差(实得分数的方差)的比率。即:rxx=S 平方 T/S 平方 x 此公式还可以转化为:rxx=S 平方 x-S 平方 E/S 平方 x=S 平方 E/S 平方 x 因此,信度也可以看作在总的方差中非测量误差的方差所占的比例。二、信度的指标1、信度系数与信度指标:1)大部分情况下,信度是以信度系数为指标的,它是一种相关系数。是同一被试样本所得的两组资料的相关,
27、理论上说就是真分数方差与实得分数的方差的比值;公式是:rxx=r 平方 XT=S 平方 T/S 平方 X2)公式中的 r 平方 TX 是真分数标准差与实得分数的标准差的比值,称信度指数;3)信度指数的平方就是信度系数。2、测量标准误:1)信度系数仅表示一组测量的实得分数与真分数的符合程度,但并没有直接指出个人测验分数的变异量。由于存在误差,一个人所得分数有时比真分数高,有时比真分数低,有时二者相等。2)如用一组被试二次测验结果来代替对同一人的反复测试,于是就有了信度的另一个指标测量的标准误。公式是:SE=S 根号 1- r 公式中 SE 为测量的标准误,Sx 是所得分数的标准差,rxx 为测验
28、的信度系数。信度越高,标准误越小;信度越低,标准误越大。第二单元 信度的评估方法一、重测信度(稳定性系数):1、方法:采用重测法。即使用同一测验,在同样条件下以同一组被试者前后施测二次测验,求二次得分间的相关系数。2、优点:能提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据。3、缺点:是易受练习和记忆的影响。4、二次测验的最适宜时距一般是二周到四周较宜。二、复本信度(等值性系数)1、方法:以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在二个测验上得分的相关系数,反映的是测验在内容上的等值性。在应用上,应该有关数的被试先做 A 本再做 B 本,另一半被试先做 B
29、 本再做 A 本。2、要考虑两个复本实施测试的时间,若相隔一段时间,称稳定与等值系数3、优点:能免避免重测信度的一些问题;4、缺点:1)测量行为易受练习的影响,复本信度只能减少而不能完全消除这种影响;2)由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题。三、内部一致性信度内部一致性系数主要反映是的题目之间的关系,表示测验能够测量相同内容或特质的程度。包括:1、分半信度:1)概念:指采用半分法估计所得的信度系数。2)方法:只需一种测验形式,实施一次测验。按奇、偶题分为等值的两部分,分别计算在二半测验上的分数,求出二半分数的相关系数。这个相关系数就代表了二半测验内容
30、取样的一致程度,因而属于内部一致性信度系数。3)采用积差相关方法计算信度系数。在其他条件相同的情况下,测验越长,信度越高。半分法经常会低侉信度必须修正。修正公式:斯皮尔曼-布郎公式。公式下下:rxx=2rhh/1+rhh 式中 rhh 为一半分数的相关系数,rxx 为测验在原长度时的信度会计值。2、同质信度:同质性主要代表测验内容所有题目间的一致性。同质:指各测题的得分有实高的正相关,不论题目的内容和形式如何;异质:指各测验的得分相关很低或为负相关,即使所有题目看起来好象测量同一特质。计算公式:库德-理查逊公式:最常用的是 KR20 公式(测量同质性信度)克伦巴赫系数 系数四、评分者信度:少用
31、。一般要求在成对的受过训练的评分者之间平均一致性达 0.90 以上,才认为评分是客观的。 多人评定信度的估计,可采用肯德尔和谐系数(W) 。第三单元 信度与测验分数的解释一、解释真实分数与实得分数的相关:信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。二、确定信度可接受的水平:一般原则是:1)当 r0.70 时,测验不能用于对个人做出评价或预测,且不能作团体比较;2)当 0.70r 0.85 时,可用于团体比较;3)当 ro,85 时,才能用来鉴别或预测个人成绩或作为。三、解释个人分数的意义;一是估计真实分数的范围;二是了解实得分
32、数再测时可能的变化情形。真分数的置信区间,一般采用 95%的或然水平,其置信区间为:X-1.96SEX X+1.96SE也就是说,大约有 95%的可能性真分数落在分数 1.96SE 的范围内,或有 5%的可能性落在范围之外。实际上也表明了再测时分数改变的可能范围。四、比较不同测验分数的差异:包括二个人不同分数的差别和同一被试在二个测验上的差别,这就是差异分数的标准误问题,其公式为:SEd=根号 2-rxx-ryy式中 SEd 为差异的标准误,S 代表二个测验使用的标准差。要求两测验的标准差相同;在统计上,经常要求二个分数在差异程度达到 0.05 显著性水平,才能承认不是误差的影响。第四单元 影
33、响信度的两个重要因素一、样本特征:1、样本团体异质性的影响:一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。2、样本团体平均能力水平的影响二、测验长度:1、在一个测验中增加同质的题目,可以使信度提高;2、测验越长,测验的测题取样或内容取样就越有代表性;3、测验越长,被试的猜测因素影响越小;4、测验的长度最少应增加的题数:斯皮尔曼-布郎公式三、测验难度理想平均难度为:五择一题,0.70;四择一题,0.74;三择一题,0.77;是非题,0.85。四、时间间隔对重测信度和不同时测量的复本信度有影响;二次测验间隔时间越短,其信度系数越大;间隔时间越久,信度系数
34、便载低。第四节 测验的效度第一单元 效度的概念一、效度的定义:效度是指一个测验实际测量的与所要测量的心理特点之间符合的程度,也就是指一个心理测验的准确性。测量的效度除受随机误差的影响外,还受系统误差的影响。可信的测验未必有效,而有效的测验必定可信。信度是效度的必要条件。二、效度的性质:1、效度具有相对性 2、效度具有连续性第二单元 效度的估计方法一、内容效度:1、定义:内容效度是指测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。2、编制要求:1)要对所测量的心理特征有个明确的概念,并划定出哪些行为与这种心理特性有关,以较密切;2)测验题目应是界定的内容范
35、围的代表性取样。3、评估方法:1)专家判断法:步骤:(1)定义好测验内容的总体范围;(2)编制双向细目表;(3)制定评定量表。2)统计分析法:步骤:(1)计算两个评分者之间评定的一致性;(2)同一组被试在两个复本上得分的相关;(3)再测法求相关。3)经验推测法:调查、观察等。4、内容效度的特性: 1)不是普遍适用的 2)常与表面效度混淆二、构想效度(构思效度、结构效度)1、定义:测验能够测量到理论上的构想或特质的程度。即:测验的结果是否能证实或解释某一理论的假设,术语或构想,解释的程度如何。2、构想效度的估计方法:1)对测验本身的分析:通过研究测验内部结构来界定理论构思,从而为构思效度提供证据
36、。(1)测验的内容效度分析;(2)测验的同质性指标;(3)被试对测题的反应特点。2)测验间的相互比较:(1)相容效度(与成熟的测验比较) ;(2)区分效度(与不同构思的测验比较) ;(3)因素分析法。3)效标效度的研究证明:一个测验若效标效度理想,那么该测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标。(1)采用效度理想的效标;(2)心理特质的发展变化基本规律。4)实验法和观察法证实 三、效标效度(实证效度)1、概念:效标效度是预测个体在某种情景下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标。2、分类:1)同时效标:即测验所得的分数可与效标同时验证,通常与心理特征的
37、评估及诊断有关。2)预测效度:其效标资料需要一段时间才可搜集到,通常用于选拨、分组。3)一个好的将近标必须具备的条件:(1)必须最有效在反映测验的目标; (2)必须具有较高的信度,稳定可靠;(3)可以客观地加以测量,可用数据或等级来表示; (4)测量方法简单、经济实用。3、评估方法:1)相关法:最常用。求测验分数与效标资料之间的相关称效度系数效度系数的计算方法:积差相关法点二列相关公式二列相关公式2)区分法:是检验测验分数能否有效地区分由效标所定义的团体(t 检验)的一种方法。组间平均数差异在统计表的显著决策 取决于团体大小。当团体实大时,平均数间的小差异在统计上也变得有意义,但测验区分这些团
38、体的实际价值很小。为了避免这一点,应该分析高分组(前 27%)与低分组(后 27%)分布的重叠量。重叠量越大,说明二组分数差异越小,即测验的效度越差。3)命中率法:是当测验用来做取舍的依据时,用春正确决定的比例作为效度指标的一种方法。方法:(1)确定一个临界值:高于临界值者预测其成功;低于临界值者预测其失败。 (2)预测是否成功:正确的预测命中;不成功的预测失误。第三单元 效度的功能一、预测误差1、效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,它表示测验正确预测或解释的效标的方差占总方差的比例。2、另一种表达方法是估计的标准误(Sest) ,它是指所有某一测验分数的被试其效度分
39、数(Y)分布的标准差,也即预测误差大小的估计值,是真正分数估计的误差大小。计算公式:Sest = Sy 根号 1r 平方 xy 式中:r 平方 xy 代表系数的平方,即决定系数;Sy 为效标成绩的标准差。估计的标准误可如同其他标准误一样解释。真正效标分数落在预测分数1Sest 的范围内,有 68%的可能性;落在预测效标1.96%Sest 的范围内,有 95%的可能性;落在预测效标分数2.58Sest 的范围内,有 99%的可能性。二、预测效标分数:建立回归方程,从测验分数预测效标分数三、预测效率指数:E=100(1- K), K=根号 1-r 平方 xy=Sest/ Sy ,根号 1r 平方
40、xy 为无关系数四、信度和效度的关系信度是效度的必要条件而不是充分条件效度受信度的制约一个好的效标必须具备的条件:能有效地反映测验目标具有高的信度可以客观测量测量方法要简单第四单元 影响效度的因素一、测验本身的因素:1、测验取材必须对对整个内容具有的代表性 2、测题设计时应尽量避免容易引起误差的题型(如是非题) 3、测题难度要适中,具有较高的区分度 4、测验长度要恰当,即要有一定的测题量 5、测题的排列按先易后难顺序编排二、测验实施中的干扰因素: 1、主试的影响因素 2、被试的影响因素三、样本团体的性质: 1、样本团体的异质性:一般来说,样本团体越异质,分数分布范围越大,测验效度就越高。 2、干涉变量四、效标的性质:1、效标效度是以测验分数与效标测量的相关系数来表示的; 2、效标本身测量的可靠性3、效标与测验分数之间的关系是否线性关系第五节 项目分析第一单 元项目的难度一、定义:项目难度指项目(题目)的难易程度。常以通过率表示:P=R N100% P 代表项目的难度,N 为全体被试者人数,R 为答对或通过该题目的人数。
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。