1、1考研专业课大纲解析心理测量学2心理测量大纲解析一、心理测量的基本理论(一)心理测量的理论基础1.心理测量的基本概念心理测量 :根据一定的法则用数字对人的行为加以确定,即依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的值,是一种间接的测量。早期探索者:高尔顿:人类测量实验室 应用统计方法到对个别差异的资料中卡特尔:首次提出“心理测验”这个术语桑代克 是现代教育测验运动之鼻祖心理量表的要素有:1.参照点;2.单位(单位要有意义,有价值)“心理测量”与“心理测验”的区别这两个概念在很大程度上是重叠的,但他们又存在显然的区别。心理测验是了解人心理的工具和手段,主要在名
2、词意义上使用;而心理测量则是运用测验来了解人类心理的时间活动,主要在动词意义上使用。因此相对而言心理测量的意义范围更广一些一个心理测验必须具备以下 三个要素 :行为样本测验必须有特定的目标和对象,这些被测量的与心理特性有关的行为代表就称行为样本标准化测验的编制、实施、记分等过程必须是具有一致性的,这样对不同结果的比较才有意义记分原则测量必须有结果,这些结果的记录和解释规则必须是清晰明确的,以便不同人进行施测2.心理测量的特征与分类(1)心理测量的特征间接性 心理属性是内在的不可直接测量到的特质,但可表现为一系列具有内在联系的外显行为,测量者可以通过一定的方法测量这些外显行为,并由这些行为判别特
3、质的性质。相对性 对人的行为进行比较,没有绝对的标准,亦即没有绝对零点,有的只是一个连续的行为序列。所有的心理测量都是看每个人处在这个序列的什么位置上,也就3是只有顺序量表的特征。客观性 实际上就是测验的标准化问题。测验用的项目,说明、言语、态度、评分、分数转换、解释都需要标准化。(2)心理测量的分类按所测量的对象(心理特征)分类:智力测验 能力倾向测验(即能力测验)成就测验(即学绩测验)人格测验按接受测量的人数分类:个别测验 团体测验按测验目的分类:描述性测验 诊断性测验预示性测验按测验材料分类:文字测验 非文字测验(即操作性测验)按评价所参照的标准分类:常模参照测验 目标参照测验 潜力参照
4、测验按测验的难度和时限分类:速度测验(测反应速度)难度测验(测最高能力)按测验的要求分类:最高行为测验(要求作出最好的回答)典型行为测验(按习惯做题)按测验的性质分类:构造性测验(任务明确)投射性测验(问题模糊,如TAT)按测验的应用分类:教育测验 职业测验 临床测验各类量表所对应数据处理方法表量表类型 称名量表 顺序量表 等距量表 比率量表单位和零点 无(名字) 无(名次) 有相等单位(温度) 有相等单位,绝对零点(时间)四则运算 无 无 加减 加减乘除统计方法 百分比、次数、众数、卡方检验 中位数、百分位数 均数、标准差、积差相关、t 检验等 几何平均数、 变异系数*注:高级量表可运用比其
5、低级的量表的所有统计方法进行数据处理(二)经典测量理论1.经典测量理论及其模型(1)基本定义真分数 :反映被试某种心理特质真正水平的数值,这是一个在理论上构想出来的抽象概念,在实际测量中很难得到观察分数 :实测到的分数,即我们希望通过改进和完善测量工具及方法的方式来使得观察分数尽量接近真分数。可测性假设:心理特质是一种客观存在,凡客观存在的事物都有其数量,凡有数量的4东西都可以测量CTT 数学模型: XTE其中 X 表示观察分数;T 表示真分数;E 表示随机误差(不包含系统误差) (10 单)(2)CTT 模型的三个假设公理测量误差的均值为零;即 E(X)=T 或 E(E)=0 ;真分数和误差
6、分数之间的相关为零,即 (T,E)=0 ;各平行测验上的误差分数之间相关为零,即 (E1,E2)=0 ;平行测验 :题目不同的测验测的是同一特质,且题目形式、数量、难度、区分度以及测查等值团体后所得分数的分布一致(3)CTT 模型的方差关系在一次测量中,被试观察分数的方差等于其真分数方差与误差分数方差之和 22XTES真分数变异还可以分成与测量目的有关的变异和与测量目的无关的变异 22TVI这就是说,一次测验中,一个团体的实测分数之间的变异性是由与测量目的有关的变异数(S V2) 、稳定但出自无关来源的变异数(S I2)和测量误差的变异数(S E2)决定的。(4)经典测量理论的局限对信度的估计
7、精度不高,平行测验难以实现误差指标笼统单一,难以精确计算个体被试的独立误差各种参数的估计对样本抽样的依赖太大,而获得代表性样本却很困难参数指标之间的配套性较差,与被试水平参数之间关系模糊(参数与被试水平不在同参照系上)真分数与观测分数之间存在线性关系的假定不合理(5)经典测量理论的优点1.CTT 以随机抽样理论为基础,建立在简单的数学模型之上,直观易懂,易于被人理解和接受,计算也简便,容易推广2.理论假设较弱,对实施条件要求不严格,适用性广,对许多测验结果都能方便分析3.多数情况下 CTT 还是足够精确的,测验结果是可信的。2.测量的信度与效度测量的信度(1)信度的定义信度 :指测量结果的稳定
8、性程度,若能用同一测量工具反复测量某人的同一种心理特5质,则多次测量的结果间的一致性程度就叫信度。信度的三个等价操作定义:信度是一个被测团体的真分数的变异数与实得分数的变异数之比信度是一个被试团体的真分数与实得分数的相关系数的平方信度是一个测验与其任意一个平行测验的相关系数(这个定义具有实际意义)信度的作用:信度是测量过程中所存在的随机误差大小的反应信度可以用来解释个人测验分数的意义 1xxSEr信度可以帮助进行不同测验分数的比较2dxyr(2)信度系数的估计重测信度 重测信度 :用同一个量表对同一组被试施测两次所得结果的一致性程度(主要是被试特质的稳定性问题) ;计算:其大小等于同一组被试两
9、次测验所得分数的皮尔逊积差相关系数;使用前提:所测量的心理特性必须是稳定的(难度测验无法使用重测信度)遗忘和练习的效果基本上互相抵消两次测验的间隔期内被试的特质没有变化*注:重测信度是几个信度系数中最接近信度内涵,考虑因素最全面的一个信度系数。复本信度复本信度 :两个平行的测验测量同一批被试所得结果的一致性程度(主要是测验间的等值性问题) ;计算:其大小亦等于两次测验分数的皮尔逊积差相关系数。前提:有条件构造出两份或以上真正平行的测验被试有条件接受两个测验*注:复本信度是最严格的一个,其值相比其它信度最低。分半信度分半信度 :将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度,
10、也可以把对等的半测验看作是在最短时距内施测的两个平行测验。计算:先按照复本信度的方式计算出两个半测验各自的信度,然后用斯皮尔曼-布朗6公式校正:(r hh两半分数间的相关系数,r xx为整个测验的信度值)21hXr若两个分半测验分数变异不等时则用弗朗那根公式: 221abXXSr或卢伦公式: (S a2与 Sb2分别为各半的变异数;S d2为两半测验得分2dXXr之差的变异数)前提:通常在只能施测一次或没有复本的情况下使用,测验无法分半时不可用;由于将测验分半的方法很多,因此一个测验有多个分半信度值;同质性信度同质性信度 :也叫内部一致性系数; 测验内部所有题目间的一致程度这里的一致性指有两层
11、含义:一是所有题目都测的都是同一种心理特质,二是所有题目得分之间都具有较高的正相关;测量单一特性是同质性高的必要条件,而非充分条件;反过来,同质性高才是测验的单一特性的充分条件;计算:KR20公式: , 为题目数, 为答对答错21iX XpqKrSKipq题的比例,S x为总分数的变异;(仅适用于 0,1 记分)i克龙巴赫 系数: , 表示所有被试在2iX XrS2i题上的分数变异;注意: 只是测验信度的下界的一个估计值,即 值大,必有较高的i信度;但 值小,却不能断定信度不高;(不要求测验题目只是 0,1 记分,可以处理任何测验的内部一致性系数的计算问题)荷伊特信度: 1XMSr人 题人评分
12、者信度评分者信度 :多个评分者给同一批人的答卷进行评分的一致性程度计算:评分者为 2 用积差相关或等级相关,大于 2 用肯德尔和谐系数进行估计 (3)信度的影响因素与改进(07、11 简答)7信度的影响因素 :(随机误差大,信度就低,随机误差小,信度就高)1.被试方面:单个被试而言:被试的身心健康状态,应试动机,耐心等会影响测量误差;被试团体而言:被试团体异质时,全体被试的总分分布必然较广,以相关计算出来的信度就必然会大;( ,分数的分布越广,分母越大,从而 越大)xExr21 xr2.主试方面:主试不按照指导手册中的规定施测,故意制造紧张气氛,则会使信度大大降低;3.施测情境方面:考场是否安
13、静,光线,通风情况都可能影响信度;4.测量工具方面:试题的取样,试题之间的同质性程度,试题的难度(难度也会造成分布形态的问题,因此不能太难或太易)等是影响测验稳定性的主要因素;5.两次施测的时间间隔:时间间隔越短,其信度越大,时间间隔越长,信度可能越小;提高信度的方法 :适当增加测验的长度: (K 表示扩大的倍数, 为现测验信度)1()lxlrrlr可将公式转化记忆: ()lxr新增题目必须与试卷中原有题目同质,数量必须适度(报酬递减规律)使测验中试题的难度接近正态分布,并控制在中等水平提高测验试题的区分度选取恰当的被试团体,提高在同质性较强的亚团体上的信度主试严格执行实测规程,评分者严格按标
14、准给分,实测场地按测验手册要求进行布置,减少无关因素的干扰(社会敏感度高效度必须高,不同测验信度要求不同。几个例子见课本)注:目标参照测验的信度必须以概化理论为基础才能较好处理,详见对应章节。测量的效度(1)效度的定义效度 :指一个测验能否测出其所要测量的心理特质和测量到这种特质的程度。使用效度时应注意:(1)效度是一个相对的概念,这种相对性表现在两个方面效度是相对于一定的测量目的而言的;心理测量不可能达到 100%的准确,只能达到某种程度上的准确;8而由于任何量表的编制都有目的,正常情况下效度也不会为 0。(2)效度是测量的随机误差与系统误差的综合反映;(3)判断一个测量是否有效要从多方面收
15、集证据;效度=r 2xy =S2v/S2x;其中,r 2xy为效度系数;S 2v代表有效变异数,S 2x代表总变异数;效度的操作定义:效度是总变异中由所测量的特性造成的变异所占的百分比; (2)效度的估计内容效度内容效度 :一个测验实际测到的内容与所要测量的内容之间的吻合程度;其中所测量的内容包括:欲测的知识范围以及该范围内各知识点所要掌握的程度两方面;(注意区别 表面效度 :外行人看来的测验的题目与测验目的的相符程度,基本上不能算是一种效度;最佳行为测验往往表面效度高,其他测验则希望表面效度低)确定方法:主要是 逻辑分析法 ,即请专家对测验项目与原定内容范围的吻合程度做出判断适用范围:内容效
16、度主要应用于成就测验,也适合于某些用于选拔和分类的职业测验,而不适合能力和人格测验明确欲测内容的范围,包括知识范围和能力要求两个方面(双向细目表)确定每个题目所测得内容,并与测验编制者所列的双向细目表对照制定评定表,考察题目对内容的覆盖率及其比例和内容的适当性并判断题目难度与能力要求间差异统计法 (克隆巴赫提出):从同一内容中抽两套平行测验对一批被试测验,两次相关高说明有较高效度(除非两个测验偏向同一方面) ;也可以用 再测法 ,通过后测成绩与前测成绩比较,如果后测成绩显著优于前测成绩,说明所测内容正是被试新近学习的内容;结构效度结构效度 :测验能说明心理学上的理论结构或特质的程度,或用心理学
17、上某种结构或特质来解释测验分数的恰当程度结构指用来解释人类行为的理论框架或心理特质,是心理学中抽象的假设性概念、特性或变量。特点:结构效度的大小首先取决于实现假定的心理特质理论,因此结构效度的结果有些不能比较当实际测量的资料无法证实我们的理论假设时,不一定表明该测验结构效度不高9结构效度是通过对测量内容的选择的证据累计起来确定的,不是靠单一数量指标描述的确定方法:提出理论假设,并把假设分解成一些细小的纲目依据理论框架,推演出有关测验成绩的假设用逻辑的和实证的方法来验证假设应用范围:主要用于智力测验、人格测验等估计方法:从 测验内 部寻找证据,先考察测验的内容效度;其次分析被试的答题过程;再次,
18、计算同质性信度来检验结构效度,当然测验同质只是结构效度高的必要条件;在 测验间 寻找, 相容效度法 (将新编测验与已知有效的测验比较) ; 区分效度法 (考察新编制测验与某个已知能有效测量与新测验不同特质的旧测验的相关)以及 因素分析法 (通过对一组测验进行因素分析,找出影响测验的共同因素)考察测验的 实证效度 :有两种做法,一种是根据效标把人分为两类,考察其得分的差异;另一种是根据测验的得分把人分为高分组和低分组,考察这两组人在所测特质方面是否确有差异; 多种特质多种方法矩阵法 (多种极不相同的方法测量同一特质相关很高说明效度较高) ;实证效度实证效度 (效标效度):一个测验对处于特定情景中
19、的个体的行为进行估计的有效性,即以实践效果作为检验有效性的标准被估计的行为是检验测验效度的标准,简称 效标 ,根据效标资料搜集的时间差异,实证效度可分为 同时效度 (效标与测验分数同时收集,诊断现状)和 预测效度 (效标在测验后据工作成绩确定,预测某个个体未来的行为)两种。*效标选择的要求:有效、可靠、客观、实用估计方法:相关法计算测验分数与效标测量(如高考分数)的相关系数区分法被试接受测验后,让他们工作一段时间,再根据工作成绩的好坏分成两组。这时再回过头来分析这两组被试原先分数的差异,若两组人测验分数差异显著,则说明测验效度较高命中率有两种:总命中率是指选出的合格人数与不合格人数在总数中的比
20、例;正命中率是指用测验选出的人中在后续工作中合格者所占的比例,比例越高测验越有效(3)效度的影响因素与改进影响因素 :101.测验的构成:一般而言,增加测验长度可以提高信度,从而为提高效度提供了可能(测验长度与效度的公式 ) 、其中 是测验增长至1()( xxyykxKrrykxr)(原来的 K 倍后,新测验与效标的相关;K 为增长的倍数; 为原测验的效度; 为原测y x验的信度;)2.测验的实施过程:实测过程如不按标准化进行或出现意外,则效度降低3.被试情况:被试状态会造成随机误差从而影响效度;团体被试若缺乏必要的同质性(比如测老人智力混进几个年轻的) ,则很可能得到不恰当的效度资料。测验偏
21、倚 :不适当的测验施测在不适当的人群上所产生的偏差。4.所选效标的性质:效标与测验分数间必须符合线性关系,否则皮尔逊积差相关计算将得出错误结论,而采用不同效标所导致的效度差异也应重视。5.测量的信度:信度高是效度高的必要条件提高方法 :精心编制测验量表,避免出现较大的系统误差妥善组织测验,控制随机误差创设标准的应试情景,让每个被试都能发挥正常的水平选择正确的效标、定好恰当的效标测量,正确地使用有关公式;信度和效度的关系根据公式 ,可以得到信度与效度的关系如下:22XVIESS信度高是效度高的必要而非充分条件信度系数的平方根是效度系数的最高上限3.心理测量的误差(1)测量误差的定义测量误差 :在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应;心理测量的误差包括以下两种:随机误差 :由与测量目的无关的、偶然因素引起的、而又不易控制的误差,它使多次测量产生不一致的结果,其方向和大小的变化完全是随机的,只符合某种统计规律。系统误差 :由与测量目的无关的变量引起的一种恒定而又规律的效应,这种误差稳定的存在与每次测量之中,尽管多次测量结果一致,但仍与真实值有所差异。系统误差只与效度有关,随机误差与效度、信度都有关(08 单选)测量的随机误差来源及控制(1)来源