1、心理测量(戴海琦版)课后习题答案 第一章 心理与教育测量概论练习与思考练习与思考:1.与物理测量相比较,阐明心理测量的特点。2.为什么人们不能象对物理测量那样容易接受心理测量?(此题为思考题)3.如何才能证明心理测量的必要性和可能性?解答要点:1.(1)从依据的法则来说,心理与教育测量依据的法则在很大程度上只是一种理论。(2)从测量的内容来说,心理与教育测量的内容是复杂的 ,内隐的,其测量只能是间接的。(3) 相对与物理测量的定量分析的精确度而言,心理与教育测量定量分析的精确度很低。3.(1) 从心理与教育测量的理论基础来看,心理测量是可能的。(2) 人的心理现象和知识水平如同其他一切物理现象
2、一样是有差异的,这种差异既有质的方面,也有量的方面,因此有必要测定出这些差异的数量。第二章 心理与教育测量的产生与发展练习与思考练习与思考1.简述古代中国对心理与教育测量的贡献及其特点。2.心理与教育测量从卡特尔到比内的发展过程中可以看出什么特点?(此题为思考题)3.推孟和韦克斯勒在智力测验发展过程中各有什么贡献?解答要点:1.在古代中国,在测验实践和测验理论方面都对心理与教育测量作出了贡献并具有自己的特点。一、在测验实践方面的贡献。1、在能力测量方面。早在2500年前,思想家和教育家孔子凭自己的经验观察,首先评定学生能力的个别差异,并将人的智力分成中上之人、中人和中下之人三个等级。董仲舒已论
3、及到注意测验。刘邵把人的才能划分为12种类型。6 世纪中叶,中国江南出现了类似现在的婴儿发展测验的“周岁试儿“ 习俗。出现于清代的益智图、九连环可以认为是最早的创造力测验。2、在人格测量方面。孔子把人分为狂者、狷者和中行3种。刘邵根据阴阳、五行和形体的关系及其人的行为表现,把人的性格划分成12种类型。3、在教育测量方面。世界上最早的教育测量出现于中国西周奴隶时期。据记载,在西周的“国学 “中已经建立具有相当系统性的教育测量制度。在汉代,考试制度、考试类型和考试功能方面都作了重要的发展。除了学校内部测量的自身发展以外,取士制度自汉以来的发展,客观上也对我国的古代乃至西方的教育测量发展起了促进作用
4、。二、在测验理论方面的贡献。孔子后约150年,大思想家孟子就指出了测量人类心理的必要性和可能性。他说:“权,然后知轻重;度,然后知长短。物皆然,心为甚。“ 刘邵认为,人才鉴定对于知人善任、振兴国家事业具有重要意义。他说:“夫圣贤之所美,莫美乎聪明。聪明之所贵,莫贵乎知人。知人诚智,则众材得其序,而庶绩之业兴矣。“三、古代中国心理与教育测量的特点。 第一、中国古代社会的心理与教育测量思想都是描述性的,而非定量的;第二、中国古代社会的心理与教育测量是分类式的;第三、注重对人作整体的鉴定和评价,并倾向于和人的道德品质联系起来。第四、是与教育中的因材施教及人才使用有着密切的联系,它从一开始就具有强烈的
5、应用性质。3. 推孟在智力测验发展过程中的贡献是他采用了比率智商的概念来表示智力水平的高低。韦克斯勒在智力测验发展过程中的贡献是:第一,他用离差智商代替比率智商,克服了比率智商的局限;第二,他编制的智力量表分为言语量表和操作量表两部分,不仅能够获得总体智力水平的信息,而且可以获得手测者智力优势的信息。第三章 经典测量理论的基本假设练习与思考练习与思考:1.简述“心理特质“的含义。2.心理测量的误差来源主要包括哪些?3.CTT 模型及其假设的重要内容是什么?答案要点:1.心理特质指表现在一个人身上所特有的相对稳定的行为方式,就是人的心理特质。可以从下面几个方面来理解:(1)特质是一组具有内部相关
6、的行为的概括,具有一定的抽象性。(2)特质是 “一种一般的神经心理系统,它可以综合不同刺激,使人对这些刺激做出相同的反应“。(3)特质是一个人身上比较稳定的特点。(4)一个人的精神面貌(人格)是由多种特质分多个层次有机组合而成的。(5)特质可以决定一个人对特定刺激的反应倾向,可以对人的行为进行某种预测。2.心理测量的误差主要来自3个方面:测量工具、被测对象和施测过程。3.CTT 模型是:经典测验理论假定,观察分数(记为 X)与真分数(T )之间是一种线性关系,并只相差一个随机误差(记为 E) 。即:X=T+E其主要内容为:(1)若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分
7、数的平均值会接近于真分数。即:E(X)=T 或 E(E )=0(2)真分数和误差分数之间的相关为零。即: ( T,E)=0(3)各平行测验上的误差分数之间相关为零。即: ( E1,E2)=0第四章 测量信度练习与思考 练习与思考:1.指出各种信度系数所对应的误差来源。2.已知16人参加一次测验后在奇数题和偶数题上的得分情况,试用两种以上方法估计测量信度。(此题为思考题)被 试 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16奇数题 32 40 42 28 35 30 41 28 32 34 26 34 36 25 40 41偶数题 31 39 45 30 40 29
8、 39 30 32 30 30 40 36 26 40 423.已知某态度量表用道题,被试在各题上得分的方差分别是0.80,0.81,0.79,0.78,0.80,0.82,测验总分的方差为16.00,求 值。 (此题为思考题)4.怎样提高测量信度?解答要点: 1.对重测信度来说,其对应的误差来源有:所测量的心理特质不稳定;遗忘和练习的效果没有相互抵消;在两次施测的时间间隔里,所要测的被试的心理特质得到了学习和训练;两次测查的时间间隔不同在信度不同。对复本信度来说,其对应的误差来源有:所用的复本不是真正的平行测验; 产生的迁移效应会影响信度的大小。对分半信度来说,其对应的误差来源有:分半的方法
9、会影响测验的信度。对同质性信度来说,其对应的误差来源有:题目间的相关性; 测验所测内容的单一性与异质性。对评分者信度来说,其对应的误差来源有:3. =6/6-11-(0.80+0.81+0.79+0.78+0.80+0.82)=6/5(1-0.3)=0.844.由于项目数量太少会降低测量的信度,所以,提高测量信度的一个常用方法是增加一些与原测验中项目具有较好的同质性的项目,增大测验长度。但是应该注意:1.新增项目必须与试卷中原有项目同质。2.新增项目的数量必须适度。适当增加测验的长度。使测验中所有试题的难度接近正态分布,并控制在中等水平。当测验中所有试题的难度接近正态分布并控制在中等水平时,被
10、试团体的得分分布也会接近正态分布,且标准差会较大,以相关为基础的信度值必然也会增大。努力提高测验试题的区分度。努力提高测验试题的区分度。选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。主试者严格执行实测规程,评分者严格按标准给分,实测场地按测验手册的要求进行布置,减少无关因素的干扰。第五章 测量效度练习与思考 练习与思考:1.什么是测量的效度?它与信度的关系这样?2.什么是内容效度?测验编制者和使用者应分别从哪几个方面来把握内容效度?3.什么是结构效度?测验编制者和使用者应分别怎样把握结构效度?4.什么的实证效度?它与内容效度和结构效度有何异同?5.什么是效标和效标测量?6.已知
11、若希望把效度系数提高到0.65和0.70,则测验长度要增加几倍?解答要点:1.(1)效度是指一个测验或量表实际能测出其所要测的心理特质的程度。信度高是效度高的必要而非充分条件当随机误差的变异( )减小时,真实分数的变异数增加,测验信度( )随之提高。信度的提高只给有闲变异数( 的增加提供了可能)至于是否能提高效度,还要看系统误差变异数( 的大小) 。可见,信度高不一定效度就高。但一个测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高。测验的效度受它的信度制约根据效度和信度的定义( )以及公式( )可得到:2.(1)内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度
12、。(2)测验的编制者和使用者应该从以下几个方面来把握内容效度:首先应该明确内容效度的含义;应该明确内容效度的应用范围;在使用时还要主要不要跟表面效度相混淆;对测验的编制者来说应该懂得确定测验内容效度的方法,明确确定内容效度的步骤。3.(1)结构效度是指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。(2)对于编制者和使用者来说应该从以下几个方面来把握结构效度:首先应该明确结构效度含义;其次也应该了解结构效度的特点;应知道结构效度的应用范围;对测验的编制者来说应该懂得确定测验结构效度的方法,明确确定结构效度的步骤。4.(1 )实证效度
13、是指一个测验对处于特定情境中的个体的行为进行估计的有效性。(2)实证效度与内容效度和结构效度一样都用于估计测验效度。(3)实证效度与内容效度和结构效度的不同之处在于:它们是估计测验效度的不同方面;它们的应用范围不同;确定它们的方法也不同。5.(1 )效标是衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得的我们所感兴趣的行为。(2)效标测量就是把我们所感兴趣的行为用数字或等级表达出来。6题:得当效度系数提高到0.65时,测验长度要增加6.4倍;当效度系数提高到0.70时,测验长度要增加20倍。第六章 测验的项目分析练习与思考1.测验项目分析的作用是什么?1.因为用测验的项目分
14、析可以解决以下问题:(一)项目是否具有所预期的功能?对于常模参照测验,测题是否有足够的区分度?对目标参照测验来说,测题是否能充分地测量到教学的结果。(二)项目的难度是否得当?(三)项目是否有缺陷?第七章 测验常模练习与习题 练习与思考:1.试比较各种导出分数的优缺点。2.列举你所了解的各种测验的分数合成方法,并评价它们的合理性。3.选择常模团体与制定常模有什么关系?任何选择好常模团体?4.离差智商与比率智商的本质差异是什么? (此题为思考题)解答要点:1.常用的导出分数有百分等级、标准分数、T 分数。百分等级百分等级的优点:百分等级是一种相对位置量数,具有可比性,且具有易于计算、解释方便等优点
15、,对一般教师、学生和家长来说,均能了解百分等级的意义,所以它较适用于不同的对象和性质不同的测验。另外,百分等级不受原始分数分布状态的影响,即使分数分配不是正态的,也不会改变百分等级常模的解释能力。百分等级的缺点:(1)百分等级的单位不等,尤其在分配的两个极端。如果原始分数的分配是正态或近似正态分布,则靠近中央(平均数或中位数附近)的原始分数转换成百分等级时,分数之间的差异便夸大了,虽然原始分数比较靠近,但转换成百分等级后,却显示出很大的差异性;对接近两极端的原始分数,百分等级反应迟钝,即使原始分数发生较大的变化,也不能引起百分等级的相应变化,使得其差异被缩小了。(2)百分等级只具有顺序性,无法
16、用它来说明不同被试之间分数差异的数量。它不适合计算平均数、相关系数及其它统计量数。(3)百分等级只相对于特定的被试团体而言的。因此在解释时不能离开特定的参照团体。被试得分不变,但参照团体改变了,百分等级值就可能发生变化。所以在报告百分等级时,一定要说明是相对于什么参照团体来说的。标准分数标准分数的优点:标准分数是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理。具有可比性和可加性。标准分数的缺点:由于计算中经常出现负数和小数,且单位过大(一个标准差单位) ,所以,使用起来不够方便。T 分数T 分数的优点:(1) 具有等单位特点,便于工作进一步的统计分析。(2)正态分布下,可以利用正
17、态分布表将各种导出分数与百分数等级分数作换算。(3)正态分布下,运用某种变式分数可以将几个测验上的分数作直接的比较。即使是非正态分布,也可运用由正态化的 Z 分数转换而得的变式分数进行直接比较分析。T 分数的缺点:(1)分数过于抽象,不易理解,正如在介绍麦柯尔的 T 分数时所提到的那样不为一般人所熟悉。(2)在非正态分布下,分布形态不同的变式分数,仍然不可以作相互比较,也不能相加求和。2.(1)临床诊断- 直觉合成:在实际工作中,最常用的组合测验分数的方法是根据经验对测验分数作直觉的组合,这就好比临床医生,把各种化验、检验所获得的资料与实际观察所得的结果结合起来,根据经验作出诊断一样。象这种根
18、据直觉的经验,主观地将各种因素加权,而获得结论或预测的方法叫作临床诊断。临床诊断-直觉合成的合理性表现在:具有高度的综合性。它允许我们从整体上来考察问题,充分考虑各测验所测特质间交互影响,各测验上所得分数的对比关系与组合类型的结构特点,测验分数与实际反应表现其中的生动关系等。具有灵活的针对性,能就特定的个人作具体的结论。而一般的统计方法具有常模性,常模性的统计模式难于适应每个个体所具有的独特性,更难于适应非典型的新颖形式。(2)加权求和合成:如果各个测验所测特质间相互代偿作用,这些测验上的分数又是连续性资料,并能大体同时获得,那么可以采用加权求和的立法对分数进行合成。加权求和合成的合理性表现在
19、:将变量做了等量加权后适合于各测验对预测效标具有同等重要性的场合,根据各个变数与效标之间的经验关系作差异加权后适合于各测验对预测效标具有不相等的场合。(3)多重回归:多重回归就是研究一种事物或现象与其他多种事物或现象在数量上相互联系和相互制约的统计方法。多重回归的合理性表现在:(4)多重划分:多重划分就是在各个特质上都确定一个标准,从而把成绩划分为合格与不合格两类。在一个测验上合格了,不能保证总的要求一定能合格。只有每个测验都合格时,总要求才算合格。多重划分的合理性表现在:3.选择常模团体与制定常模的关系:制定常模首先要确定出常模团体。应该这样选择常模团体:(1) 群体构成的界限必须明确。在确
20、定常模团体时,必须清楚地说明所要测量的群体的性质与特征。虽然有关常模团体的一般规定取决于测验的目的与使用,且可能有多个常模团体。但对每个常模团体的性质和特征必须有一个简短而明确的描述,若群体过大,群体内部也许有许多小团体,它们在一个测验上的表现也时常有差异,假如这种差异较为显著,就必须对每个小团体分别建立常模。例如,艾森克个性预测(EPQ) ,就是分性别,以不同年龄组而建立常模的。(2) 常模团体必须是所测群体的一个代表性样本。当所要测量的群体较小时,将所有的被试逐个测量以得到常模。在群体较大时,则不可能如此,只能测量一部分被试作为群体的代表,此时就存在取样是否具有代表性的问题。如果常模团体缺
21、乏代表性,将会使常模资料产生偏差,从而影响到测验结果解释的准确性。为了克服取样偏差,保证具有代表性,一般在抽样时应遵循随机化原则,采用统计学的方法抽取样本。关于具体抽样方法,可参阅有关统计学著作中的抽样推断部分。(3) 取样的过程必须明确且有详尽的描述。取样的过程必须明确且有详尽的描述,这主要是为了使测验的使用者不至于误用测验和错误地解释测验结果,所以在一般的测验手册中,都有相当篇幅详细介绍常模团体的大小、取样策略、取样时间以及其他有关情况。这些说明和描述越明确、越详尽夜好。(4) 样本大小要适当。所谓“大小适当 “并没有明确的指标。根据统计学原理,取样误差与样本大小成反比。所以,在其他条件相同时,样本越大越好。但是还应考虑到人力、物力等方面的因素,通常在决定样本大小时,应注意:总体的数目。总体数目小,样本相应可小些,但不应过小,若总体过小,则可将全部被试入选;当总体较大时,相应样本也大。群体的性质,如果群体性质单一,则样本不必太大,即可以反映群体性质;若群体性质复杂,则样本容量(n)就应大一些。测验结果的精确度。根据统计学原理,抽样误差的大小与样本容量成反比,若要提高精