1、统计分析与 SPSS 的应用(第五版) (薛薇)课后练习答案第 6 章 SPSS 的方差分析1、入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。一段时期后得到他们在一个月内的推销额,如下表所示:第一组 20.0 16.8 17.9 21.2 23.9 26.8 22.4第二组 24.9 21.3 22.6 30.2 29.9 22.5 20.7第三组 16.0 20.1 17.3 20.9 22.0 26.8 20.8第四组 17.5 18.2 20.2 17.7
2、 19.1 18.4 16.5第五组 25.2 26.2 26.9 29.3 30.4 29.7 28.21) 请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。2) 绘制各组的均值对比图,并利用 LSD 方法进行多重比较检验。(1)分析比较均值 单因素 ANOVA因变量:销售额;因子:组别 确定。ANOVA销售额 平方和 df 均方 F 显著性组之间 405.534 4 101.384 11.276 .000组内 269.737 30 8.991总计 675.271 34概率 P-值接近于 0,应拒绝原假设,认为 5 种推销方法有显著差异。(2)均值图:在上面步骤基础上,点 选项均
3、值图;事后多重比较LSD多重比较因变量: 销售额 LSD(L) 95% 置信区间(I) 组别 (J) 组别平均差 (I-J) 标准 错误 显著性 下限值 上限第二组 -3.30000* 1.60279 .048 -6.5733 -.0267第三组 .72857 1.60279 .653 -2.5448 4.0019第四组 3.05714 1.60279 .066 -.2162 6.3305第一组第五组 -6.70000* 1.60279 .000 -9.9733 -3.4267第一组 3.30000* 1.60279 .048 .0267 6.5733第三组 4.02857* 1.60279
4、.018 .7552 7.3019第四组 6.35714* 1.60279 .000 3.0838 9.6305第二组第五组 -3.40000* 1.60279 .042 -6.6733 -.1267第一组 -.72857 1.60279 .653 -4.0019 2.5448第二组 -4.02857* 1.60279 .018 -7.3019 -.7552第四组 2.32857 1.60279 .157 -.9448 5.6019第三组第五组 -7.42857* 1.60279 .000 -10.7019 -4.1552第一组 -3.05714 1.60279 .066 -6.3305 .2
5、162第四组第二组 -6.35714* 1.60279 .000 -9.6305 -3.0838第三组 -2.32857 1.60279 .157 -5.6019 .9448第五组 -9.75714* 1.60279 .000 -13.0305 -6.4838第一组 6.70000* 1.60279 .000 3.4267 9.9733第二组 3.40000* 1.60279 .042 .1267 6.6733第三组 7.42857* 1.60279 .000 4.1552 10.7019第五组第四组 9.75714* 1.60279 .000 6.4838 13.0305*. 均值差的显著性
6、水平为 0.05。可知,1 和 2、1 和 5、2 和 3,2 和 4,2 和 5,3 和 5,4 和 5 有显著差异。2、从两个总体中分别抽取 n 1 =7 和 和 n 2 =6 的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格“A” 和单元格 “B” 内的计算结果。答:已知组内均方=组内偏差平方和/自由度, 所以 A=26.4/11=2.4 F 统计量= 组间均方/组内均方 所以 B=7.5/2.4=3.125 3、为研究某种降血压药的适用特点,在五类具有不同临床特征的高血压患者中随机挑选了若干志愿者进行对比试
7、验,并获得了服用该降压药后的血压变化数据。现对该数据进行单因素方差分析,所得部分分析结果如下表所示。1) 请根据表格数据说明以上分析是否满足方差分析的前提要求,为什么?2) 请填写表中空缺部分的数据结果,并说明该降压药对不同组患者的降压效果是否存在显著差异。3) 如果该降压药对不同组患者的降压效果存在显著差异,那么该降压药更适合哪组患者?(1)因 F 检验的概率 P 值小于显著性水平(0.05) ,拒绝原假设,方差不齐,不满足方差分析的前提假设。(2)4*276.032=1104.128; 1104.128+1524.990=2629.118; 4+63=67; 1524990/63=24.2
8、06(3)各组均值存在显著差异。更适合第三组4、为研究某商品在不同地区和不同日期的销售差异性,调查收集了以下日平均销售量数据。日期销售量周一周三 周四周五 周末地区一500060004000600080007000400030005000地区二700080008000500050006000500060004000地区三3000200040006000600050008000900060001) 选择恰当的数据组织方式建立关于上述数据的 SPSS 数据文件2) 利用多因素方差分析方法,分析不同地区和不同日期对该商品的销售是否产生了显著影响3)地区和日期是否对该商品的销售产生了交互影响。若没有显
9、著的交互影响,则试建立非饱和模型进行分析,并与饱和模型进行对比。(1)数据组织方法如下:(2)分析一般线性模型单变量 因变量:销售量;因子:地区、日期 确定。主体间因子值标签 数字1 地区1 92 地区2 9地区3 地区3 91 周一至周三 92 周四至周五 9日期3 周末 9主体间效应的检验因变量: 销售量 源III 类平方和 自由度 均方 F 显著性校正的模型 61.852a 8 7.731 8.350 .000截距 844.481 1 844.481 912.040 .000Area 2.296 2 1.148 1.240 .313Date 2.741 2 1.370 1.480 .25
10、4Area * Date 56.815 4 14.204 15.340 .000错误 16.667 18 .926总计 923.000 27校正后的总变异 78.519 26a. R 平方 = .788 (调整后的 R 平方 = .693)分析:(2)由上表可知,F a1、 Fa2的概率P-值为0.313和0.254,大于显著性水平( 0.05) ,所以不应拒绝原假设,可以认为不同地区和日期下的销售额总体均值不存在显著差异,不同地区和不同日期对该商品的销售没有产生显著影响。(3)产生了交互影响。因为概率P-值接近于0,拒绝原假设,认为不同地区和日期对销售额产生了显著的交互作用。5、 研究者想调
11、查性别(1 为女,2 为男)和使用手机(1 使用,2 不使用)对驾驶状态的影响。在封闭道路开车的 24 人参与了该项研究。其中,12 男 12 女,6 男 6 女使用手机,其余 6 男 6 女不使用手机。用 0-50 分测度驾驶状态,分数越高驾驶状态越好。数据如下:性别 使用手机 得分 性别 使用手机 得分1 1 34 2 1 351 1 29 2 1 321 1 38 2 1 271 1 34 2 1 261 1 33 2 1 371 1 30 2 1 241 2 45 2 2 481 2 44 2 2 471 2 46 2 2 401 2 42 2 2 461 2 47 2 2 501 2
12、 40 2 2 39请问:性别和是否使用手机对驾驶状态有影响吗?如果有影响,影响效应是多少?(1)数据组织方法如下:(2)分析一般线性模型单变量 因变量:得分;因子:性别、是否使用手机 确定。主体间因子值标签 数字1 男 12性别2 女 121 使用 12是否使用手机2 不使用 12主体间效应的检验因变量: Score 源III 类平方和 自由度 均方 F 显著性校正的模型 1028.125a 3 342.708 21.101 .000截距 34732.042 1 34732.042 2138.453 .000Sex 5.042 1 5.042 .310 .584UsePhone 1001.0
13、42 1 1001.042 61.634 .000Sex * UsePhone 22.042 1 22.042 1.357 .258错误 324.833 20 16.242总计 36085.000 24校正后的总变异 1352.958 23a. R 平方 = .760 (调整后的 R 平方 = .724)分析:就性别而言,因为概率 P-值=0.584,大于显著性水平 0.05,所以不应拒绝原假设,认为性别对驾驶状态无显著影响;就手机使用情况而言,因为概率 P-值接近 0,应拒绝原假设,认为手机使用情况对驾驶状态存在显著影响。6、下面的表格记录了某公司采用新、旧两种培训方式对新员工进行培训前后的
14、工作能力评分增加情况的数据。现需要比较这两种培训方式的效果有无差别,考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了纪录。ID Method Month scoreadd ID Method month scoreadd1 1 1.5 9 10 2 2 122 1 2.5 10.5 11 2 4.5 143 1 5.5 13 12 2 7 164 1 1 8 13 2 0.5 95 1 4 11 14 2 4.5 126 1 5 9.5 15 2 4.5 107 1 3.5 10 16 2 2 108 1 4 12 17 2 5 149 1 4.5 12.5 18 2 6 161)请选
15、择适当的数据组织方式将以上数据录入到 SPSS 资料编辑窗口,变量名保持不变,并定义各变量的变量值标签,变量 Method 的变量值标签(1 为旧方法,2 为新方法) 。2) 按不同的培训方法计算加盟时间、评分增加量的平均数。3) 在剔除加盟时间影响的前提下,分析两种培训方式的效果有无差别,并说明理由。(1)数据组织方法如下图:(2) 步骤:数据拆分文件比较组:选择培训方式确定;分析描述统计描述变量:增分、加盟时间;选项:平均值确定。描述统计培训方式 数字 平均值(E)增分 9 10.611加盟时间 9 3.500旧方式有效 N(成列) 9增分 9 12.556加盟时间 9 4.000新方式有效 N(成列) 9(3)分析一般线性模型 单变量 因变量:增分;固定因子:培训方式;协变量:加盟时间确定。注意:请先重置“拆分文件”操作。