1、统计分析与 SPSS 的应用(第五版) (薛薇)课后练习答案第 5 章 SPSS 的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。原假设:样本均值等于总体均值 即u=u0=75步骤:生成 spss 数据分析比较均值单样本 t 检验相关设置输出结果(Analyze-compare means-one-samples T test;)采用单样本 T 检验(原假设 H0:u=u0=75,总体均值与
2、检验值之间不存在显著差异) ;单个样本统计量N 均值 标准差 均值的标准误成绩 11 73.73 9.551 2.880单个样本检验检验值 = 75 差分的 95% 置信区间t df Sig.(双侧) 均值差值 下限 上限成绩 -.442 10 .668 -1.273 -7.69 5.14分析:指定检验值:在 test 后的框中输入检验值(填 75) ,最后 ok!分析:N=11 人的平均值(mean)为 73.7,标准差(std.deviation)为 9.55,均值标准误差(std error mean)为 2.87.t 统计量观测值 为-4.22,t 统计量观测值的双尾概率 p-值(si
3、g.(2-tailed))为 0.668,六七列是总体均值与原假设值差的 95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较 a 和 p。T统计量观测值的双尾概率 p-值(sig.(2-tailed) )为 0.668 a=0.05 所以不能拒绝原假设;且总体均值的 95%的置信区间为(67.31,80.14),所以均值在 67.3180.14 内,75 包括在置信区间内,所以经理的话是可信的。2、在某年级随机抽取 35 名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1) 请利用 SPSS 对上表数据进行描述统计,并绘制相关的图形。(2) 基于上表数据,
4、请利用 SPSS 给出大学生每周上网时间平均值的的置信区间。(1)分析描述统计 描述、频率(2)分析比较均值 单样本 T 检验每周上网时间的样本平均值为 27.5,标准差为 10.7,总体均值 95%的置信区间为 23.8-31.2.3、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。然而心理学家则倾向于认为提出事实的方式是有关系的。为验证哪种观点更站得住脚,调查者分别以下面两种不同的方式随机访问了足球球迷。原假设:决策与提问方式无关,即u-u0=0步骤:生成spss数据分析比较均值两独立样本t 检验相关设置输出结果表 5-3组统计量提问方式 N 均值 标准差 均值的标准误丢
5、票再买 200 .46 .500 .035决策丢钱再买 183 .88 .326 .024表5-4独立样本检验方差方程的 Levene 检验 均值方程的 t 检验差分的 95% 置信区间F Sig. t dfSig.(双侧)均值差值标准误差值 下限 上限假设方差相等 257.985 .000 -9.640 381 .000 -.420 .044 -.505 -.334决策 假设方差不相等-9.815 345.536 .000 -.420 .043 -.504 -.336分析:由表 5-3 可以看出,提问方式不同所做的相同决策的平均比例是 46%和 88%,认为决策者的决策与提问方式有关。由表
6、5-4 看出,独立样本在 0.05 的检验值为 0,小于0.05,故拒绝原假设,认为决策者对事实所作出的反应与提问方式有关,心理学家的观点更站得住脚。分析:从上表可以看出票丢仍买的人数比例为 46%,钱丢仍买的人数比例为 88%,两种方式的样本比例有较大差距。1.两总体方差是否相等 F 检验:F 的统计量的观察值为 257.98,对应的P 值为 0.00,;如果显著性水平为 0.05,由于概率 P 值小于 0.05,两种方式的方差有显著差异。看假设方差不相等行的结果。2.两总体均值(比例)差的检验:.T 统计量的观测值为-9.815,对应的双尾概率为 0.00,T 统计量对应的概率 P 值0.
7、05 不应该拒绝原假设。采用独立样本t 检验法所得结果如表5-10,5-11所示,可以看出均值差为0.892在置信区间内 sig值为0.405,大于0.05 ,故不能拒绝原假设。所以,两种饲料使用后的钙存量无显著差异。6、如果将第2章第9 题的数据看作是来自总体的样本,试分析男生和女生的课程平均分是否存在显著差异?原假设:男女生课程平均分无显著差异步骤:分析比较均值单因素分析因变量选择课程,因子选择性别进行输出结果:表 5-12描述poli均值的 95% 置信区间N 均值 标准差 标准误 下限 上限 极小值 极大值female 30 78.8667 10.41793 1.90205 74.97
8、65 82.7568 56.00 94.00male 30 76.7667 18.73901 3.42126 69.7694 83.7639 .00 96.00总数 60 77.8167 15.06876 1.94537 73.9240 81.7093 .00 96.00表5-13ANOVApoli平方和 df 均方 F 显著性组间 66.150 1 66.150 .288 .594组内 13330.833 58 229.842总数 13396.983 59分析:由表5-12和5-13可以看,出男生和女生成绩平均差为 1.4021在置信区间内 sig值为0.307,大于0.05,故不能拒绝原假
9、设,即认为男生和女生的平均成绩没有显著差异7、如果将第2章第9 题的数据看作是来自总体的样本,试分析哪些课程的平均分差异不显著。 步骤:计算出各科的平均分:转换计算变量相关的设置表 5-14组统计量sex N 均值 标准差 均值的标准误female 30 67.5208 9.08385 1.65848averagemale 30 68.9229 9.85179 1.79868重新建立 SPSS 数据分析比较均值单因素进行方差齐性检验选择 Tukey 方法进行检验。利用配对样本 T 检验,逐对检验8、以下是对促销人员进行培训前后的促销数据: 试分析该培训是否产生了显著效果。培训前 440 500
10、 580 460 490 480 600 590 430 510 320 470培训后 620 520 550 500 440 540 500 640 580 620 590 620原假设:培训前后效果无显著差异步骤:生成spss数据分析比较均值配对样本t 检验相关设置输出结果表 5-15成对样本统计量均值 N 标准差 均值的标准误培训前 489.17 12 78.098 22.545对 1培训后 560.00 12 61.938 17.880表5-16成对样本相关系数N 相关系数 Sig.对 1 培训前 & 培训后 12 -.135 .675表5-17成对样本检验成对差分差分的 95% 置信
11、区间均值 标准差均值的标准误 下限 上限 t dfSig.(双侧)对 1 培训前 - 培训后-70.833 106.041 30.611 -138.209 -3.458 -2.314 11 0.41分析:由表 5-15,5-16,5-17 可以看出,培训前与培训后的均值差为 70.83 ,由 sig 值为0.041,小于 0.05,故拒绝原假设,认为培训前后有显著差异 即培训产生了显著效果成对样本检验成对差分差分的 95% 置信区间均值 标准差均值的标准误 下限 上限 t dfSig.(双侧)对 1 培训前 - 培训后-70.833 106.041 30.611 -138.209-3.458 -2.314 11 .041