ImageVerifierCode 换一换
格式:DOC , 页数:12 ,大小:1.25MB ,
资源ID:1113374      下载积分:5 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-1113374.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(《统计分析与SPSS的应用第五版》课后练习答案第10章.doc)为本站会员(h****)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

《统计分析与SPSS的应用第五版》课后练习答案第10章.doc

1、统计分析与 SPSS 的应用(第五版) (薛薇)课后练习答案第 10 章 SPSS 的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。要求:1) 根据凝聚状态表利用碎石图对聚类类数进行研究。2) 绘制聚类树形图,说明哪些省市聚在一起。3) 绘制各类的科研指标的均值对比图。4) 利用方差分析方法分析各类在哪些科研指标上存在显著差异。采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。大约聚成 4 类。步骤:分析分类 系统聚类 按如下方式设置结果:凝聚计划组合的集群 首次出现阶段集群阶段 集群 1 集群

2、2 系数 集群 1 集群 2 下一个阶段1 26 30 328.189 0 0 22 26 29 638.295 1 0 73 20 25 1053.423 0 0 54 4 12 1209.922 0 0 155 8 20 1505.035 0 3 66 8 16 1760.170 5 0 97 24 26 1831.926 0 2 108 7 11 1929.891 0 0 119 5 8 2302.024 0 6 2210 24 31 2487.209 7 0 2211 2 7 2709.887 0 8 1612 22 28 2897.106 0 0 1913 6 23 2916.551

3、 0 0 1714 10 19 3280.752 0 0 2515 4 21 3491.585 4 0 2116 2 3 4229.375 11 0 2117 6 13 4612.423 13 0 2018 9 18 5377.253 0 0 2519 14 22 5622.415 0 12 2420 6 15 5933.518 17 0 2321 2 4 6827.276 16 15 2622 5 24 7930.765 9 10 2423 6 27 9475.498 20 0 2624 5 14 14959.704 22 19 2825 9 10 19623.050 18 14 2726

4、2 6 24042.669 21 23 2827 9 17 32829.466 25 0 2928 2 5 48360.854 26 24 2929 2 9 91313.530 28 27 3030 1 2 293834.503 0 29 0将系数复制下来后,在EXCEL中建立工作表。选中数据列,点击“插入”菜单拆线图碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。其他略。接下来,添加一个变量 CLU4_1,其值为类别值。 (1、2、3、4) ,再数据汇总设置 确定。均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值方差分析结果:分析比较均值单因素 ANOVA设置

5、确定ANOVA平方和 df 均方 F 显著性组之间 59778341.196 3 19926113.732 26.428 .000组内 20357294.159 27 753973.858投入人年数总计 80135635.355 30组之间 16485966.820 3 5495322.273 34.553 .000组内 4294074.147 27 159039.783投入高级职称的人年数总计 20780040.968 30组之间 132451401880.884 344150467293.628 324.318 .000组内 3675602946.794 27 136133442.474投

6、入科研事业费(百元)总计 136127004827.677 30组之间 16470536.564 3 5490178.855 32.181 .000组内 4606273.436 27 170602.720课题总数总计 21076810.000 30组之间 7203690.385 3 2401230.128 61.327 .000组内 1057167.809 27 39154.363专著数总计 8260858.194 30组之间 219675698.219 3 73225232.740 17.693 .000组内 111743385.717 27 4138643.915论文数总计 3314190

7、83.935 30组之间 169882.049 3 56627.350 3.619 .026组内 422436.790 27 15645.807获奖数总计 592318.839 30不同组在各个聚类变量上的均值均存在显著差异。2、试说明当变量存在数量级上的差异,进行层次聚类分析时为什么要对数据进行标准化处理?因为数量级将对距离产生较大影响,并影响最终聚类结果。3、试说明变量之间的高度相关性是否会对层次聚类分析结果造成影响?为什么?会。如果所选变量之间存在较强的线性关系,能够相互替代,在计算距离时同类变量将重复“贡献” ,占有较高权重,而使最终的聚类结果偏向该类变量。4、试说明 K-Mean 聚

8、类分析的基本步骤。K-Means 聚类分析步骤:确定聚类数目 K-确定 K 个初始类中心点-根据距离最近原则进行分类 -重新确定 K 个类中心点-判断是否已经满足终止条件。是一个反复迭代的分类过程。在聚类过程中,样本所属的类会不断调整,直至达到最终稳定为止。5、收集到我国 2007 年各地区城镇居民家庭平均每人全年消费支出数据,数据文件名为:“消费结构.sav” , 变量包括:地区、消费性支出总额、食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务、医疗保健、杂项商品和服务支出。若采用层次聚类法(个体间距离定义为平方欧氏距离,类间距离定义为组间平均链锁距离) ,绘制的

9、碎石图如下:(1)依据上图,数据聚成几类较为恰当?(2)试采用 K-MEANS 聚类方法,从类内相似性和类间差异性角度分析将数据聚成几类较为恰当。(1)聚成 3 类较为恰当。注:碎石图可按第 9 章第 1 题方式绘制,也可按如下方式绘制。步骤:分析降维 因子分析导入全部变量到变量框中(地区变量除外)抽取:选中碎石图继续确定。得到:(可以看出,分成 3 类恰当)(2)用K-MEANS聚类方法进行分类,比较分类数为2、3、4时的差别。步骤:分析分类 K-平均聚类地区变量导入到标注个案,其他变量全部导入到变量框中聚类数填 2选项:选中初始聚类中心和 ANOVA继续确定。得到:ANOVA聚类 错误均方

10、 df 均方 df F 显著性食品 13927902.967 1 246753.779 29 56.445 .000衣着 278718.565 1 37555.425 29 7.422 .011居住 667583.436 1 31940.764 29 20.901 .000家庭设备用品及服务 411657.258 1 14558.041 29 28.277 .000医疗保健 325304.302 1 34400.296 29 9.456 .005交通和通信 10285607.457 1 57486.400 29 178.922 .000教育文化娱乐服务 5226361.465 1 69080.933 29 75.656 .000杂项商品和服务 248312.931 1 6496.550 29 38.222 .000仅当出于描述目的时才应该使用 F 检验,因为已选择聚类用于将不同聚类中的个案的差异最大化。 受观察的显著性级别并未因此得到更正,所以无法将这些级别解释为“聚类方法是等同的”假设的检验。每个聚类中的个案数量1 4.000聚类2 27.000有效 31.000缺失 .000将上图中的聚类数修改为 3,则得到:ANOVA聚类 错误均方 df 均方 df F 显著性食品 8311754.509 2 159294.770 28 52.178 .000

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。