01-SPSS软件聚类分析过程的图文解释及结果的全面分析.doc

上传人:99****p 文档编号:1467139 上传时间:2019-03-01 格式:DOC 页数:13 大小:564.39KB
下载 相关 举报
01-SPSS软件聚类分析过程的图文解释及结果的全面分析.doc_第1页
第1页 / 共13页
01-SPSS软件聚类分析过程的图文解释及结果的全面分析.doc_第2页
第2页 / 共13页
01-SPSS软件聚类分析过程的图文解释及结果的全面分析.doc_第3页
第3页 / 共13页
01-SPSS软件聚类分析过程的图文解释及结果的全面分析.doc_第4页
第4页 / 共13页
01-SPSS软件聚类分析过程的图文解释及结果的全面分析.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、SPSS 聚类分析过程聚类的主要过程一般可分为如下四个步骤:1.数据预处理(标准化)2.构造关系矩阵(亲疏关系的描述)3.聚类(根据不同方法进行分类)4.确定最佳分类(类别数)SPSS 软件聚类步骤1. 数据预处理(标准化)Analyze(分析) Classify (分类,归类)Hierachical Cluster Analysis(层序聚类分析) Method(方法,条理,)然后从对话框中进行如下选择从 Transform Values 框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即可:标准化方法解释:None:不进行标准化,这是系统默认值;Z Scores(Z -Scor

2、es, 英文名又叫Standardized Population Data, 是以标准差单位来表现的一组观察值):标准化变换;Range 1 to 1:极差标准化变换( 作用:变换后的数据均值为 0,极差为 1,且|x ij*|1,消去了量纲的影响;在以后的分析计算中可以减少误差的产生。);Range 0 to 1(极差正规化变换 / 规格化变换);2. 构造关系矩阵在 SPSS 中如何选择测度(相似性统计量):Analyze Classify Hierachical Cluster Analysis Method 然后从对话框中进行如下选择常用测度(选项说明):Euclidean dista

3、nce:欧氏距离(二阶 Minkowski 距离),用途:聚类分析中用得最广泛的距离;Squared Eucidean distance:平方欧氏距离; Cosine:夹角余弦(相似性测度;Pearson correlation:皮尔逊相关系数;3. 选择聚类方法SPSS 中如何选择系统聚类法常用系统聚类方法a) Between-groups linkage 组间平均距离连接法方法简述:合并两类的结果使所有的两两项对之间的平均距离最小。(项对的两成员分属不同类)特点:非最大距离,也非最小距离b)Within-groups linkage 组内平均连接法方法简述:两类合并为一类后,合并后的类中所

4、有项之间的平均距离最小C) Nearest neighbor 最近邻法(最短距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法d)Furthest neighbor 最远邻法(最长距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法e)Centroid clustering 重心聚类法方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值特点:该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪,且符号改变频繁,计算较烦。f)Median clustering 中位数法方法简述:两类间的距离既不采用

5、两类间的最近距离,也不采用最远距离,而采用介于两者间的距离特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用。g) Wards method 离差平方和法方法简述:基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大特点:实际应用中分类效果较好,应用较广;要求样品间的距离必须是欧氏距离。谱系分类的确定经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则:A. 任何类都必须在临近各类中是突出的,即各类重心间距离必须极大B. 确定的类中,各类所包

6、含的元素都不要过分地多C. 分类的数目必须符合实用目的D. 若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类实例分析SPSS19.0分析软件聚类分析4.2聚类分析 系统聚类法在数据编辑窗口的主菜单中选择“分析(A)”“ 分类(F)” “系统聚类(H)”(如图-4 所示),弹出“ 系统聚类分析” 对话框,将“ 地区”变量选入“标注个案(C)” 中,将其他变量选入“变量框”中,如图-5 所示。在 “分群”单选框中选中“个案”,表示进行的是 Q 型聚类。在“输出” 复选框中选中“统计量” 和“图”,表示要输出的结果包含以上两项。单击“ 统计量 (S)”按钮,在“系统聚类分析:统计量”对

7、话框中选择“合并进程表”、“相似性矩阵”,如图-6 所示,表示输出结果将包括这两项内容。单击“ 绘制 (T)”按钮,在“系统聚类分析:图”对话框中选择“树状图”、“ 冰柱”,如图-7 所示,表示输出的结果将包括谱系聚类图(树状)以及冰柱图(垂直)。单击“ 方法 (M)”按钮,弹出“ 系统聚类分析:方法” 对话框,如下图 -8 所示。“聚类方法(M)”选项条中可选项包括如图-9 所示的几种方法,本例中选择“ 组间联接”:“度量标准-区间(N)”选项条中可选项包括如图 -10 所示的几种度量方法,本例中选择 “平方Euclidean 距离”:“转换值-标准化(S)”选项条中可选项包括如图-11 所示的几种将原始数据标准化的方法,本例中选择“全局从 0 到 1”:冰柱图解释

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。