第十章SPSS 聚类分析本章内容10.1 聚类分析的一般问题10.2 层次聚类10.3 K-Means 聚类10.1 聚类分析的一般问题10.1.1 聚类分析的意义 聚类分析是统计学中研究“ 物以类聚” 问题的多元统计分析方法。 聚类分析是一种建立分类的多元统计分析方法,它能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度(各变量取值上的总体差异程度)在没有先验知识(没有事先指定的分类标准)的情况下进行自动分类,产生多个分类结果。类内部的个体在特征上具有相似性,不同类间个体特征的差异性较大。 例如,学校里有些同学经 常在一起,关系比较密切,而他们 与另一些同学却很少来往,关系比较疏远 。究其原因可能会发现 ,经 常在一起的同学的家庭情况、性格、学习 成绩 、课 余爱 好等方面有许多共同之处 ,而关系比较 疏远 的同学在这 些方面有较 大的差异性。为 了研究家庭情况、性格、学习 成绩 、课 余爱 好等是否会成为 划分学生小群体的主要决定因素,可以从有关这 些方面的数据入手,进 行客观 分组 ,然后比较 所得的分组 是否与实际 相吻合。对 学生的客观 分组 就可采用聚类 分