聚类分析Leo2019/07/301. 简单介绍2. 应用实例3. 操作流程4. 结果探讨CONTENTS简单介绍概念及特点4将研究对象分为相对同质的群组(clusters) 的统计分析技术。具有如下特点:1. 区别于分类分析,所要求划分的类是未知的,属于探索性分析;2. 聚类分析将数据分类到不同的类或者簇( c ),同一个簇中的对象有很大的相似性,不同簇间的对象有很大的相异性;3. k均值聚类算法(k-means clustering algorithm )是最常见的聚类分析算法,步骤是随机选取K 个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。通过多次计算,使误差平方和达到最小,则为最终结果。注意事项5聚类分析过程中,主要注意以下两点:1. 聚类变量的测量尺度不同,需要事先对变量标准化;2. 一般聚类个数在4 6 类,不宜太多,或太少。变量标准化 通过将变量数据转换为Z 分数实现。z分数(z-score ),也叫标准分数(standard score ),是一个数与平均数的差再