第一节 聚类分析核心思想 第二节 相似性的量度 第三节 系统聚类分析法 第四节 K 均值聚类分析 第五节 实例分析与计算机实现第二章 聚类分析第一节 核心思想 “ 物以类聚,人以群分” 。 “ 近朱者赤, 近墨者黑” 在生物学中,为了研究生物的演变,生物学家需要根据各种生物不同的特征对生物进行分类。 在经济学中,根据经济发展的不同阶段对世界各个国家进行分类. 医学研究中, 阑尾炎类型的划分: 性单纯性阑尾炎, 急性化脓性阑尾炎, 坏疽性及穿孔性阑尾炎。 在社会学研究中,需要构造人口生育分类模式、人口死亡分类状况,以此来研究人口的生育和死亡规律。 聚类分析的核心思想就是根据具体的指标( 变量) 对你所研究的样品进行分类. 指标是什么? 书上的例子. 将居民户按户主收入状况进行分类, 那么衡量收入状况的指标有: 标准工资收入 职工奖金. 样品是什么? 你所研究的11 户居民. 进一步解读指标: 间隔尺度 有序尺度 名义尺度思考: 能不能对指标进行聚类? 所以, 聚类分析包括两种类型:Q 型聚类: 根据指标( 变量) 对样品进行分类R 型聚类: 对指标( 变量) 进行分类 问题: 大家认为聚