* 1 聚类分析 Cluster Analysis2 什么是聚类分析? v 聚类分析是根据“物以类聚”的道理,对样本或指标 进行分类的一种多元统计分析方法,它们讨论的对 象是大量的样本,要求能合理地按各自的特性进行 合理的分类,没有任何模式可供参考或依循,即在 没有先验知识的情况下进行的。3 聚类分析的基本思想 v 基本思想是认为研究的样本或变量之间存在着程度不同的相 似性(亲疏关系)。 v 根据一批样本的多个观测指标,找出一些能够度量样本或变 量之间相似程度的统计量,以这些统计量作为分类的依据, 把一些相似程度较大的样本(或指标)聚合为一类,把另外 一些相似程度较大的样本(或指标)聚合为一类,直到把所 有的样本(或指标)都聚合完毕,形成一个由小到大的分类 系统。4 聚类分析无处不在 v 谁经常光顾商店,谁买什么东西,买多少? v 按会员卡记录的光临次数、光临时间、性别、年龄 、职业、购物种类、金额等变量分类 v 这样商店可以 v 识别顾客购买模式(如喜欢一大早来买酸奶和鲜肉 ,习惯周末时一次性大采购) v 刻画不同的客户群的特征5 聚类分析无处不在 v挖掘有价值的客户,并制定相应的促