21聚类分析Cluster Analysis2什么是聚类分析?v聚类分析是根据聚类分析是根据“物以类聚物以类聚”的道理,对样本或指的道理,对样本或指标进行分类的一种多元统计分析方法,它们讨论的标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样本,要求能合理地按各自的特性进对象是大量的样本,要求能合理地按各自的特性进行合理的分类,没有任何模式可供参考或依循,即行合理的分类,没有任何模式可供参考或依循,即在没有先验知识的情况下进行的。在没有先验知识的情况下进行的。3聚类分析的基本思想聚类分析的基本思想v基本思想是认为研究的样本或变量之间存在着程度不同的相基本思想是认为研究的样本或变量之间存在着程度不同的相似性(亲疏关系)。似性(亲疏关系)。v根据一批样本的多个观测指标,找出一些能够度量样本或变根据一批样本的多个观测指标,找出一些能够度量样本或变量之间相似程度的统计量,以这些统计量作为分类的依据,量之间相似程度的统计量,以这些统计量作为分类的依据,把一些相似程度较大的样本(或指标)聚合为一类,把另外把一些相似程度较大的样本(或指标)聚合为一类,把另外一些相似程度较大的样本(或指标)聚