第五章 聚类分析第一节 引言 第二节 相似性的量度 第三节 系统聚类分析法 第四节 K 均值聚类分析 第五节 K 中心点聚类第六节 R codes第一节 引言n “物以类聚,人以群分”n 无监督分类 聚类分析n 分析如何对样品(或变量)进行量化分类的问题Q 型聚类对样品进行分类R 型聚类对变量进行分类3相似性和相异性n Similarity 数值测量两个数据对象类似程度 目标越相似时值越大 通常介于 0,1n Dissimilarity (e.g., 距离distance) 数值测量两个数据对象差异程度 Lower when objects are more alike Minimum dissimilarity is often 0 Upper limit variesn 邻近度Proximity refers to a similarity or dissimilarity4数据矩阵和相异度矩阵n Data matrix n data points with p dimensionsn Dissimilarity matrix n data points, but register