聚类分析 聚类分析 2 2 ClusterAnalysis分类 俗语说,物以类聚、人以群分。 但什么是分类的根据呢? 比如,要想把中国的省份成若干类,就有很多 种分类法; 可以按照地域或自然条件来分, 比如考虑降水、土地、日照、湿度等各方面; 也可以考虑收入、教育水准、医疗条件、基础 设施等指标; 既可以用某一项来分类,也可以同时考虑多项 指标来分类。 聚类分析做什么?聚类分析 对于一个数据,人们既可以对观测值( 事件,样品)来分类(相当于对数据中 的行分类),也可以对变量(指标)进 行分类(相当于对数据中的列分类) 。 比如学生成绩数据就可以对学生按照理 科或文科成绩(或者综合考虑各科成绩 )分类, 当然,并不一定事先假定有多少类,完 全可以按照数据本身的规律来分类。 聚类分析做什么?第四节Q型系统聚类法 系统聚类法(层次聚类法):在聚类分析的开 始,每个样本自成一类;然后 ,按照某种方法 度量所有样本之间的亲疏程度,并把最相似的 样本首先聚成一小类;接下来,度量剩余的样 本和小类间的亲疏程度,并将当前最接近的样 本或小类再聚成一类;再接下来,再度量剩余 的样本和小类间的亲疏程度,并