多元统计分析简介1.聚类分析2.判别分析3.主成分分析4.典型相关分析 聚类分析又称群分析,它是研究分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合。那么要将相似元素聚为一类,通常选取元素的许多共同指标,然后通过分析元素的指标值来分辨元素间的差距,从而达到分类的目的。 聚类分析可以分为: Q型(样品分类)分类、R型(指标分类)分类。这里介绍的是 Q型(样品分类)分类。 1. 聚类分析3) 研究样品之间的关系 。通常有两种方法:相似系数 。性质相近的相似系数的绝对值越接近于 1,彼此不相关的相似系数的绝对值越接近于 0。常用相似系数有:夹角余弦;相关系数;指数相似系数;非参数方法灯计算距离 。将样品看作 P维空间的一点,通过计算不同样品的距离,距离越接近的点归为一类,距离远的点归为不同类。常用距离有:明科夫斯基距离;欧氏距离;绝对值距离;切比雪夫距离;兰氏距离;马氏距离。4)计算距离矩阵或相似性系数矩阵 D。1. 聚类分析聚类分析的一般步骤 (Q-型分类 ) 2) 由距离矩阵或相似性系数矩阵 D,找到当前最小的 Dij, 并将类 Gi、 Gj合为一类得到一个新类Gr=G