5.4 系统聚类法 系统聚类法是目前国内外使用最多的一种聚 类法,属于聚合法。有关它的研究极为丰富。 系统聚类法的分类统计量一般采用距离系数统 计量,其基本步骤为: n 1每个样品为一类,计算各样品之间的距 离系数; n 2把距离最小的两类合并为一类; n 3计算新的类间的距离; n 4重复2、3步一直到合并为一类为止。n 由于在分类的过程中,类与类间的距离可以有 不同的定义,所以系统聚类法又可细分为常用 的八种方法,它们是最短距离法、最长距离法 、中间距离法、可变法、重心法、类平均法、 可变类平均法、离差平方和法。类3 类2 类1 距离的概念5.4.1最短距离法 设有 个样品,用 表示样品 与样品 之间的 距离( ),用 表示类。定 义类与类之间的距离为两类最近样品的距离, 用 表示 与 的距离,则 (5.12) 当 时,规定 n 分类的原则是:类与类之间的距离最近的两类 合并。最短距离法就是以式(5.12)进行分类 ,其聚类步骤如下:n 1确定样品之间的距离计算公式,计算出 个样品中的两两之间的距离 ,得 对称阵 : 开始每个样品自成一类,所以 。