1、第八章 判别分析 判别分析的含义 :根据给定的若干总体的观测资料,构造出一个判别函数,并由此函数对于某一样品属于哪个总体做出判断。 判别分析的主要方法 :距离判别( Distance Discrimination);Bayes 判别; Fisher判别等。1 距离判别判别思想 :根据样品到各个总体的距离的比较,判别其归属。这里样品到总体的距离指的是样品到总体均值的距离。欧式距离的缺陷 : 欧式距离是一种绝对距离,无法反映出概率上的差异。 当分量的性质不同时,距离的大小与单位有关。A一、马氏( Mahalanobis) 距离设 x、 y 是均值向量为 、 协方差矩阵为 V 的总体 G 中抽取的两
2、个样品,定义 x、 y 之间的马氏距离为:定义 x 和总体 G 之间的马氏距离为: 马氏距离满足距离的三条公理。 当 V=I 时,马氏距离即为通常的欧式距离。若变量之间是相互无关的,则协方差矩阵为对角矩阵二、两个总体的判别分析1. 两个总体有相同的协方差阵:v 直观的判别准则:或等价地描述成:v 判别函数:令 ,则有W(x) 即为距离判别函数。v 若 已知,令 ,则W(x) 为称 W (x) 为线性判别函数, a 为判别系数, 为判别常数。v 几何解释: 总体 G1、 G2 的支撑之间存在重叠部分。判别就是经判别函数 W(x) 建立一个法则,样本空间通过 W(x) 划分为两个无公共部分的区域 R1、 R2 。