1、5 - 1问题: 分析判断以上数据属于雨天还是晴天?问题提出Bayes判别(概率性)Fisher判别(确定性)距离判别线性判别非线性判别典型判别方法雨天( A) 晴天( B)组别 湿温差 气温差 组别 湿温差 气温差1 -1.9 3.2 2 0.2 6.21 -6.9 0.4 2 -0.1 7.51 5.2 2 2 0.4 14.61 5 2.5 2 2.7 8.3湿温差 气温差7.3 06.8 12.70.9 -5.4-12.5 -2.5已知5 - 2第 6章 判别分析6.1 判别分析的概念6.2 线性判别分析6.3 距离判别法6.4 Bayes 判别法5 - 36.1 判别分析概念思想:
2、在一些已知研究对象用某种方法已经分成若干类的情况下, 确定新的样本 属于已知类别中的哪一类。判别分析根据先前分类构建 判别函数判别标准 :Fisher判别和 Bayes判别判别新样品归属5 - 46.2 线性判别分析X1 X2 Xp Y1 x11 x12 x1p 12 x21 x22 x2p 1 n1 xn11 xn12 xn1p 11 22 . 2 n2 xn21 xn22 xn2p 2思想: 使用线性判别函数,将描述样本属性的多指标变成单变量值,根据标准确定样本归属。线性判别函数 :5 - 51.求 Fisher两类 线性判别函数结论: 选择适当的 x的线性组合,使得均值之间的分离度 达到
3、最大。基本原则: 类之间的变异尽可能大,类内部变异尽可能小,变异用离均差平方和表示分离度:合并协方差矩阵:结论: 通过以上定理,得到系数 a的估计值。最大值:5 - 62.计算判别界值( 1)当 时, YY0,则 XG 1,否则 XG 2( 2)当 时, YY0,则 XG 2,否则 XG 1( 3)当 时,待判 两均值中点为界点:计算各类判别值均值:3.建立判别标准5 - 74.实例分析问题: 现测得明天指标 x1=8.1, x2=2.0,预测明天是雨天还是晴天。雨天( A) 晴天( B)组别 湿温差 气温差 组别 湿温差 气温差1 -1.9 3.2 2 0.2 6.21 -6.9 0.4 2
4、 -0.1 7.51 5.2 2 2 0.4 14.61 5 2.5 2 2.7 8.35 - 8(1)判别函数计算d6.1=read.table(“clipboard“,header=T) #读取例 6.1 数据library(MASS)(ld=lda(Gx1+x2) #线性判别模型Group means:x1 x21 0.92 2.102 -0.38 8.85Coefficients of linear discriminants:LD1x1 -0.1035x2 0.2248线性判别函数为:注意: 当变量只有 2个时,会给出一个判别函数,当有 4个时,会给出两个判别函数:5 - 9(2)预
5、测分析Z=predict(ld) #根据线性判别模型预测所属类别newG=Z$class #预测的所属类别结果cbind(G,Z$x,newG) #显示结果(tab=table(G,newG) #混淆矩阵newGG 1 21 9 12 1 9sum(diag(prop.table(tab)=0.9 #判对率结论: 明天 x1=8.1, x2=2.0,预测明天是雨天,此次准确率为 90%。predict(ld,data.frame(x1=8.1,x2=2.0),data=d6.1)#判对率判别分析5 - 106.3 距离判别分析思想: 根据已知分类的数据,分别计算 各类的重心即各组的均值 ,判别 准则是 对任给的一次观测,若它 与第 i类的重心距离最近,就认为它来自第 i类 。1.两总体距离判别第 1个总体 G1抽 n1个样品第 2个总体 G2抽n2个样品任取 1个含有 p个指标的样品计算该样品到 G1和 G2距离根据距离进行判别XG 1XG 2待判判别标准