1、人工智能Artificial Intelligence,主讲:相明西安交通大学电信学院计算机系E_mail:,第四章不确定性推理,概率方法主观Bayes方法可信度方法模糊推理方法,4.1 概述,什么是不确定性推理?不确定性推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识的运用与处理。具体地说,所谓不确定性推理就是从不确定性的初始证据(即事实)出发,通过运用不确定性的知识,最终推出具有一定程度不确定性的结论。,不确定性推理中的基本问题,1. 不确定性的表示与度量不确定性推理中的“不确定性”一般分为两类:一是知识的不确定性,一是证据的不确定性。知识不确定性的表示:在专家系统中知识的不确定
2、性一般是由领域专家给出的,通常用一个数值表示,它表示相应知识的不确定性程度,称为知识的静态强度。证据不确定性的表示:证据不确定性的表示方法与知识不确定性的表示方法一致,通常也用一个数值表示,代表相应证据的不确定性程度,称之为动态强度。,2. 不确定性匹配算法 在推理过程中证据和知识的前提的相似程度称为匹配度。确定这个匹配度(相似程度)的算法称为不确定性匹配算法。,3. 组合证据不确定性的计算方法最大最小法:T(E1 AND E2)=minT(E1),T(E2)T(E1 OR E2)=maxT(E1),T(E2)概率法:T(E1 AND E2)=T(E1)T(E2)T(E1 OR E2)=T(E
3、1)T(E2)T(E1)T(E2)有界法:T(E1 AND E2)=max0,T(E1)T(E2)1T(E1 OR E2)=min1,T(E1)T(E2)其中,T(E)表示证据E为真的程度(动态强度),如可信度、概率等。,4. 不确定性的传递算法 在每一步推理中,如何把证据及知识的不确定性传递给结论,即如何计算结论的不确定性。5. 结论不确定性的合成用不同知识进行推理得到了相同结论,但所得结论的不确定性却不同。此时,需要用合适的算法对结论的不确定性进行合成。,不确定性推理方法的分类,不确定性推理方法主要可分为模型法与控制法。模型法:在推理一级对确定性推理进行扩展,引入证据的不确定性及知识的不确
4、定性。模型方法又分为数值方法和非数值方法两类。数值方法对不确定性进行定量的描述,按其所依据的理论又可分为基于概率的方法和基于模糊理论的方法。,4.2 基本概率方法,经典概率方法设有如下产生式规则:IFE THEN H其中,E为前提条件,H为结论。如果我们在实践中经大量统计能得出在E发生条件下H的条件概率(后验概率)P(H/E),那么就可把它作为在证据E出现时结论H的确定性程度(可信度)。,逆概率方法 假设观测到某事件E,且对应于E有多个可能的结论H1,H2,Hn;则可用每个结论的先验概率P(Hi)和条件概率P(E/Hi)来计算在观察到E时结论Hi的后验概率P(Hi/E),4.3 主观Bayes
5、方法,4.3.1 不确定性的表示1、知识不确定性的表示:在主观Bayes方法中,知识是用产生式规则表示的,具体形式为:IFE THEN (LS,LN) H (P(H)其中,E是知识的前提条件,既可以是简单条件,也可以是复合条件。 P(H)是结论H的先验概率,由专家根据经验给出。LS称为充分性度量,用于指出E对H的支持程度,取值范围为0,),其定义为:LS=P(E|H)/P(E|H)。LN称为必要性度量,用于指出 E对H的支持程度,取值范围为0,),其定义为:LN=P(E|H)/P(E|H)=(1-P(E|H)/(1-P(E|H)。LS和LN的值由领域专家给出,代表知识的静态强度。,2、证据不确
6、定性的表示:在主观Bayes方法中,证据的不确定性用概率表示。对于证据E,由用户根据观察S给出P(E|S),即动态强度。用P(E|S)描述证据的不确定性 (证据E不是可以直接观测的)。由于主观给定P(E|S)有所困难,所以实际中可以用可信度C(E|S)代替P(E|S)。在PROSPECTOR中C(E|S)取整数:-5,.5 C(E|S)=-5表示在观测S下证据E肯定不存在P(E|S)=0 C(E|S)= 5表示在观测S下证据E肯定存在P(E|S)=1 C(E|S)= 0表示S与E无关,即P(E|S)= P(E),给定C(E|S)后,P(E|S)可近似计算如下:,3、组合证据的不确定性:(1)当
7、组合证据是多个单一证据的合取时,即E=E1 AND E2 AND AND En则:P(E|S)=minP(E1|S),P(E2|S),P(En|S)(2)当组合证据是多个单一证据的析取时,即E=E1 OR E2 OR OR En则:P(E|S)=maxP(E1|S),P(E2|S),P(En|S)(3)对于“”运算则:P(E|S)=1-P(E|S),4.3.2 不确定性的传递算法,(1)根据证据E的条件概率P(E|S) 及LS、LN的值,把H的先验概率P(H)更新为后验概率P(H|S) 。(2) 分以下3种情况讨论: 证据肯定存在: P(E|S)=1 证据肯定不存在: P(E|S)=0 证据不
8、确定: 0P(E|S)1(3)引入几率函数(x),它与概率的关系为: (x)=P(x)/(1-P(x),P(x)=(x)/(1+(x),证据肯定存在时,(x)=P(x)/(1-P(x),P(x)=(x)/(1+(x)计算P(H|E):由Bayes公式得:P(H|E)=P(E|H)P(H)/P(E)(1)P(H|E)=P(E|H)P(H)/P(E)(2)(1)式除以(2)式得:P(H|E)/P(H|E)=P(E|H)/P(E|H)P(H)/P(H)由充分性度量LS和几率函数的定义可得:(H|E)=LS(H)即P(H|E)=LSP(H)/(LS-1)P(H)+1,证据肯定不存在时,计算P(H|E)
9、:由Bayes公式得:P(H|E)=P(E|H)P(H)/P(E)(1)P(H|E)=P(E|H)P(H)/P(E)(2)(1)式除以(2)式得:P(H|E)/P(H|E)=P(E|H)/P(E|H)P(H)/P(H)根据必要性度量LN和几率函数的定义,可得:(H|E)=LN(H)即P(H|E)=LNP(H)/(LN-1)P(H)+1,证据不确定时,当0P(E|S)1: 表明证据 E是对H有利的证据。 LN1:表明证据E是对H有利的证据。所以: 不能出现LS1且LN1的取值。LS1, LN0:表示证据以某种程度为真。 CF(E)0:表示结论以某种程度为真。 CF(H)0。(负负得正),4.4.
10、2 带阈值限度的可信度模型,1. 知识不确定性的表示知识用下述形式表示:IFETHENH(CF(H,E),)其中:CF(H,E)为知识的可信度,取值范围为0,1。 CF(H,E)=0 对应于 P(H|E)=0 (证据绝对否定结论) CF(H,E)=1 对应于 P(H|E)=1 (证据绝对支持结论)是阈值,明确规定了知识运用的条件:只有当CF(E)时,该知识才能够被应用。的取值范围为0,1 。,IFETHENH(CF(H,E),)2. 证据不确定性的表示证据E的可信度仍为CF(E),但其取值范围为:0,1 CF(E)=1 表示证据绝对存在; CF(E)=0 表示证据绝对不存在。 3组合证据的不确
11、定性4. 不确定性的传递算法当CF(E)时,CF(H)=CF(H,E)CF(E)注意: CF(H,E)表示证据E为真的条件下结论H为真的可能性。,5. 结论不确定性的合成算法设有多条规则有相同的结论,即IFE1THEN H(CF(H,E1),1)IFE2THEN H(CF(H,E2),2)IFEnTHEN H(CF(H,En),n)如果这n条规则都满足:CF(Ei)i,i=1,2,n且都被启用,则首先分别对每条知识求出它对CFi(H);然后求结论H的综合可信度CF(H)。,求综合可信度的几种方法,极大值法:CF(H)=maxCF1(H),CF2(H),CFn(H)加权求和法:有限和法:递推法:
12、C1=CF(H,E1)CF(E1)Ck=Ck-1+(1-Ck-1)CF(H,Ek)CF(Ek),4.4.3 加权的可信度模型,考虑复合前提条件:E=E1 AND E2 ANDAND En前面所讨论的模型都认为各个子条件的重要性是完全相等的,各个子条件之间的地位是完全平等的。但是现实中并非都是如此。很可能有一些子条件对结论的影响相对其它更大一些;有些子条件更重要一些。如果学生善于思考并且动手能力强并且经常上自习并且坚持锻炼身体并且不抽烟那么该生成绩较好,1. 知识的不确定性IFE1(1) AND E2(2) ANDAND En(n) THEN H (CF(H,E),)其中i(i=1,2,n)是加
13、权因子,是阈值,其值均由专家给出。加权因子的取值范围一般为0,1,且应满足归一条件,即2. 组合证据的不确定性若有CF(E1),CF(E2),CF( En),则组合证据的可信度为:,3. 不确定性的传递算法当一条知识的CF(E)满足如下条件时,CF(E)该知识就可被应用。结论H的可信度为:CF(H)=CF(H,E)CF(E)加权因子的引入不仅可以区分不同证据的重要性,同时还可以解决证据不全时的推理问题。,4.4.4 前件带不确定性的可信度模型,1. 知识不确定性的表示IFE1(cf1) AND E2(cf2) ANDAND En(cfn) THEN H (CF(H,E),)其中,cfi为子条件
14、Ei(i=1,2,n)的可信度。cfi在0,1上取值,其值由专家给出,反映了专家对子证据可信度的一种要求。IFE1(cf1,1) AND E2(cf2,2) ANDAND En(cfn,n) THEN H (CF(H,E),)证据不确定性的表示:子证据Ei的可信度记为cfi,其取值范围在0,1上。,2. 不确定性匹配算法不带加权因子的不确定性匹配算法:知识:IFE1(cf1) AND E2(cf2) ANDAND En(cfn) THEN H (CF(H,E),)条件:E1(cf1),E2(cf2), En(cfn)匹配算法: max0,cf1-cf1+max0,cf2-cf2+ max0,c
15、fn-cfn带加权因子的不确定性匹配算法:知识:IFE1(cf1,1) AND E2(cf2,2) ANDAND En(cfn,n) THEN H (CF(H,E),)匹配算法:(1max0,cf1-cf1)+(2max0,cf2-cf2)+(nmax0,cfn-cfn) ,3. 不确定性的传递算法不带加权因子时:CF(H)=(1-max0,cf1-cf1)(1-max0,cf2-cf2)(1-max0,cfn-cfn)CF(H,E)带加权因子时:CF(H)=(1(1-max0,cf1-cf1)(2(1-max0,cf2-cf2)(n(1-max0,cfn-cfn)CF(H,E)CF(H)=(1- 1 max0,cf1-cf1)(1- 2 max0,cf2-cf2)(1- n max0,cfn-cfn)CF(H,E),基于可信度的不确定性推理方法的特点,优点:简单、直观。缺点:可信度因子依赖于专家主观指定,没有统一、客观的尺度,容易产生片面性。随着推理延伸,可信度越来越不可靠,误差越来越大。当推理深度达到一定深度时,有可能出现推出的结论不再可信的情况。,完谢谢,