1、 第 4章 不确定性推理 4.1 不确定性及其类型 4.2 主观 Bayes方法 4.3 可信度理论 4.4 证据理论 推理的分类: 精确推理 不精确推理(即不确定推理) 4.1 不确定性及其类型 4.1 不确定性及其类型 一、 不确定性的原因: A 证据的不确定性 歧义性: 不完全性: 不精确性: 模糊性: 可信性: 随机性: 其它因素引起的不确定性 。 B 规则的不确定性 前提条件的不确定性: 例如 “如发高烧则可能感冒 ”, 发高烧是个模糊的概念。 观察证据的不确定性: 如人的体温早晚是不同的。 组合证据的不确定性。 规则自身的不确定性。 在规则的使用过程中含有两种典型的不确定 性 4.
2、1 不确定性及其类型 C 推理的不确定性 推理的不确定性反映了知识不确定性的 动态积累和转播过程。 4.1 不确定性及其类型 二、 不确定推理网络中的三种基本模式 证据逻辑组合模式 已知证据 E1、 E2、 、 En的不确定测度分别为 MU1 、 MU2、 、 MUn, 则证据组合后的不确定测度为 MU (1) 证据的合取: MU( E1E2En) =f(MU1,MU2,MUn) f是一个函数的名称。 (2) 证据的析取: MU( E1 V E2 V V En) =g(MU1,MU2,MUn) g是一个函数的名称。 (3) 证据的否定: MU( Ei) =h(MUi) h是一个函数的名称。 2
3、. 证据的并行规则模式 已知每一单条规则 if Ei then h with Mui(i=1,2,n), 则所有规则都满足 时, h的不确定测度 MU=p(MU1,MU2, ,MUn) p是一个函数的名称。 3. 证据的顺序规则模式 已知规则 if E then E with MU0 if E then h with MU1 则规则 if E then h with MU 中的 MU的计算 MU=s(MU0,MU1) s是一个函数的名称 1. 主观 Bayes公式: a. p(E): 证据 E的不确定性,为 E发生的概率。 b. p(h|E):产生式规则 “if E then h”的不确定性
4、c. Bayes公式: 已知先验概率 P(E)和 P(h)、 h成立时, E出现的条件概率 P(E|h), 则: P(E|h)P(h) P(h|E)=- P(E) 4.2 主观 Bayes方法 主观贝叶斯方法的两个基本假设: ( 1)如一组证据 E1、 E2、 E3、 、 En同时 支持假设 h, 则对于 h与 , 证据之间互不相 容。 ( 2)当一个证据 E支持多个假设时,假设 h1、 h2、。、 hn之间互不相容。 2 主观贝叶斯方法的不确定性计算模 式 ( 1)证据逻辑组合: 设证据 E1、 E2、 E3、 、 En相互独立,则 P( Ei) =1-P( Ei) P(E1E2En)=P(
5、Ei) P(E1 V E2 V V En)=1-(1-P(Ei) ( 2)并行法则: 设证据 E1、 E2、 E3、 、 En同时支持假设 h, 且 E1、 E2、 E3、 、 En相对于 h与 条件独立,则 O(h|E1E2En)=(h,Ei)O(h) (h,E)=P(E|h)/P(E| ):假设 h关于证据 E的似然 率 O=P/( 1-P): 表示几率。 可以看作一个几率修改因子,显然, 1时,后验概率 大于先验概率,相应证据支持假设; 0, 那么 MD(h,E)=0。 如果 MD(h,E)0, 那么 MB(h,E)=0。 (2) 当 p(h|E)p(h)时,证据 E增加假设 h的信任度
6、而不改变 其不信任度,即 MB(h,E)0, MD(h,E)=0。 (3) 当 p(h|E)0, MB(h,E)=0。 (4) 当 p(h|E)=p(h)时,证据 E和假设 h相互独立,即 MD(h,E)=0, MB(h,E)=0。 在实际模型中,通常将 MB、 MD组合成一个单一的量,这 就是可信度。 MB与 MD具有以下性质: 可信度是由称为信任增长度 MB和不信任增长 度 MD相减而来的。即 CF(H, E) MB(H, E)-MD(H, E) 2可信度 可信度 CF(h,E)=MB(h,E) MD(h,E) CF(h,E)描述了证据 E下假设 h信任度的修改量。 CF(h,E)0, 表
7、示有更多理由相信假设; CF(h,E)P(H) 当 P(H|E)=P(H) 当 P(H|E)=0,CF(h,E2)=0时, CF(h,E1 E2)=CF(h,E1)+CF(h,E2)-CF(h,E1)CF(h,E2) 当 CF(h,E1)h, 则有 CF(h,E)=CF(h,E)max(0,CF(E,E) 或 MB(h, E)=MB(h,E)max(0,CF(E,E) MD(h,E)=MD(h,E)max(0,CF(E, ) 在图所示的推理网络中, A、 B、 E为确定性 证据,网络中弧上的数值表示对应的 CF值, 如 CF(C,A)=0.8, CF(F,E)=-0.3, 求基于证据 A、 B
8、、 E的结论 F的 CF值。 C A B D F E 0.8 0.5 0.7 0.9 -0.3 CF(C,AB)=CF(C,A)+CF(C,B)-CF(C,A)CF(C,B) -并行规 则 =0.8+0.5-0.8*0.5=0.9 CF(D,AB)=CF(D,C)max(0,CF(C,AB) -顺序法则 =0.7*0.9=0.63 CF(F,AB)=CF(F,D)max(0,CF(D,AB) -顺序法则 =0.9*0.63=0.567 CF(F,ABE) =CF(F,AB)+CF(F,E) / 1-min(|CF(F,AB),|CF(F,E)|) =(0.567-0.3)/(1-0.3)=0.
9、381 -并行规则 C A B D F E 0.8 0.5 0.7 0.9 -0.3 4.4 证据理论 4.5.1基本概念 1.识别框架 识别框架就是所考察判断的事物或对象的集合 ,记为 。 例如下面的集合都是识别框架: 1 晴天,多云,刮风,下雨 2 感冒,支气管炎,鼻炎 3 红,黄,蓝 4 80, 90, 100 识别框架的子集就构成求解问题的各种解答 。这些子集也都可以表示为命题。 证据理论就是通过定义在这些子集上的几种 信度函数,来计算识别框架中诸子集为真的 可信度。 例如,在医疗诊断中,病人的所有可能的疾 病集合构成识别框架,证据理论就从该病人 的种种症状出发,计算病人患某类疾病(含
10、 多种病症并发)的可信程度。 2. 基本概率分配函数 定义 4 给定识别框架 , A 2, 称 m(A) : 2 0, 1 是 2上的一个基本概率分 配 函数 (Function of Basic Probability Assignment), 则它满足 (1) m() 0; 例 1: 设 a, b, c, 其基本概率分配函数为 m(a) 0.4 m(a, b) 0 m(a, c) 0.4 m(a, b, c) 0.2 m(b) 0 m(b, c) 0 m(c) 0 可以看出,基本概率分配函数之值并非概率。如 m(a) m(b) m(c) 0.41 3.信任函数 定义 5 给定识别框架 ,
11、称为 2上的信任函数 (Function of Belief)。 信任函数表示对 A为真的信任程度。所以,它就 是证据理论的信度函数。信任函数也称为下限函数。 信任函数有如下性质: (1) Bel() 0, Bel() 1, 且对于 2中的任意元素 A, 有 0Bel(A)1。 (2) 信任函数为递增函数。即若 ,则 Bel(A1)Bel(A2)。 (3) Bel(A) Bel(A)1 (A为 A的补集 ) 例 2 由例 1可知 Bel(a, b) m(a) m(b) m(a, b) 0.4 0 0 0.4 4.似真函数 定义 6 Pl(A) 1 Bel(A)( A 2, A为 A的 补集)称
12、为 A的似真函数 (Plausible function) , 函数值称为似真度。 似真函数又称为上限函数,它表示对 A非 假的信任程度。 例 3 由例 2、例 1可知 Pl(a, b) 1-Bel(a, b) 1-(c) 1-0 1 5.信任区间 定义 7 设 Bel (A)和 Pl(A)分别表示 A的信任度和 似真度,称二元组 Bel(A), Pl(A) 为 A的一个信任区间。 6. Dempster 组合规则 1) 基本的组合规则 设 m1(A)和 m2(A)( A 2) 是识别框架 基于不同证据的两个基本概率分配函数,则 将二者可按下面的 Dempster组合规则合并: 该表达式一般称
13、为 m1与 m2的正交和,并记 为 m m1m2。 不难证明,组合后的 m(A)满足 例 4 设识别框架 a, b, c, 若基于两 组不同证据而导出的基本概率分配函数分别 为: m1(a) 0.4 m1(a, c) 0.4 m1(a, b, c) 0.2 m2(a) 0.6 m2(a, b, c) 0.4 将 m1和 m2合并 m(a) m1(a)m2(a) m1(a)m2(a, b, c) m1(a, c)m2(a) m1(a, b, c)m2(a) 0.76 m(a, c) m1(a, c)m2(a, b, c) 0.16 m(a, b, c) m1(a, b, c)m2(a, b, c
14、) 0.08 2) 含冲突修正的组合规则 上述组合规则在某些情况下会有问题。考察 两个不同的基本概率分配函数 m1和 m2, 若存 在集合 B、 C, BC , 且 m1(A)0, m2(B)0, 这时使用 Dempster组合规则将导 出 这与概率分配函数的定义冲突。这时,需将 Dempster 组合规则进行如下修正 : 规范数 K的引入,实际上是把空集所丢弃的正交 和按比例地补到非空集上,使 m(A)仍然满足 如果所有交集均为空集,则出现 K , 显然, Dempster组合规则在这种情况下将失去意义。 其中 K为规范数,且 -1 7 基于证据理论的不确定性推理 基于证据理论的不确定性推理
15、,大体可分为 以下步骤: (1)建立问题的识别框架 ; (2)给幂集 2定义基本概率分配函数; (3)计算所关心的子集 A 2( 即 的子集 )的信任函数值 Bel(A)、 似真函数值 Pl(A); (4)由 Bel(A)、 Pl(A)得出结论。 例 13 设有规则 : (1)如果流鼻涕则感冒但非过敏性鼻炎 (0.9)或过敏 性鼻炎但非感冒 (0.1) (2)如果眼发炎则感冒但非过敏性鼻炎 (0.8)或过敏 性鼻炎但非感冒 (0.05)括号中的数字表示规则前提对 结论的支持程度。又有事实 : (1)小王流鼻涕 (0.9) (2)小王眼发炎 (0.4) 括号中的数字表示事实的可信程度。 问 :小
16、王患什么病? 我们用证据理论求解这一医疗诊断问题 。 首先,取识别框架 h1, h2, h3 其中, h1表示 “感冒但非过敏性鼻炎 ”, h2 表示 “过敏性鼻炎但非感冒 ”, h3表示 “同时得 了两种病 ”。 再取下面的基本概率分配函数 : m1(h1) 规则前提事实可信度 规则结论可信度 0.90.9 0.81 m1(h2) 0.90.1 0.09 m1(h1, h2, h3) 1- m1(h1)- m1(h2) 1-0.81-0.09 0.1 m1(A) 0 (A为 的其他子集 ) m2(h1) 0.40.8 0.32 m2(h2) 0.40.05 0.02 m2(h1, h , h
17、3) 1-m2(h1)-m2(h2) 0.66 m2(A) 0 (A为 的其他子集 ) 将两个概率分配函数合并 K 1/1- m1(h1)m2(h2) m1(h2)m2(h1) 1/1- 0.810.02+0.090.32 1/1-0.045 1/0.955 1.05 m(h1) K* m1(h1)m2(h1) m1(h1)m2(h1, h2, h3 m1(h1, h2, h3)m2(h1) 1.050.8258 0.87 m(h2) K m1(h2)m2(h2) m1(h2)m2(h1, h2, h3 m1(h1, h2, h3)m2(h2) 1.050.0632 0.066 m(h1, h
18、2, h3) 1-m(h1)-m(h2) 1-0.87-0.066 0.064 由信任函数求信任度 Bel(h1) m(h1) 0.87 Bel(h2) m(h2) 0.066 由似真函数求似真度 Pl(h1) 1-Bel(h1) 1-Bel(h2, h3) 1- m(h2 m(h3) 1- 0.066 0 0.934 Pl(h2) 1-Bel(h2) 1-Bel(h1, h3) 1- m(h1) m(h3) 1- 0.87 0 0.13 于是,最后得到: “感冒但非过敏性鼻炎 ”为真的信任度为 0.87, 非假的信任度为 0.934; “过敏性鼻炎但非感冒 ”为真的信任度为 0.066 ,非假的信任度为 0.13。 所以,看来该患者是感冒了。 证据理论是被推崇的处理随机性不确定性的 好方法,受到人工智能特别是专家 系统领域的广泛 重视,并且已为许多专家系统所采用。