信息系统中基于证据理论的属性约简【文献综述】.doc

上传人:文初 文档编号:276635 上传时间:2018-08-17 格式:DOC 页数:3 大小:88.50KB
下载 相关 举报
信息系统中基于证据理论的属性约简【文献综述】.doc_第1页
第1页 / 共3页
信息系统中基于证据理论的属性约简【文献综述】.doc_第2页
第2页 / 共3页
信息系统中基于证据理论的属性约简【文献综述】.doc_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、毕业设计文献综述 信息与计算科学 信息系统中基于证据理论的属性约简 粗糙集理论 1,2,3是波兰数学家 Pawlak4于 1982年提出的用于数据分析的理论 . 由于该理论能够处理模糊和不确定性信息 , 因此作为一种有效的知识获取工具受到了人工智能研究者的关注 . 目前粗糙集理论已被成功应用在机器学习与知识发现、过程控制、数据挖掘、决策分析、模式识别等领域 , 成为信息科学的研究热点之一 . 粗糙集理论是一种处理模糊和不确定性知识的数学工具 . 粗糙集属性约简是一种有效的特征选择方法 , 被广泛应用于知识库约简和特征 选择 . 近年来 , 一些关于字符识别的文献使用粗糙集属性约简方法 , 删除

2、冗余属性 , 搜索分辨力高的属性集合 , 然后利用约简的属性集构成分类器 . 这样可以降低分类器维度 , 并且保持分类能力 . 字符样本的属性一般是连续的数值型属性 , 受噪声影响大 . 基于等价关系的粗糙集处理数值属性数据时一般要经过离散化过程 . 根据信息论 , 离散化过程必然会引入信息损失 . 另外 , 等价关系粗糙集属性约简仅考虑属性集合在不同类样本上的差异性 , 一些在同类异类对象之间变化频繁、易受干扰的特征也会被选择 , 这些特征会降低分类器的性能 . 为了克服经典粗糙集理论处理数值属性对象的不合理性 , 一些文献将经典等价关系粗糙集理论扩展到模糊粗糙集、相似关系和邻域关系粗糙集

3、. D-S 证据理论是由 Dempster 于 1967 年提出 ,他首先提出了上、下界概率 5的定义 , 后由Shafer6于 1976 年加以推广和发展 , 使之称为符合有限离散领域中推理的形式 , 并使之系统化、理论化 , 形成了一种不确定性推理的理论 , 即 D-S 理论 . 证据理论讨论一个识别框架 ,它是关于命题的相互独立的可能答案或假设的一个有 限集合 . 按传统方法可以把 的幂集表示为 2 . 它是 的所有子集的集合 , D-S 理论证据对这个识别框架 进行运算 , 并提供计算 中所有幂集元素的逻辑 , 然后使用这些计算结果完成对命题的高和低的不确定性表示 .证据理论是一种重要

4、的不确定推理方法 , 近年来该理 论有了很大发展 , 并逐渐得到了国际学术界的承认 , 正受到不同领域的学者越来越多的关注 . 由于证据理论在表达和处理不确定性信息方面的优势 , 已有学者将其应用于产品可靠性评估时主观可靠性信息的综合处理工作之中 . 然而 , 在很多时候 , 专家由于自身的局限性只能给出一些模糊评价信息 , 如“该产1 品可靠度非常高”等等 . 为了灵活运用此类模糊主观信息 , 需要把证据理论向模糊集合推广 . D-S 理论中 , 最基本的函数是概率分配函数 , 它体现了 D-S 理论对于不确定性的量度 , 即信任的分配方式 . 它通过辨别框架 、信任函数 Bel 和似然函数

5、 Pl 表示知识和处知识 , 并用事实表示所有外部输入数据、判断性知识的条件部分和结论部分的命题 . 对每一个事实 A , 用 A B e l A , P l A 表示对 A 的信任程度 , 并可根据辨别框的基本概率分配函数直接计算得到 A 的信任程度 , 从而完成对不确定性知识的处理 . 由于模糊集在处理带有模糊的不确定性方面的问题时 , 其优势明显 , 许多学者提出将证据理论与模糊集相结合 , 利用二者的优点来表示和处理不精确的和模糊的信息 . Zadeh7是较早将 D-S 证据理论推广到模糊集的学者之一 , 随后 , Yager8等人也以不同的方式将 D-S 证据理论推广到模糊集上 .

6、在模糊证据理论中 , 识别框架 上证据的焦元为模糊集合 . 此种情况下 , Yager 等学者将信度函数重新定义为 B el B I A B m A 式中 I A B 表示集合 B 包含 A 的程度 , 简称包含度 . 对于模糊焦元 A 和 B , 设 0A 和 0B分别为 A 和 B 的强 0 截集 . 则当 AB 时 , 必有 00AB , 反之 , 当 00AB 时 , 则不一定有 AB . “ 包含度 ” 一般采用了取大和取小算子 , 所以集合间的包含程度由一些 “ 特殊点 ”所决定 , 从而导致了信度函数对 某些焦元的显著变化不敏感 . 在有些情况下 , 识别框架为连续无限集合 .

7、证据理论通过利用信度函数 (Belief Function, Bel)和似真度函数 (Plausibility Function, Pl)6来描述命题的不确定性 . 一般地讲 , 一个信息系统的属性不是唯一的 , 人们希望找到具有最少属性的约简 , 即最小约简 . 然而 , 要找到一个信息系统的最小约简是一个 NP-hard 问题 . 不过 , 在实际应用中 , 要求得到相对属性约简就可以了 . 许多研究人员己提出了属性约简算法 . 利用可辨识属性矩阵 , 确定了信 息系统的核心属性和去掉绝对不必要属性 , 并给出一个由可辨识属性矩阵求信息系统的一个约简的简便算法 . 本文首先定义了模糊集、信

8、息系统和证据理论的定义 , 然后谈论了信息系统和决策表中的约简之间的关系 . 2 参考文献 1 王国胤 . Rough 集理论与知识获取 M. 西安 : 西安交通大学出版社 , 2001. 2 张文修 , 吴伟志 . 粗糙集理论介绍和研究综述 J. 模糊系统与数学 , 2000, 15(4): 112. 3 王彪 , 段禅伦 , 吴昊 , 宋永刚 . 粗糙集与模糊集的研究及应用 M. 北京 : 电子工业出版社 . 2008. 4 Pawlak Z. Rough sets J. International Journal of Computer Sciences, 1982, 11: 34135

9、6. 5 Dempster A P. Upper and lower probabilities induced by a multivalued mapping J, Annals of Mathematical Statistics, 1967, 38: 325339. 6 Shafer G. A Mathematical Theory of Evidence M, Princeton University Press, Princeton, 1976. 7 Zadeh L A. Fuzzy sets and systems. Proc. Symp. on Systems Theory, New York: Polytechnic Institute of Brooklyn, 1965: 2937. 8 Yager R R. On the measure of fuzziness and negation. Part I: Membership in the Unit Interval, Internat. J. General Systems, 1979, 5: 189200.

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 学术论文资料库 > 文献综述

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。