1、毕业设计开题报告 信息与计算科学 信息系统中基于证据理论的属性约简 一、 综述本课题国内外研究动态 , 说明选题的依据和意义 波兰学者 Pawlak1于 1982年提出的粗糙集 (Rough Set, RS)理论 2,3,4是一种刻画不完整性和不确定性的数学工具 , 能有效分析和处理不精确、不一致、不完整等各种不完备信息 , 并从中发现隐含的知识 , 揭示潜在的规律 . 粗糙集理论是一种新的处理模糊和不确定知识的数学工具 , 其主要思想是 , 在保持信统的分类能力不变的前提下 , 通过知识约简 , 导出问题的决策 规则 5,6或分 类规则 . 近 20 年来 , 粗糙集论己经在理论和应用上取得
2、了长足的发展 , 特别是由于 20 世纪 90 年代在知识发现等领域得到了成功的应用而受到国际学术界广泛关注 , 基于 Rough 集方法的知识发现与知识约简被许多专家所研究 . 目前 , 它正在被广泛应用于机器学习、决策分析、过程控制、模式识别和数据挖掘等领域 . 知识约简是粗糙集理论的核心内容之一 . 对一个信息系统 ( , , )UAF 来说 , 知识库中属性并不是同等重要的 , 甚至其中某些属性是冗余的 . 所谓知识约简就是在知识库分类能力不变的 条件下 , 删除其中不重要或不相关的属性特别是 , 当信息系统中的数据是随机采集时 , 其冗余性更为普遍 . 约简是粗糙集用于数据分析的重要
3、概念 , 是粗糙集理论的核心内容 . 所谓属性约简 , 就是在保持知识库分类不变的条件下 , 删除其中不重要的知识 . 属性约简作为数据挖掘的一个重要过程 , 主要是为决策提供帮助的 . 现实中 , 数据库中的各种决策表是非常复杂的 , 比如说:不相容、不完备、模糊、值连续等 . D-S 证据理论是人工智能中表示不确定性的一种重要理论 , 也是专家系统重要研究范畴 .由于专家系统针对特定的专业领域 , 对 问题的求解不仅依赖于特定领域确定的理论知识 , 而且更多地依赖于专家的经验和常识 . 现实世界中客观事物或现象常常存在着不确定性 , 导致了人们对各认识领域中的信息和知识的认识大多是不精确的
4、 , 这就要求专家系统中的知识的表示和处理模式能够反映出这种不确定性 . 由于研究领域的不同 , 对不确定性量度方法也不同 , 因而提出了多种不确定推理理论与方法 , 例如主观 Bayes 方法、确定性理论、粗集理论和证据理论等方法 ; 与主观 Bayes 方法相比 , 具有较大的灵活性 . 它将概率论中的单点附值扩展为集合附值 , 弱化了相应的公理系 统 , 即满足比概率更弱的要求 , 可看作一种广义概1 率论 . 就具体推理 方法而言 , 对未知的表示也更接近人的思维习惯 ; 对信任函数的更新是通过合成规则来实现 , 这样有利于各种信息的融合 ; 其规则式表现形式、透明的推理过程 , 都适
5、合机器的实现 , 因此在许多领域得到广泛应用 . 一般地讲 , 一个信息系统的属性不是唯一的 , 人们希望找到具有最少属性的约简 , 即最小约简 . 然而 , 要找到一个信息系统的最小约简是一个 NP-hard 问题 . 不过 , 在实际应用中 , 要求得到相对属性约简就可以了 . 许多研究人员己提出了属性约简算法 . 利用可辨识属性矩阵 , 确定了信息系统的核心属性和去掉绝对不必要属性 , 并给出一个由可辨识属性矩阵求信息系统的一个约简的简便算法 . 由于模糊集在处理带有模糊的不确定性方面的问题时 , 其优势明显 , 许多学者提出将证据理论与模糊集相结合 , 利用二者的优点来表示和处理不精确
6、的和模糊的信息 . Zadeh7是较早将 D-S 证据理论推广到模糊集的学者之一 , 随后 , Yager8等人也以不同的方式将 D-S 证据理论推广到模糊集上 . 本文首先定义了粗糙集、信息系统和证据理论的概念及属性约简 , 然后谈论了在信息 系统、决策表中的约简之间的关系 . 二、研究的基本内容 , 拟解决的主要问题 研究的基本内容 : 信息系统中基于证据理论的属性约简 解决的主要问题 : 1.信息系统和决策表中的约简、相对约简、广义约简与信任和似然约简之间的关系 . 2.协调随机决策信息系统中的属性约简与不协调随机决策信息系统中的属性约简的区别 . 三、研究步骤、方法及措施 研究步骤 :
7、 1. 查阅 收集 相关资料 ; 2. 翻译英文资料 , 修改英文翻译 ; 3. 仔细阅读并研究文献资料 , 撰写文献综述 ; 4. 在老师指导下 , 确定整个论文的思路 , 列出论文提纲 ; 5. 开题报告通过后 , 撰写毕业论文 初稿 ; 6. 上交论文初稿 ; 7. 反复修改论文 ; 8. 论文定稿 . 方法、措施 : 通过到图书馆、上网等查阅收集资料 , 参考相关内容 . 在老师指导下 , 归纳整2 理各类问题 . 与同组同学研究讨论 , 用数据调查结合文献论证的方法来解决问题 . 四、参考文献 1 Pawlak Z. Rough sets J. International Journ
8、al of Computer Sciences, 1982, 11: 341356. 2 张文修 , 吴伟志 . 粗糙集理论介绍和研究综述 J. 模糊系统与数学 , 2000, 15(4): 112. 3 王彪 , 段禅伦 , 吴昊 , 宋永刚 . 粗糙集与模糊集的研究及应用 M. 北京 : 电子工业出版社 . 2008. 4 王国胤 . Rough 集理论与知识获取 M. 西安 : 西安交通大学出版社 , 2001. 5 Ziarko W. Variable precision rough set model. Journal of Computer and System Sciences,
9、 1993, 46: 3959. 6 Pawlak Z. Rough Sets: Theoretical Aspects of Reasoning about Data M. Boston: Kluwer Academic Publisher, 1991. 7 Zadeh L A. Fuzzy sets and systems. Proc. Symp. on Systems Theory, New York: Polytechnic Institute of Brooklyn, 1965: 2937. Yager R R. On the measure of fuzziness and negation. Part I: Membership in the Unit Interval, Internat. J. General Systems, 1979, 5: 189200.