1、模糊数学示例的模糊化样本Data Set Characteristics: MultivariateNumber of Instances: 6000 Area: ComputerAttribute Characteristics:Categorical, Integer, RealNumber of Attributes: 7 Date Donated1992-07-01Associated Tasks: Classification Missing Values? No Number of Web Hits: 198051 0 line 0 0 0 20 20.00 46.101 1 li
2、ne 19 0 19 8 8.00 46.101 2 line 0 20 19 8 22.47 46.101 3 line 0 20 8 42 23.41 46.101 4 line 19 8 8 42 35.74 46.10CLASS OBJNUM TYPE XX1 YY1 XX2 YY2 SIZE DIAG 样本ata Set Characteristics: MultivariateNumber of Instances: 103 Area: ComputerAttribute Characteristics: RealNumber of Attributes: 10 Date Dona
3、ted2009-04-30Associated Tasks: Regression Missing Values? N/A Number of Web Hits: 10181混凝土是一种高度复杂的材料。混凝土的坍流,不仅取决于水分含量,也会受到其他成分的影响。 为什么要模糊化? 原本不就是模糊的吗? 传统示例学习样本的初始化 离散化 将连续属性分割为不相交区间,并以符号表示 离散化方便了处理,却损失了信息。如果这些信息很关键,将导致我们做出错误的判断 降低离散化力度可以吗?有时候不行,也不需要,我们只需要找出主要因素。 模糊就是推迟做出的离散化。信息不足的时候,先不作出决定。模糊化不是概率化
4、概率是无原则的相似 两个对象之间相似的程度 模糊是有中心的接近 与真相之间的距离方法一、利用概率密度函数 在数学中,一个连续型随机变量的概率密度函数是一个描述这个随机变量的输出值在某一个确定的取值点附近的可能性的函数。样本模糊化的思路是? 模糊化的方法 数理统计(参数估计,分布假设) 专家干预 Photoshop的模糊化方法 采用矩阵,判断矩阵边缘与矩阵核心的差,通过增减相互靠拢,对于隶属于那块图像不做明确的界限。 假设一张黑白图片, 0和 1表示每个点,模糊化用隶属函数可以进行模糊化 采用隶属函数代替概率密度函数 借鉴概率密度函数的计算方法 隶属函数是有中心的密度函数 示例学习的一切信息来自
5、样本 知识来自样本示例学习的基本原则 如何从样本确定中心点? 如何由中心点展开?什么函数才被称为隶属函数 假设数据符合概率密度函数 pdf,我们所设计的隶属函数应该是接近 pdf的 隶属函数必须满足的三项要求 必须在 0至 1之间,这是统计函数所必须保证的 隶属函数的数学期望其本质是与中心位置之差,称之为 置信度 。置信度的最低要求为 c。 置信度大于 c,同时模糊性最小的隶属函数,被称为 最优隶属函数最优隶属函数 最优隶属函数( 0至 1的闭区间内) 模糊性 +确定型 -期望限 =1() 保持了一致性原则 一致性:可能性不小于概率值 使用最优隶属函数代替 pdf的前提条件 只损失信息、不添加不可靠信息