Ch 10. 决策树特征类型 数值数据(numerical data ) 例:1.2, 4.5, 3.3 模式间可以计算距离度量 基于度量的模式分类方法 标称数据 (nominal data ) 例: 红色,有光泽,甜,小 模式间没有距离的概念 非度量方法决策树 什么是决策树? 决策树是一种类似流程图的树形结构,每个内部节点表 示一个测试(查询),该节点的每个分支表示该测试的 一个结果,每个叶节点表示一个类别 决策树的构成 根节点(root ) 分支(branch ) 叶节点(leaf )决策树决策树 决策树分类过程 从根节点开始,首先对某一属性的取值提问 Color? 与根节点相连的不同分支,对应这个属性的不同取值 green; yellow; red; 根据不同的回答,转向相应的分支 green 在新到达的节点处做同样的分支判断 Size? big. 这一过程持续,直到到达某个叶节点,输出该叶节点的 类别标记 Watermelon决策树 决策树的判决面决策树 决策树的优势 语义可表示性 从根节点到叶节点表示为合取式 (颜色= 黄)AND (形状= 细长) 香蕉 利用合取式和析取式获