第9章决策树算法,1,数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编 邓松李文敬刘海涛编著 电子工业出版社,第9章决策树算法,2,第9章 决策树算法,第9章决策树算法,3,本章大纲:,决策树算法原理 常用决策树算法 决策树剪枝 由决策树提取分类规则 应用实例分析,第9章决策树算法,4,9.1 决策树算法原理,优点: 使用者不需要了解很多背景知识,只要训练事例能用属性结论的方式表达出来,就能用该算法学习; 决策树模型效率高,对训练集数据量较大的情况较为适合; 分类模型是树状结构,简单直观,可将到达每个叶结点的路径转换为IFTHEN形式的规则,易于理解; 决策树方法具有较高的分类精确度。,第9章决策树算法,5,9.1 决策树算法原理,传统的数据分类操作通常有以下两个步骤: 模型训练阶段:根据给定的训练集,找到合适的映射函数H:C的表示模型。 使用上一步训练完成的函数模型预测数据的类别,或利用该函数模型,对数据集中的每一类数据进行描述,形成分类规则。,第9章决策树算法,6,9.1 决策树算法原理,工作过程:,决策树分类模型的工作过程图,第9章决策树