决策树算法概述 决策树算法最早源于人工智能的机器学习技术,用以实现数据内在规律的探究和新数据对象的分类预测。 决策树算法属于有指导的学习。根结点叶结点内部结点兄弟结点2叉树多叉树分类预测 分类预测,就是通过向现有数据学习,使模型具备对未来新数据的分类预测能力。 数据包含: 输入变量 输出变量 分类和预测 分类:分类型输出变量 预测:数值型输出变量决策树算法概述 决策树的种类: 分类决策树:树叶结点所含样本的输出变量的众数就是分类结果。 回归决策树:树叶结点所含样本的输出变量的平均值就是预测结果。 利用决策树进行分类预测: 对新数据进行分类预测时,只需按照决策树的层次,从根结点开始依次对新数据输入变量值进行判断并进入不同的决策树分支,直至叶结点为止 。 特点:分类预测是基于逻辑的 。 IF THEN 每个叶节点对应一条推理规则 1 建立决策树,利用训练样本生成决策树模型。 开始,数据都在根节点 递归的进行数据分片 2 修剪决策树 去掉一些可能是噪音或者异常的数据 3 使用决策树对未知数据进行分类 按照决策树上采用的分割属性逐层往下,直 到一个叶子节点使用决策树进行分类判定树分类算法out