1/332024/12/25随机森林2/332024/12/25目录1 1决策树3 3随机森林2 2集成学习4 4袋外错误率(OOB)5 5随机森林的简单实例分析3/332024/12/25 决策树决策树:1.每个内部节点上选用一个属性进行分割2.每个分叉对应一个属性值3.每个叶子结点代表一个分类A1A2A3c1c2c1c2c1a11a12a13a21a22a31a32图图1 决策树结构图决策树结构图如图1所示:4/332024/12/25 决策树决策树生成算法分成两个步骤:(1)树的生成 a.开始,数据都在根节点 b.递归的进行数据分片(2)树的剪枝 a.防止过拟合决策树使用:对未知数据进行分割 按照决策树上采用的分割属性逐层往下,直 到一个叶子节点5/332024/12/25 决策树优点:计算复杂度不高,输出结果易于理解,对中间 值的缺失值不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配的问题。使用数据类型:数值型和标称型。6/332024/12/25 决策树例1为决策树的构建流程:一天,老师问了个问题,只根据头发和声音怎么判断一位同学的性别为了解决这个问题,同学们马上简单