精选优质文档-倾情为你奉上基于信息增益的决策树摘 要本文深入研究了ID3算法的理论基础及构建决策树的过程等知识。Quinlan提出的ID3算法虽然经典,但也有美中不足之处。本文使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点(即多值偏向问题),对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已知值的相对频率随机分布的思想,可以处理缺少属性值的样本。描述了通过改进的ID3算法生成决策树的具体步骤,将改进算法应用到了客户关系管理系统中的客户流失分析问题当中。通过对实验结果的分析比较,得到改进算法与原ID3算法相比具有更高的预测准确率,表明了该算法的有效性。关键词:ID3算法;决策树;信息增益;多值偏向Decision Tree based on the Information Gain TheoryAbstractFirstly, theoretical basis and the process of building decision tree of ID3 algorithm are furt