1决策树(Decision Tree)2022/12/2421、分类的意义数据库数据库了解类别属性了解类别属性与特征与特征预测预测分类模型决策树分类模型聚类一、分类(Classification)2022/12/243数据库数据库分类标记分类标记性别性别年龄年龄婚姻婚姻否否是是否否是是FemaleFemaleMaleMale35353535未婚未婚已婚已婚2022/12/242、分类的技术(1)决策树4(2)聚类2022/12/243、分类的程序5模型建立(Model Building)模型评估(Model Evaluation)使用模型(Use Model)2022/12/24决策树分类的步骤6数据库2022/12/24训练样本(training samples)建立模型测试样本(testing samples)评估模型例:7资料训训练练样样本本婚姻年龄 家庭 所得否是否是未婚已婚3535低高否小康1.建立模型测试样本2.模型评估错误率为66.67%修改模型3.使用模型2022/12/244、分类算法的评估8预测的准确度:指模型正确地预测新的或先前未见过的数据的类标号的能力。训练测试