1分类分类:基本概念基本概念n分类:基本概念n决策树n基于规则分类n贝叶斯分类方法n提高分类准确率的技术n小结什么是分类?什么是分类?n分类,分类器n银行贷款员需要分析数据,以便搞清楚哪些贷款申请者是“安全的”;医学研究人员分析癌症数据,以便选择治疗方案n数据分析任务都是分类,都需要构造一个分类器来预测类标号n数值预测,预测器n销售经理希望预测一位给定的顾客在双11的一次购物期间将花多少钱n数据分析任务就是数值预测,所构造的模型(预测器)预测一个连续值函数或有序值,而不是类标号2n分类n预测类标号(离散的或标称的)n基于训练集和类标号构建分类器,并对新的数据进行分类n数值预测n所构造的模型预测一个连续值函数,而不是类标号n典型应用n信用卡/贷款批准:n医疗诊断:肿瘤是良性的还是恶性的n欺诈检测:一次交易是否是欺诈的n网页分类:属于哪一类预测问题预测问题:分类与数值预测分类与数值预测3分类分类一个两阶段过程一个两阶段过程n两阶段:学习阶段(构建分类模型)和分类阶段(使用模型预测给定数据的类标号)n分类模型构建(学习阶段):描述预先定义的类n假设每个元组都属于一个预先定义的类,由类标号属性