数据挖掘导论--第5章-分类-其他技术.ppt

上传人:99****p 文档编号:1420381 上传时间:2019-02-25 格式:PPT 页数:134 大小:1.47MB
下载 相关 举报
数据挖掘导论--第5章-分类-其他技术.ppt_第1页
第1页 / 共134页
数据挖掘导论--第5章-分类-其他技术.ppt_第2页
第2页 / 共134页
数据挖掘导论--第5章-分类-其他技术.ppt_第3页
第3页 / 共134页
数据挖掘导论--第5章-分类-其他技术.ppt_第4页
第4页 / 共134页
数据挖掘导论--第5章-分类-其他技术.ppt_第5页
第5页 / 共134页
点击查看更多>>
资源描述

1、数据挖掘导论Pang-ning Tan, Michael Stieinbach, and Vipin Kumar著Pearson Education LTD.范明 等译人民邮电出版社* 1数据挖掘:概念与技术第 5章 分类 : 其他技术 基于规则的分类最近邻分类贝叶斯分类神经网络支持向量机组合方法不平衡类问题多类问题* 2数据挖掘:概念与技术5.1 基于规则的分类器* 3数据挖掘:概念与技术基于规则的分类器n 使用一组 “ifthen” 规则进行分类n 规则 : (Condition) yn 其中 n Condition 是属性测试的合取n y 是类标号n 左部 : 规则的前件或前提n 右部

2、: 规则的结论n 分类规则的例子 :n (Blood Type=Warm) (Lay Eggs=Yes) Birdsn (Taxable Income 鸟类n 规则 r3 覆盖 “灰熊 ” = 哺乳类名称 体温 表皮覆盖 胎生 水生 动物飞 行 动物有腿 冬眠 类标 号鹰灰熊 恒温恒温羽毛软 毛否是否否是否是是否是?Date 6数据挖掘:概念与技术规则的质量 n 用覆盖率和准确率度量n 规则的覆盖率 ( coverage) :n 满足规则前件的记录所占的比例n 规则的准确率 ( accuracy) :n 在满足规则前件的记录中,满足规则后件的记录所占的比例n 规则 : (Status=Sing

3、le) NoCoverage = 40%, Accuracy = 50%Tid Refund Marital Status Taxable Income Class 1 Yes Single 125K No2 No Married 100K No3 No Single 70K No 4 Yes Married 120K No 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes10 Date 7数据

4、挖掘:概念与技术如何用规则分类n 一组规则r1:(胎生 = 否) (飞行动物 = 是) 鸟类r2:(胎生 = 否) (水生动物 = 是) 鱼类r3:(胎生 = 是) (体温 = 恒温) 哺乳类r4:(胎生 = 否) (飞行动物 = 否) 爬行类r5:(水生动物 = 半) 两栖类n 待分类记录n 狐猴 触发规则 r3, 它分到 哺乳类n 海龟触发规则 r4和 r5-冲突n 狗鲨未触发任何规则名称 体温 胎生 飞行动物 水生动物 类狐猴 恒温 是 否 否 ?海龟 冷血 否 否 半水生 ?狗鲨 冷血 是 否 是 ?Date 8数据挖掘:概念与技术规则的分类器的特征n 互斥规则集n 每个记录最多被一个规则覆盖n 如果规则都是相互独立的,分类器包含互斥规则n 如果规则集不是互斥的n 一个记录可能被多个规则触发n 如何处理 ?n 有序规则集n 基于规则的序 vs 基于类的序n 无序规则集 使用投票策略Date 9数据挖掘:概念与技术规则的分类器的特征 (续 )n 穷举规则集n 每个记录至少被一个规则覆盖n 如果规则集涵盖了属性值的所有可能组合,则规则集具有穷举覆盖n 如果规则集不是穷举的n 一个记录可能不被任何规则触发n 如何处理 ?n 使用缺省类Date 10数据挖掘:概念与技术

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。