ImageVerifierCode 换一换
格式:PPT , 页数:32 ,大小:880.50KB ,
资源ID:1420452      下载积分:12 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-1420452.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(挖掘关联规则.ppt)为本站会员(99****p)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

挖掘关联规则.ppt

1、1挖掘关联规则n 关联规则挖掘n 事务数据库中关联规则挖掘算法n 基于限制的关联挖掘2关联规则n 关联规则反映一个事物与其他事物之间的 相互依存性和关联性 。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物就能够通过其他事物 预测 到。 n 典型的关联规则发现问题是对超市中的货篮数据进行分析。通过发现顾客放入货篮中的不同商品之间的关系来分析顾客的购买习惯。 3什么是关联规则挖掘n 关联规则挖掘 (1993)n 在事务、关系数据库中的项集和对象中发现 频繁模式 、关联规则 、 相关性或者因果结构n 频繁模式 : 数据库中频繁出现的 项集 n 目的 : 发现数据中的规律n 超市数据中

2、的什么产品会一起购买? 啤酒和尿布n 在买了一台 PC之后下一步会购买 ?n 我们如何自动对 Web 文档进行分类 ?n 交叉销售、直销等4关联规则基本模型 n Apriori是关联规则模型中的经典算法。n 给定一组事务n 产生所有的关联规则n 满足最小支持度和最小可信度5关联规则基本模型n 设 I=i1, im为所有项目的集合, D为事务数据库,事务 T是一个项目子集( TI)。每一个事务具有唯一的事务标识 TID。n 设 A是一个由项目构成的集合,称为 项集 。事务 T包含项集 A,当且仅当 AT。n 如果项集 A中包含 k个项目,则称其为 k项集 。n 项集 A在事务数据库 D中出现的次

3、数占 D中总事务的百分比叫做项集的 支持度 。n 如果项集的支持度超过用户给定的 最小支持度 (阈值 ),就称该项集是 频繁项集 。 6关联规则基本模型n 关联规则是形如 XY的逻辑蕴含式,其中 XI, YI,且 XY=。n 如果事务数据库 D中有 s% 的事务包含 XY,则称关联规则 XY的 支持度为 s%n support (XY)=P (X Y)n 项集的 支持度计数 support_countn 包含项集的事务数n 若项集 X的 支持度 记为 support (X),规则的 置信度 为 support (XY) support (X)。n 是一个条件概率 P (Y | X)。 conf

4、idence (XY)=P (Y | X)n =support _count(XY) support_count (X)7频繁模式和关联规则n Itemset X=x1, , xkn 找出满足最小支持度和置信度的所有规则 XY n 支持度 , s, 事务包含 XY 的概率 n 置信度 , c, 事务含 X 也包含 Y 的 条件概率 .顾客购买尿布顾客购买二者顾客购买啤酒Transaction-idItems bought10 A, B, D20 A, C, D30 A, D, E40 B, E, F50 B, C, D, E, F令 supmin = 50%, confmin = 50%A:3

5、, B:3, D:4, E:3, F:3,AD:3关联规则 Association rules:A D (60%, 100%)D A (60%, 75%)8挖掘关联规则 一个例子规则 A C支持度 = support(AC) = 50%置信度 = support(AC)/support(A) = 66.6%最小支持度 50%最小置信度 50%Transaction-id Items bought10 A, B, C20 A, C30 A, D40 B, E, FFrequent pattern SupportA 75%B 50%C 50%A, C 50%9第 5讲:挖掘关联规则n 关联规则挖掘n 事务数据库中关联规则挖掘算法n 基于限制的关联挖掘10Apriori算法的步骤n Apriori算法将发现关联规则的过程分为两个步骤:n 通过 迭代 、 检索 出事务数据库中的所有频繁项集,即支持度不低于用户设定的阈值的项集;n 利用频繁项集构造出满足用户最小信任度的规则。n 挖掘或识别出 所有频繁项集 是该算法的 核心 ,占整个计算量的大部分。

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。