ImageVerifierCode 换一换
格式:PPT , 页数:19 ,大小:556KB ,
资源ID:1420406      下载积分:10 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-1420406.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据挖掘-数据泛化.ppt)为本站会员(99****p)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

数据挖掘-数据泛化.ppt

1、数据立方体计算与数据泛化数据泛化n 数据泛化q 数据库中的数据和对象通常包含原始概念层的细节信息,数据泛化就是将数据库中的跟任务相关的大型数据集从相对较低的概念层抽象到较高的概念层的过程。n 主要方法:q 数据立方体( OLAP使用的方法)q 面向属性的归纳方法12345概念层(Month, city, customer_group)(Month, *, *)两种不同类别的数据挖掘n 从数据分析的角度看,数据挖掘可以分为描述性挖掘和预测性挖掘q 描述性挖掘:以简洁概要的方式描述数据,并提供数据的有趣的一般性质。n E.g. 数据泛化就是一种描述性数据挖掘q 预测性数据挖掘:通过分析数据建立一个

2、或一组模型,并试图预测新数据集的行为。n E.g 分类、回归分析等数据立方体的物化n 数据立方体有利于多维数据的联机分析处理q 数据立方体使得从不同的角度对数据进行观察成为可能n 方体计算(物化)的挑战:海量数据,有限的内存和时间q 海量数据运算对大量计算时间和存储空间的要求数据立方体 -基本概念 (1)n 数据立方体可以被看成是一个方体的格,每个方体用一个 group-by表示n 最底层的方体 ABC是基本方体,包含所有 3个维n 最顶端的方体(顶点)只包含一个单元的值,泛化程度最高n 上卷和下钻操作与数据立方体的对应BA()CAB AC BCABC数据立方体 -基本概念 (2)n 基本方体

3、的单元是 基本单元 ,非基本方体的单元是 聚集单元q 聚集单元在一个或多个维聚集,每个聚集维用 “*“表示q E.g. (city, *, year, measure)q m维方体: (a1,a2,.,an)中有 m个不是 “*“n 祖先和子孙单元q i-D单元 a=(a1,a2,.,an, measuresa)是 j-D单元b=(b1,b2,.,bn, measureb)的祖先,当且仅当n (1)i= min_sup闭立方体 (1)n 冰山方体的计算通过冰山条件(例: HAVING COUNT(*) = min_sup)来减轻计算数据立方体中不重要的聚集单元的负担,然而仍有大量不感兴趣的单元

4、需要计算q 比如:最小支持度为 10,假定 100维的数据立方体有两个基本方体: (a1,a2,a3,a 100):10, (a1,a2,b3,b 100):10,假设冰山条件为最小支持度10n 则需计算和存储的单元仍是海量: 2101-6个n 如: (a1,a2,a3,a 99,*):10, (a1,*,a3,a 100):10闭立方体 (2)n 闭单元q 一个单元 c是闭单元,如果单元 c不存在一个跟 c有着相同度量值的后代 dq 例如:上述例子中,任何一个 (a1,a2,a3,*,*,* ):10,都和他的后代有相同度量值n 闭立方体:一个仅有闭单元组成的数据立方体q 例如:(a1,a2,*,*,* ):20(a1,a2,a3, a 100):10 (a1,a2,b3, b 100):10

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。