数据挖掘模型介绍2016.pptx

上传人:99****p 文档编号:1420400 上传时间:2019-02-25 格式:PPTX 页数:78 大小:2.19MB
下载 相关 举报
数据挖掘模型介绍2016.pptx_第1页
第1页 / 共78页
数据挖掘模型介绍2016.pptx_第2页
第2页 / 共78页
数据挖掘模型介绍2016.pptx_第3页
第3页 / 共78页
数据挖掘模型介绍2016.pptx_第4页
第4页 / 共78页
数据挖掘模型介绍2016.pptx_第5页
第5页 / 共78页
点击查看更多>>
资源描述

1、刘海飞数据挖掘模型21.数据 挖掘概念与流程2.数据 挖掘模型介绍 决策树模型 聚类模型 关联模型 回归模型 时间序列模型 主成分与因子模型 神经网络模型目录n 数据挖掘 (Data Mining)是通过分析每个数据,从大量数据中寻找其规律的技术。 3个步骤:数据准备、规律寻找和规律表示。 挖掘任务:关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。n 由 Daimler Chrysler、 SPSS和 NCR三家机构共同发展起来的数据挖掘方法论( Http:/www.crisp-dm.org)n CRISP-DM( Cross-Industry Standard Proces

2、s for Data Mining,跨行业数据挖掘标准流程)注重数据挖掘技术的应用。 CRISP-DM过程模型从商业的角度给出对数据挖掘方法的理解。目前数据挖掘系统的研制和开发大都遵循 CRISP-DM标准,将典型的挖掘和模型的部署紧密结合。3数据挖掘数据挖掘 -CRISP-DM模型模型4数据挖掘数据挖掘 -CRISP-DM模型模型n CRISP-DM模型过程的 挖掘流程包括:业务理解、数据理解、数据准备、建立模型、模型评价、模型实施。业务理解 数据理解数据准备建立模型评价实施 数据CRISP-DM数据挖掘流程数据挖掘 (Data Mining)技术主要无监督和有监督两大类。无监督数据挖掘:不

3、区别对待各个变量,而只是考察变量间的关系。有监督数据挖掘:从数据中获得深度细致的信息,根据一些变量建立模型,来预测另一些变量。有监督数据挖掘方法 :聚类分析、因子分析、主成分分析、神经网络、预测等;无监督数据挖掘方法 : 关联规则挖掘、时序挖掘、偏差分析等。5数据挖掘技术数据挖掘技术6找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法模型而求得分类规则。分类可被用于规则描述和预测。目前比较常见的分类算法有决策树算法、贝叶斯分类和支持向量机算法( Support Vector Machine

4、)等等。分类算法分类算法决策树分类模型的工作过程图 Building Treen 基本思想 :提取 分类规则,进行分类预测判定树分类算法output训练集 决策树input决策树 进行 分类步骤n 决策树 生成算法分成两个步骤 树的生成 开始,数据都在根节点 递归的进行数据分片 树的修剪 去掉一些可能是噪音或者异常的数据n 决策树使用 : 对未知数据进行分割 按照决策树上采用的分割属性逐层往下,直到一个叶子节点决策树算法n基本算法(贪心算法)自上而下分而治之的方法开始时,所有的数据都在根节点属性都是种类字段 (如果是连续的,将其离散化 )所有记录用所选属性递归的进行分割属性的选择是基于一个启发式规则或者一个统计的度量 (如 , information gain: 信息增益 )n停止 分割的条件一个节点上的数据都是属于同一个类别没有属性可以再用于对数据进行分割伪代码 (Building Tree)Procedure BuildTree(S)用数据集 S初始化根节点 R 用根结点 R初始化队列 QWhile Q is not Empty do 取出队列 Q中的第一个节点 Nif N 不纯 (Pure) for 每一个属性 A估计该节点在 A上的信息增益选出最佳的属性,将 N分裂为 N1、 N2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。