数据挖掘技术.ppt

上传人:99****p 文档编号:1420394 上传时间:2019-02-25 格式:PPT 页数:46 大小:355.50KB
下载 相关 举报
数据挖掘技术.ppt_第1页
第1页 / 共46页
数据挖掘技术.ppt_第2页
第2页 / 共46页
数据挖掘技术.ppt_第3页
第3页 / 共46页
数据挖掘技术.ppt_第4页
第4页 / 共46页
数据挖掘技术.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、数据挖掘技术1综 述1数据挖掘技术为什么要数据挖掘?n数据的爆炸性增长:从 TB到 PBn丰富数据的来源:商业: WEB、电子商务、交易数据、股市 .科学:遥感、生物信息学、科学模拟,社会及每个人:新闻、数码相机n我们被数据所淹没,但却渴望知识“需要是发明之母 ”数据挖掘:海量数据的自动分析技术2数据挖掘技术数据库技术的演化60-70年代 :网络数据库、层次数据库70-80年代 :关系数据库模型和原型系统80-90年代 :各种高级数据模型、各类以应用为导向的数据库。90-今 :数据挖掘、数据仓库、多媒体数据库、 WEB3数据挖掘技术什么是数据挖掘?数据挖掘 (从数据中发现知识 ) 从 大量的数

2、据 中挖掘哪些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识 数据挖掘的替换词数据库中的知识挖掘( KDD)知识提炼数据 /模式分析数据考古数据捕捞、信息收获等等。4数据挖掘技术5数据挖掘技术在今天, NBA的教练有了他们的新式武器:决策支持下的数据分析。大约 20个 NBA球队使用了 IBM公司开发的数据挖掘软件来优化他们的战术组合。该软件就因为研究了魔术队队员不同的布阵,在魔术队与迈阿密热队的比赛中找到了获胜的机会。(1) 系统分析显示魔术队先发阵容中的两个后卫哈德卫和伯兰在前两场中被评为 17分 ,这意味着他俩在场上,本队输掉的分数比得到的分数多17分。然而,当哈德卫与替

3、补后卫阿姆斯创组合时,魔术队得分为正 14分。(2) 在下一场中,魔术队增加了阿姆斯创的上场时间。此招果然见效:阿姆斯创得了 21分,哈德卫得了 42分,魔术队以 88比 79获胜。有趣的数据挖掘 -美国 NBA6数据挖掘技术n零售业 用于识别顾客的购买模式,在顾客的统计特征中发现关联,预测促销活动的反应,进行市场分析。 啤酒和尿布的的关系,我们非常熟悉! 如在购买面包和黄油的顾客中,有90%的人同时也买了牛奶 ” : (面包 +黄油)( 牛奶 )。数据挖掘其他应用7数据挖掘技术n 银行洗钱 : 发现可疑的货币交易行为二八定律: 意大利经济学家帕累托发现了财富和收益间的关系,潜心研究发现,社会

4、上的大部分财富被少数人占有,从大量具体的事实中挖掘出一个简单而让人不可思议的结论: 如果社会上 20的人占有社会 80的财富,那么可以推测, 10的人占有了 65的财富,而 5的人则占有了社会 50的财富。 数据挖掘其他应用8数据挖掘技术n保险 如; 保险客户流失性判断数据挖掘其他应用收入 5万元年龄 35岁不易流失 易流失是否事业单位不易流失 易 流 失Y NY Y NN9数据挖掘技术n股票预设预测一支股票的走势几乎是不可能,但是通过相关分析,可以找出一支股票的走势与另一只股票走势的潜在规律,比如数据挖掘曾经得到过这个结论: “如果微软的股票下跌 4%,那么 IBM的股票将在两周内下跌 5%”。 n医疗 探求各种疾病之间的相互关系、各种疾病的发展规律,总结各种治疗方案的治疗效果,以及对疾病的诊断、治疗和医学研究是非常有价值和发展前景的。同时,医疗数据是既有文本、如: 预测肝癌患者存活期数据挖掘其他应用10

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。