资料剖析知识探勘.ppt

上传人:ga****84 文档编号:355541 上传时间:2018-09-26 格式:PPT 页数:57 大小:775.50KB
下载 相关 举报
资料剖析知识探勘.ppt_第1页
第1页 / 共57页
资料剖析知识探勘.ppt_第2页
第2页 / 共57页
资料剖析知识探勘.ppt_第3页
第3页 / 共57页
资料剖析知识探勘.ppt_第4页
第4页 / 共57页
资料剖析知识探勘.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、数据挖掘在商业管理与决策分析之实例应用,决策分析质量与效率之提升数据挖掘之原理概念与功能数据挖掘之建构方法应用案例介绍电子商务之应用(Web Mining/WAP Mining)建议与结论,引言,经营环境,经营环境日益挑战考虑:成本、利润、质量 . . . .管理活动整合:业务运作、管理控制、策略规画信息密集行业全方位/多角化经营,资料 -企业宝贵之资产,信息,Mining,资料仓储,Mining,知识,(Corporate Memory),(Corporate Intelligence),Database/DataWarehouse,Targetdata,Cleaneddata,Transf

2、ormeddata,Pattern/model,评鉴,数据视觉,资料挖掘,数据转换与简化,前置处理与清理,样本选取,Performancesystem,知识发现流程(Knowledge Discovery),Knowledge,/Adapted from IBM Corp./,数据挖掘之基本概念,背景管理信息超载及结构化不足信息混乱与误用管理问题复杂度高实时决策分析日益重视发展目的有效利用搜集之市场、客户、供货商、竞争对手及未来趋势信息使企业经由有效之方法与技术从历史数据里撷取有用的知识,数据挖掘原理,主要方法数据库、数据视觉、统计学、机器学习等相关技术类神经网络、模糊逻辑、基因算法、基因规画

3、、 案例库推理法、规则库推理、统计回归等知识表现决策树 、法则、定量数学公式、黑箱公式 等,Data mining主要功能与技术,功能 技术 适用领域关联性 (Association) 案例库推理/集合理论/统计 菜篮分析时间序列 (Sequence) 类神经网络/统计 利率预测分类 (Classification) 基因演算/类神经网络/统计/ 客户评鉴分类 模糊逻辑案例推理/决策树公式 (Modeling) 基因规划/基因演算/回归 销售预测群组 (Clustering) 类神经网络/模糊逻辑/ 市场区隔基因演算/统计,数据挖掘应用现况,Safeway 贩卖促销信息(e.g. coupon

4、)音乐/电影喜好问卷搜集Fidelity Investment客户服务 (cross-selling/ wallet share)First USA Bank信用卡资料(汽车房贷)Capital One 降低贷款风险损失率First Union预测潜在流失客户预测侵蚀性的物质对皮肤的影响降低产品(药品或毒品)的发展成本和时间,以及减少动物实验的需求分析零售商店历史销售记录与位置概述以决定最佳的位置分析提款机设置地点最佳位置,Data Mining 过程,了解应用领域建立目标集、选择目标数据集去除数据杂质、做先置处理减少数据和数据转换选择数据挖掘的模式(功能)选择数据挖掘的算法(技术)资料挖掘评

5、估第七步骤的结果整理发现的知识,实例应用,客户评鉴与分类 (NeuroFuzzy)提升邮购回函率 (Fuzzy)股市交易最佳化规则之发掘 (GA)零售商品与客源群聚相关性分析 (Neural/Statistic)民航机重落地分析(Regression Tree)化妆品偏好分析(Classification Tree)窑烧最佳化控制(Neural/GA)大哥大忠诚客户与游离客户之分析及预测(Classification Tree),股市交易最佳化规则之发掘,规则一假如6日RSI小于20且6日BIAS 小于 -4%时则 买入并持有12日规则二假如6日RSI 大于 80且6日BIAS 大于 5%时则

6、 卖出并放空10日,提升Direct Mail回函率,寄出信函数(寄出成本),回函数,节省,目标营销,大众营销,预定目标,Segment 1 (Age 43)(42.8%),Segment 2 (Age 42)(24.8%),Segment 3 (Age 52)(20.4%),Segment 4 (Age 26)(11.9%),Market SegmentationSegment size, average age,Figure 9.3 Segmentation Results: Segment Size and Average Age,population,Segment3,Segmnet1

7、,Segmenet4,Segment2,Target Categories,Avg$spent,3000,2000,2500,1500,1000,500,0,Market Segment AnalysisSegments v.s. Population,Figure 9.4 Market Segmentation Analysis,Safeway 案例,面临之挑战8 million transaction data/week (4 T MB)500家店面与600万客户市场竞争激烈,传统手法技术式微 (如更低价位,更多据点,多类产品)新的竞争关键焦点:掌握客户需要-哪类客户买哪些商品以及购买频率

8、,Market Basket Analysis (菜篮分析),CokeMilkJuiceEgg,Coke,Milk,Juice,Egg,Egg,Juice,Milk,Coke,其它相关应用,发掘背部手术成败关键因素磁砖颜色配比决策辅助旋窑燃烧最佳化控制研磨机钢球配比及置放址决策辅助电子能量、功率、废气流量、氨气流量组合对氮氧化物及硫氧化物去除效率之模式发展污染排放量预测模式(DECADES MODEL)燃烧炉中NG、LPG、与正常空气之配比对燃烧效率及其它有害气体之排放程度之影响,其它相关应用(续),发掘共同基金潜在客户银行活期存款账户流失率估计相关产品群组设计(cross-selling)预

9、测油田生产量海上石油外溢对生态破坏影响之估计飞机结构负载,医疗案例,DISXPERT - 残障职业转介专家系统 区别分析寻找分类要因数据学习以萃取分类规则整合专家规则与萃取分类规则延伸应用客户分类,医疗保险FAMS的 功 能,侦测 ( Detection )利用fuzzy modeling和统计技术来分析群组的行为,针对每个医疗服务提供者评定分数,以反应其遍离行为标准的程度调查 ( Investigation )分析提供者的分数和详细的赔偿数据解决 ( Settlement )详细分析群组行为和赔偿的报告和图表。报告可以用来协商、解决问题和检举不法之事 预防 ( Prevention )支持提

10、供者的监视和提供新的工具来评估和教育他们,改善提供者的行为,以防止医疗诈欺和滥用,减低保险公司的损失,FAMS的特性,利用案例数据的“retrospective analysis”,分析帐目和医疗提供者的医疗工作,以找出有嫌疑的提供者依据医疗专业和地理位置来定义群组例如,你可以着重于Los Angeles的经神科、Hartford的皮肤科、大都会地区的紧急救护服务,建置数据剖析应注意事项,在规画Data Warehouse时即应与所需Mining之目标结合配合数据处理情况 Data Warehouse - Data Marts - Cube 选择软硬件发展平台分期或分步骤并以渐进式方法开发80

11、%心力需投入于Data Preparation步骤常见之主机平台包括:IBM/390, HP9000, IBM RS-6000, SUN, UNISYS,可能遭遇问题之影响因素,企业教育训练之不足不适当之支持工具数据之无效性资料样型(patterns)太多多变与时间性数据复杂之数据型态没有现成之模式可立即使用数据质量资料可取得性专家意见,Web/WAP Mining,Dynamic product catalogDynamic bannerDynamic contentTailored mailing list,Data Mining for CRM/Churn Management,Defe

12、ctor identificationCampaign promotionMarketing resource allocationRisk assessment & fraud detectionRoyal customer identification,Business Intelligence in Electronic Commerce,建议与结论,以信息科技为主轴之经营管理数据之保存、管理与运用为致胜关键善用商业智慧工具以有效解决问题,案例(一)建物抵押贷款申请评估,说明:评估模式针对五个输入变项值给予综合评定 分数-1).建造的施工质量、 2).建筑物的位置、 3).申贷人的资产、

13、 4).申贷人的收入、 5).利 息支付情况。各个项目的评分范围从0分到 100分。可使用之技术:基因算法、决策树、类神经 网络、基因规划法,计分模式结构,案例(二) DM寄送对象评分,说明:评估模式针对六个输入变项值给予综合评定 分数 - 1).盈余、2).住家地理位置、 3).房地产 总值、 4).年龄、 5).小孩个数、 6).是否结婚。可使用之技术:基因算法、决策树、类神经 网络、基因规划法,计分模式结构,窑烧最佳稳定控制结果,x1x2x3x4x5,资料挖掘技术与发展,类神经网络-监督式学习,类神经网络-非监督式学习,模糊规则库,Neuro-Fuzzy类神经-模糊系统,Genetic

14、Algorithm(基因演算),基因演算原理,GP(基因规划),GP-Fuzzy基因规划-模糊系统,案例推理流程,If Time_band =2.5 yearsand Time_employed =1.5 yearwhile reject is only 3.2% likely.A total of 63 cases fit this profile,61 accepts and 2 rejects.,决策树,过去相关RD经历,民营单位计划因特网客户购买行为分析暨预测(安瑟在线),2000网页浏览使用行为分析(发现者国际公司),2000大哥大门号转换与客户流失分析(自行研究),2000网际广告

15、暨电视广告采买组合决策辅助系统(润利公司),1999消费者对化妆品之品牌选择模式建构与分析(资生堂、佳丽宝与香奈儿),1999ISP客户使用意愿分析因果预测模式建构(自行研究),1999信用卡持卡人延滞缴款预测模式研究(某国内金融机构),1999信用卡签帐金额预测(某金融单位),1999保险产品与客户选择分析辅助系统(某保险经济人公司),1999医院洗肾中心护理人员排班辅助系统(长庚医院),1998船席调配作业专家决策系统(基隆港务局),1998,过去相关RD经历(续),公营单位基因工程算法则应用于飞机结构负载历程之分析, 航发中心,NSC 89-2623-D-155 -005,1999/7/

16、12000/6/31动态基因规划, 国科会, NSC 89-2416-H-155 -015,1999/8/12000/7/31建立区域整体资源规划数据库先期研究,台湾电力综合研究所,TAE87001, 1999/1/11999/6/31非破坏检测专家系统推理机构之开发,中科院,NSC88-2623-D-155-003,1998/7/11999/6/31GA-Fuzzy在证券投资之辅助应用,国科会,NSC88-2416-H-155-019,1998/8/11999/7/31智能型水泥设备操作系统之研究, 亚洲水泥公司,CFF87006, 1998/2/1 1999/1/31全民健康保险复建医疗费

17、用专业审查一致性之评估研究, 中央健保局, D0H87-NH-031, 1998/3/1 1999/2/28,研发之方法与技术,。Genetic Algorithms(基因算法)。Genetic Programming(基因规划法)。Neural Networks(类神经网络)。Fuzzy Logic(乏晰理论)。Case-Base Reasoning(案例库推理)。Rule-Based System(专家规则)。Genetic-Based Decision Tree System(决策树专家系统),软件资源(智能型系统实验室),Rule-Base packagesLEVEL5XpertRul

18、eProfilerWinRosaGA packagesEvolverGeneHunterGeneratorCBR packagesInduce ITEsteemFuzzy Logic packagesFuzzyTech for BusinessCubiCalcFuzzy Thought Amplifier,Neural Net packagesLabView & Intelligent DataEngineNeuroShell IINeuroForecasterNeuroWindowsNon-Linear Modeling packagePCNonlinDymaic-GPDecision Trees packageGA-TreeSee5/CubistOptimization & SimulationRiskOptimizerRisk,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。