1、 数据挖掘 广东技术师范学院计科系 叶海山书 数据挖掘概念与技术 作者 : (加) JIAWEI HAN MICHELINE KAMBER 出版社 : 机械工业出版社网站1、数据仓库之路 http:/ http:/ http:/ 1章 绪论1.1 初识数据挖掘1.2 初识数据仓库1.3 进一步理解数据挖掘 1.4 数据挖掘应用实例1.5 数据挖掘的发展趋势3第 1章 绪论 数据挖掘 (Data mining, DM)技术是一门综合性的技术领域,主要涉及 数据库、人工智能和数理统计 3个技术领域。4第 1章 绪论 1.1 初识数据挖掘1.1.1数据挖掘的产生 产生的前提:从大量数据中找出隐藏在其
2、中的、有用的信息和规律;计算机技术和信息技术的发展使其有能力处理这样大量的数据。 5第 1章 绪论1.1.2数据挖掘的应用价值 应用数据挖掘从大量数据中所发现的规律并不是 “ 放置四海而皆准 ” 的规律,而是 面向某一应用的规律,具有具体的指导意义。成功例子:零售业的沃尔马 “ 啤酒与尿布 ” 规律Google中国宝山钢铁公司 1995年开始利用数据挖掘技术提高热轧产品质量、合理配矿中国铁道部 1998年开始利用数据挖掘技术分析春运期间的铁路客流量,挖掘影响铁路客运总量的关键因素6第 1章 绪论1.1.3数据挖掘的发展过程八十 年代人工智能( AI) 研究项目失败后,转入实际应用时提出的。 1
3、989年国际上第一次关于数据挖掘与知识发现的研讨会在美国的底特律召开,在此次会议上第一次提出了 知识发现( Knowledge Discovery in Database, KDD) 一词。1995年,在加拿大召开了第一届 KDD和 DM国际学术会议。会议对 KDD做了确切的定义 。 从九十年代中后期开始, KDD和 DM已成为研究的热点和焦点。78第 1章 绪论1.1.4 数据挖掘的定义数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。原始数据可以是结构化的也可以是半结构化的。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。 9第 1章 绪论1.2 初识数据仓库1.2.1 数据仓库的产生 1988年 IBM爱尔兰公司第一次提出了 “ 信息仓库” 的概念。90年代初数据仓库的基本原理、框架架构,分析系统的主要原则都已经确定,主要的技术已具备,一些公司开始建立数据仓库。92年美国著名的信息工程学家 William H.Inmon 在 Building the Data Warehouse ( 建立数据仓库 ) 一书中首先系统的阐述了数据仓库的思想、理论。被人们尊称为 “ 数据仓库之父 ” 。 10