1、数据挖掘信息管理与工程学院教材信息: 数据挖掘原理与算法 毛国君,段立娟,王实,石云清华大学出版社, 2007本课程的一些约定:n 1、课程目的:拓宽与加深专业知识n 2、注重平时学习n 作业按时完成n 未按时为晚交n 一周内未交视为放弃n 作业按规定要求完成n 教科书:不可或缺n 不允许抄袭n 但鼓励讨论n 3、无迟到、缺席、手机等n 什么激发了数据挖掘,为什么它是重要的?n 什么是数据挖掘?n 在何种数据上进行数据挖掘?n 数据挖掘功能 可以挖掘什么类型的模式n 所有模式都是有趣的吗?n 数据挖掘系统的分类n 数据挖掘的主要问题第一章 绪论 内容提要n 数据挖掘技术的产生与发展 n 数据挖
2、掘研究的发展趋势 n 数据挖掘概念 n 数据挖掘技术的分类问题n 数据挖掘常用的知识表示模式与方法n 不同数据存储形式下的数据挖掘问题 n 粗糙集方法及其在数据挖掘中的应用 n 数据挖掘的应用分析 数据挖掘技术的商业需求分析 n 随着信息技术的高速发展,数据库应用的规模、范围和深度不断扩大,网络环境成为主流等等。产生 “ 数据丰富而信息贫乏( Data Rich & Information Poor) ” 现象。n 在强大的商业需求的驱动下,商家们开始注意到有效地解决大容量数据的利用问题具有巨大的商机;学者们开始思考如何从大容量数据集中获取有用信息和知识的方法。n 随着信息技术的高速发展,人们
3、希望能够提供更高层次的数据处理功能。 新的需求推动新的技术的诞生。n 数据( Data)、信息( Information)和知识(Knowledge)是广义数据表现的不同形式。数据、信息和知识data information knowledge数据挖掘产生的技术背景n 数据挖掘是相关学科充分发展的基础上被提出和发展的。n 主要的相关技术:n 数据库、数据仓库和 Internet等信息技术的发展n 计算机性能的提高和先进的体系结构的发展n 统计学和人工智能等方法在数据分析中的研究和应用数据挖掘是一个多学科交叉技术Data MiningDatabase Technology StatisticsO
4、therDisciplinesInformationScienceAI /MachineLearning Visualization数据库系统的发展n 60年代:简单文件处理系统向数据库系统变革 。n 70年代:层次、网络和关系型数据库普及。 n 80年代: RDBS及其相关工具、数据索引及数据组织技术被广泛采用;中期开始,分布式数据库广发讨论,关系数据库技术和新型技术的结合。 n 90年代:数据库领域中的新内容、新应用、新技术层出不穷,形成了庞大的数据库家族;人们期望分析预测、决策支持等高级应用, Data mining and data warehousing等出现。n 本世纪开始: Data mining 得到理论 /技术深化。