1、数据仓库与数据挖掘教学大纲课程名称:数据仓库与数据挖掘/ Data Warehouse and Data Mining学时/学分:32 学时/2 学分(其中理论教学 32 学时,实验上机 0 学时)先修课程:数据库原理、可视化的开发工具适用专业:信息与计算科学开课院(系、部、室):数学与计算机科学学院一、课程性质与任务:本课程是信息与计算科学专业本科生的专业课程。本课程的任务主要是使学生能够掌握数据仓库体系结构设计、数据仓库模型设计、设计数据仓库系统并用数据挖掘作数据准备;掌握有关数据挖掘的基本原理、基本方法与基本技术,了解什么是数据挖掘以及如何用数据挖掘来解决实际问题,识别某个数据挖掘解决方
2、案对特定问题是否切实可行,识别几种数据挖掘策略,了解每种策略的适用时机,全面了解如何通过几种数据挖掘技术建立模型来解决问题。二、课程内容、基本要求与学时分配(一) 引言 2 学时本章叙述了智能信息处理技术的发展历史、与计算机科学各个学科之间的关系、智能信息处理技术的主要组成部分以及他们的功能和应用领域介绍等。(二) 数据仓库 12 学时1操作型数据库2数据仓库概述:阐述数据仓库概念与组成。3数据仓库的系统结构:阐明数据仓库的体系结构与逻辑设计。针对数据仓库的建设过程和数据仓库的扩展性介绍数据仓库的逻辑设计标准和方法。4元数据结构与存储:阐述数据仓库管理和元数据的表现形式。(以及 OMG 的 C
3、WM 标准)5数据仓库的物理设计:阐述在设计数据仓库的设计步骤与物理实现(数据立方体,元数据存储)。6从数据仓库到数据挖掘与联机分析(OLAP)处理技术7多维数据模型(阐述多维分析系统的构造特点和方法,多维数据模型上的 OLAP 操作)。(2 学时)重点:数据仓库及其系统结构;数据仓库的物理设计难点:数据挖掘与联机分析处理技术;多维数据模型(三)数据挖掘技术 16 学时1数据挖掘技术起源2数据挖掘的概念与挖掘技术的应用3在什么数据上进行数据挖掘(关系数据库、数据仓库、事物数据库)4数据库中的知识发现要求深刻理解与熟练掌握的重点内容:一种 KDD(Knowledge Discovery in D
4、atabases)过程模型。目标定义;创建目标数据集; 3:数据预处理;数据转换;数据挖掘;解释和评估;采取行动5数据挖掘功能:(1)关联规则(Association analysis rule)(2)分类(Classification )与预测 (Prediction)(3)聚类(Clustering)分析(4)孤立点(outlier)分析(5)演变分析(Evolution analysis)6数据挖掘系统的分类7数据挖掘的主要问题8数据挖掘技术与算法:(1)聚类分析算法(包括:划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法)(2)关联分析算法(3)决策树算法(4)Bayesi
5、an net 学习算法重点:数据挖掘与知识发现的重要概念;挖掘的数据对象;数据挖掘过程;数据挖掘技术与方法;挖掘算法;难点:数据挖掘技术与方法的实际应用;挖掘算法;(四)智能信息处理技术的未来 2 学时本章主要介绍国际上最新发展,或者可能成为未来技术热点的话题。1知识管理和数据仓库技术:介绍知识管理技术的主要内容,探讨知识管理和数据仓库技术结合的可能性和存在的主要技术难点。2WEB farming、知识管理以及数据仓库的作用重点:数据仓库与数据仓库技术及其作用;难点:数据仓库技术及其作用;知识管理和数据仓库技术的结合三、推荐教材和主要参考书:1推荐教材:(1)Jiawei Han, Miche
6、line Kamber. 著,范明、孟小峰等译数据挖掘概念与技术 ,机械工业出版社,2001。2推荐参考书:(1)Richard J. Roiger, Michael W. Geatz 著, 翁敬农 译 数据挖掘教称, 清华大学出版社,2003。(2)Mehmed Kantardzic 著,闪四清 陈茵 程雁等译数据挖掘概念、模型、方法和算法,清华大学出版社,2003。(3)Data Warehouse Lifecycle Tools, Raph Kimball, 1998。(4)Building Data Warehouse, W. H. Inmon, 1998。大纲制订者:涂承胜大纲审定者:蒋万君注1)OLAP:On-Line Analytical Processing ,联机分析处理。联机分析处理(OLAP) 的概念最早是由关系数据库之父 E.F.Codd 于 1993 年提出的,他同时提出了关于 OLAP的 12 条准则。2)KDD :Knowledge Discovery in Databases,数据库中的知识发现3)APROIRI 算法:一个经典的关联规则挖掘算法。