概念描述:特征化与比较两种不同类别的数据挖掘 n 从数据分析的角度看,数据挖掘可以分为描述 性挖掘和预测性挖掘 q 描述性挖掘:以简洁概要的方式描述数据,并提供 数据的有趣的一般性质。 q 预测性数据挖掘:通过分析数据建立一个或一组模 型,并试图预测新数据集的行为。什么是概念描述? n 概念描述是一种最简单的描述性挖掘 q 当所描述的概念所指的是一类对象时,也称为类描 述 n 概念指的是一类数据的集合 q e.g. 研究生,大客户 n 概念描述是指为数据的特征化和比较产生描述 q 特征化:提供给定数据集的简洁汇总。 q 区分:提供两个或多个数据集的比较描述。概念描述 VS. OLAP n 概念描述和数据仓库的联机分析处理(OLAP )都跟 数据概化密切相关,即以简洁的形式在更一般的抽象 层描述数据,允许数据在抽象层概化,便于考察数据 的一般行为。 n 两者的主要区别: q 概念描述 n 可以处理复杂数据类型的属性及其聚集 n 一个更加自动化的过程 q OLAP n 实际使用的OLAP 系统中,维和度量的数据类型都非常有限( 非数值型的维和数值型的数据),表现为一种简单的数据分析 模型