第五章 概念描述:特征化与比较n什么是概念描述?n数据概化和基于汇总的特征化n解析特征化:属性相关分析n挖掘类比较:区分不同的类n在大型数据库中挖掘描述统计度量n讨论n小结什么是概念描述?n概念描述:n特征化:提供给定数据的简洁汇总n比较:提供两个或多个数据汇集的比较描述概念描述与OLAP的比较n概念描述:n 能处理复杂数据类型的属性和它们的聚集n 更加自动运行nOLAP:n简单的数据分析模型n用户控制运行数据概化和基于汇总的特征化n数据概化n是一个将大的任务相关的数据集从较低的概念层抽象到较高的概念层n方法:n数据立方体方法n面向属性的归纳方法12345概念上的层次面向属性归纳n1989年首次提出n基本思想n使用关系数据库查询收集相关的数据n考察数据每个属性的不同值的个数,进行概化n概化可以通过属性删除,或者属性概化进行n与用户交互.例子nDMQL:描述了大学数据库毕业学生的情况use Big_University_DBmine characteristics as“Science_Students”in relevance to name,gender,major,birth_pl