2015/5/24 数据挖掘 1第六章 聚 类 分 析l 什么是聚类分析?l 主要聚类方法的分类l 划分方法l 层次方法l 基于密度的方法l 基于网格的方法l 聚类的评估l 基于模型的聚类方法l 小结2015/5/24 数据挖掘 2聚类的普遍应用2015/5/24 数据挖掘 3聚类的应用举例2015/5/24 数据挖掘 4什么是好的聚类?2015/5/24 数据挖掘 5数据挖掘对聚类的要求l 可伸缩性l 处理不同类型属性的能力l 发现任意形状的聚类l 对于决定输入参数的领域知识需求最小l 处理带噪声数据的能力l 增量聚类和对输入记录的次序不敏感l 高维性l 基于约束的聚类l 可解释性和可用性聚类方法的比较准则l 划分准则l 簇的分离性l 相似性度量l 聚类空间2015/5/24 数据挖掘 62015/5/24 数据挖掘 7主要聚类方法的分类2015/5/24 数据挖掘 8划分算法:基本概念2015/5/24 数据挖掘 9K-平均聚类算法平方误差准则函数2015/5/24 数据挖掘 10