CS345DataMining-西安电子科技大学软件学院.ppt

上传人:ga****84 文档编号:327749 上传时间:2018-09-22 格式:PPT 页数:149 大小:2.66MB
下载 相关 举报
CS345DataMining-西安电子科技大学软件学院.ppt_第1页
第1页 / 共149页
CS345DataMining-西安电子科技大学软件学院.ppt_第2页
第2页 / 共149页
CS345DataMining-西安电子科技大学软件学院.ppt_第3页
第3页 / 共149页
CS345DataMining-西安电子科技大学软件学院.ppt_第4页
第4页 / 共149页
CS345DataMining-西安电子科技大学软件学院.ppt_第5页
第5页 / 共149页
点击查看更多>>
资源描述

1、1数据挖掘与商务智能Data Mining & Business Intelligence西安 子科技大 件 院电 学 软 学主 人: 健斌讲 黄第五章 聚类 2分 聚类与 类 管分 是一 象 或 的有效手段,但是尽 类 种识别对 组 类常常需要它 高昂的代价收集和标记大量 元 集训练 组或模式,以便分 法使用 每 建模类 它们对 个组 希望:首先,基于 据的数 相似性把 据集合 分成数 划 组然后, 些 量相 少的 指定给这 数 对较 组 标号 基于聚 的 程的另一 点:类 过 个优可以适应 化, 且能 挑 出 分不同 的有用特征变 并 够 选 区 组3聚类 什 是聚么 类?聚类(clust

2、ering)是 物理或抽象 象的集合分成将 对相似的 象 或对 类 簇(cluster)的 程过 相 念关概簇是 据 象集合,同一 簇中的 象之 具有很高的数 对 个 对 间相似度,而不同簇中的 象高度相对 异相异度根据描述 象的 性 估,通常使用距离度量对 属 值评4聚类什 是聚么 类?聚类(clustering)是 物理或抽象 象的集合分成相将 对似的 象 或对 类 簇(cluster)的 程过相 念关概簇是 据 象集合,同一 簇中的 象之 具有很高的数 对 个 对 间相似度,而不同簇中的 象高度相对 异相异度根据描述 象的 性 估,通常使用距离度量对 属 值评5聚类 用 域应 领市 究、

3、模式 、 据分析、 像 理场研 识别 数 图 处 其他 用应在某些 用中,聚 又应 类 称数据分割(data segmentation),因 根据 据的相似性把大为它 数型 据集合 分成数 划 组聚 可以用于类还 离群点检测(outlier detection),其中离群点(“ 离” 任何簇的 )可能远 值比普通情 更 得注意 况 值 6聚 技类 术基于 分的聚划 类基于 次的聚层 类基于 度的聚类基于 的聚 法图论 类基于 的聚 法网 类基于模型的聚 法类7基于 分的聚划 类 划分方法(partitioning methods)定 : 定义 给 象或 据元 的 据个对 数 组 数 库 , 分

4、 法划建 据的构 数 分(个划 k n),每 分 一簇个划 法: 定要 建的 分 给 构 划 数 , 分 法 建一 划 创 个分 然后 用 定 技 , 通 象在划 术 尝试 过对 组建 分动来 进划 比 常用的 法较k-means: 均值聚类算法 其中每 簇 用 簇中个 该 对象的 值来 k-medoids: 中心点聚类算法,其中每 簇用 簇个中 的一 象 个对 来CLARANS:大型数据库中的划分聚类算法8k-means 法 : 随 选择 象,每 象 一 的个对 个对 个类 平均值 每 象,根据其 中 的距离, 分对 个对 类 划 的 然后 每 的 不 类 计 个类 值 断 复程, 有的 currency1 不能分“ 这个过 样 为 定 给 类 , 其 定 :值 义为(在定 每 象是 型 性)义 设 个对 数值 属1 2 , ,. i i i imK t t t=11 mi ijjm tm=9k-means fi:fl望得 的簇的 输 数 , 象的 据个对 数 D 出:输 簇的集合个 法: ( )选择 象 的簇的 个对 为 质()repeat () 象 簇的 的距离, 象 分 距计 对 与 个 质 将对 划离其 的簇 ( ) 每 簇的 计 个 值()Until簇的 不 化质 变10k-means

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 1

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。