C均值聚类实验报告一、C均值聚类的算法原理聚类分析是指事先不知样本的类别,而利用样本的先验知识来构造分类器(无监督学习)聚类准则函数在样本相似性度量的基础上,聚类分析还需要一定的准则函数,才能把真正属于同一类的样本聚合成一个类的子集,而把不同类的样本分离开来。如果聚类准则函数选得好,聚类质量就会高。同时,聚类准则函数还可以用来评价一种聚类结果的质量,如果聚类质量不满足要求,就要重复执行聚类过程,以优化结果。在重复优化中,可以改变相似性度量,也可以选用新的聚类准则。误差平方和准则(最常用的) 假定有混合样本集 ,采用某种相似性度量 被聚合成c个分离开的子集 ,每个子集是一个类, 它们分别包含 个 样本 。 为了衡量聚类的质量,采用误差平方和聚类准则函数 式中 为类中样本的均值: 是c个子集合的中心,可以用来代表c个类。误差平方和 聚类准则函数是样本与
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。