主要内容:主要内容:Kmeans 实战聚类算法简介Kmeans 算法详解Kmeans 算法的缺陷及若干改进Kmeans 的单机实现与分布式实现策略 聚类算法简介聚类算法简介123聚类的目标:将一组向量分成若干组,组内数据是相似的,而组间数据是有较明显差异。与分类区别:分类与聚类最大的区别在于分类的目标事先已知,聚类也被称为无监督机器学习聚类手段:传统聚类算法 划分法 层次方法 基于密度方法 基于网络方法 基于模型方法什么是什么是KmeansKmeans算法?算法?Q1 :K 是什么?A1 :k 是聚类算法当中类的个数。Summary :Kmeans 是用均值算法把数据分成K 个类的算法! Q2 :means 是什么?A2 :means 是均值算法。KmeansKmeans算法详解(算法详解(11)步骤一:取得k 个初始初始中心点KmeansKmeans算法详解(算法详解(22)MinofthreeduetotheEuclidDistance步骤二:把每个点划分进相应的簇KmeansKmeans算法详解(算法详解(33)MinofthreeduetotheEuclidDistance步骤