K-Means与EM算法聚类实验分析章舜仲2040601981概述K-Means是一种常用聚类算法,EM算法是进行极大似然估计的一种有效方法,本文对这两种方法的聚类应用进行了实验比较分析,实验环境为PIV2.8G/1G,Windowsxp+Delphi6.0。实验数据为n个数值组成的点集,分配到k个类别中,本文实验中EM聚类算法基于样本数据的混合高斯分布假设,假设概率模型为P(x|卩Q)=axp(x|卩Q),其中ijjijjj=11(x卩)2p(x|卩Q)=exp4ij),实验采用简化处理,a取为常数1/K忽略,取jijj2kc2c2jjjj值为1,EM与K-Means算法具体步骤略。2数据集生成实验在三个数据集上进行,每个数据集包括6000个随机数值,数值生成方法描述如下。2.1高斯分布随机数高斯分布随机数的产生使用Marsaglia-Bray算法,函数RandG输入参数为均值卩和标准差c,返回服从高斯分布的随机数。(1) 产生两个(0,1)上均匀分布的随机数U和U2(2) 令V1=2*U1-1,V2