聚类分析练习题练习题一假设数据挖掘的任务是将8个点聚类成3个簇,A1(2,10),A2(2,5),A3(8,4),B1(5,8),B2(7,5),B3(6,4),C1(1,2),C3(4,9),距离函数是欧几里得距离。假设初始选择A1,B1,C1分别作为每个聚类的中心,用k平均算法来给出:1.第一次循环执行后的三个聚类中心;2.最后的三个簇。答:1.第一轮A1(2,10)B1(5,8),A3(8,4),B2(7,5),B3(6,4),C2(4,9)C1(1,2),A2(2,5)对应中心分别是(2,10),(6,6),(1.5,3.5)2.最后结果:A1(2,10),B1(5,8),C2(4,9)A3(8,4),B2(7,5),B3(6,4)C1(1,2),A2(2,5)练习题二 给定6维分类样本C=(A,B,A,B,A,A),D=(B,B,A,B,B,A),试求:1.样本间相似性的简单匹配系数;Jaccard系数。答:A的编码为0、B的编码为110122002